[IT 동아] [위클리AI] ‘전략 달라도 목표는 하나’ 앤트로픽·구글·오픈AI, 에이전트 AI 경쟁 심화
2026년 06월 02일
[IT동아 박귀임 기자] 인공지능(AI)이 세상을 바꾸고 있습니다. AI는 이제 우리 일상에서 떼려야 뗄 수 없는 핵심적인 요소입니다. 한 주간 세계를 들썩이게 만든 글로벌 빅테크 기업부터 우리 일상에 직접 영향을 미칠 새로운 AI 소식까지 핵심만 짚어드립니다.
앤트로픽, 클로드 오퍼스 4.8 공개 ‘성능 보다 정직성 강조’
![[IT 동아] [위클리AI] '전략 달라도 목표는 하나' 앤트로픽·구글·오픈AI, 에이전트 AI 경쟁 심화 1 앤트로픽이 클로드 오퍼스 4.8을 공개했습니다 / 출처=앤트로픽](https://it.donga.com/media/__sized__/images/2026/6/2/8b2b84492f9a4d9c-thumbnail-1920x1080-70.jpg)
글로벌 AI 기업 앤트로픽(Anthropic)이 새 플래그십 모델인 ‘클로드 오퍼스 4.8(Claude Opus 4.8)’을 공개했습니다. 전작인 클로드 오퍼스 4.7 출시 6주 만입니다. 클로드 오퍼스 4.8은 벤치마크 성능 향상 외에도 AI의 고질적 문제로 꼽히는 과신을 줄이는 정직성 개선을 전면에 내세운 점이 핵심입니다.
앤트로픽은 5월 28일(이하 현지 시간) 공식 사이트를 통해 “코딩, 에이전트 작업 및 전문 업무 전반에 걸쳐 더욱 강력해진 클로드 오퍼스 4.8은 장기 작업을 지속적으로 처리할 수 있는 일관성과 자율성을 갖추고 있습니다”고 밝혔습니다.
성능 지표에서도 개선이 확인됐습니다. 코딩 성능을 측정하는 SWE-bench Pro에서 전작 대비 4.9%포인트 오른 69.2%를 기록했습니다. 실무형 종합 평가 지표인 GDPval-AA에서는 1890 Elo로 현재 리더보드 1위를 기록했습니다. GDPval-AA는 AI 전문 리서치 기관 아티피셜 애널리시스(Artificial Analysis)가 44개 직종·9개 산업의 실제 업무 과제를 토대로 모델 간 성능을 비교해 평가하는 벤치마크입니다.
이번 클로드 오퍼스 4.8 출시에서 앤트로픽이 가장 강조한 키워드는 성능이 아닌 ‘정직성’입니다. 내부 평가에 따르면 클로드 오퍼스 4.8은 자신이 작성한 코드에 결함이 있어도 이를 그냥 넘길 가능성이 전작보다 4배 낮습니다. AI 모델이 불확실한 상황에서 자신 있게 틀린 답을 내놓는 과신 문제는 업계 공통의 숙제였습니다. 앤트로픽은 이를 수치로 입증하며 신뢰성을 브랜드 정체성으로 굳히려는 전략으로 풀이됩니다.
앤트로픽의 AI 안전 연구팀(Alignment team)은 내부 평가를 통해 “클로드 오퍼스 4.8이 사용자 자율성 지원 및 사용자 최선의 이익 행동 등 친사회적 특성 지표에서 새로운 최고치를 달성했습니다”라고 평가했습니다. 또 “기만·악용 협조 등 안전 기준 위반 행동 비율도 전작보다 크게 낮아졌습니다”라고 덧붙였습니다.
클로드 오퍼스 4.8의 신규 기능들은 하나같이 에이전트 시나리오를 겨냥하고 있습니다. 다이나믹 워크플로가 대표적입니다. 다이나믹 워크플로우는 클로드 코드(Claude Code)에서 수백 개의 병렬 서브에이전트를 단일 세션에서 실행할 수 있으며, 수십만 줄 코드베이스 마이그레이션도 자동 완주 가능합니다.
가격은 클로드 오퍼스 4.7과 동일하게 유지됐습니다. 표준 모드의 100만 토큰 기준으로 입력 5달러, 출력 25달러입니다. 2.5배 빠른 속도를 제공하는 패스트 모드는 입력 10달러, 출력 50달러로, 이전 모델 동일 모드 대비 3배 저렴해졌습니다. ‘동일 가격에 더 나은 성능’이라는 포지셔닝으로, 기존 사용자 이탈 방지와 신규 고객 유치를 동시에 노리는 전략이라고 업계는 평가하고 있습니다.
클로드 오퍼스 4.8 공개에서 앤트로픽의 전략 변화도 일부 드러났습니다. 대규모 세대 교체를 기다리는 대신 빠른 점진적 개선을 반복하는 방식으로, 경쟁사의 공격적인 출시 속도에 맞불을 놓는 모양새입니다.
이번 발표에서 앤트로픽은 벤치마크 수치보다 ‘더 정직한 협업 파트너’를 앞세웠습니다. 업계에서는 성능 경쟁이 치열해질수록 수치만으로는 차별화가 어렵고, 기업 고객 입장에서 AI가 모르는 것을 솔직히 인정하는 능력은 실무에서 직접적인 비즈니스 가치를 지닐 것으로 보입니다.
앤트로픽은 오퍼스를 넘어서는 새로운 모델 클래스도 예고했습니다. 현재 소수의 기관이 AI 기반 사이버 보안 이니셔티브 ‘프로젝트 글래스윙(Project Glasswing)’을 통해 ‘클로드 미토스 프리뷰(Claude Mythos Preview)’를 사이버보안 업무에 활용 중인데, 안전 장치 마련 후 수 주 내 일반 공개도 진행될 예정입니다. 클로드 오퍼스 4.8 출시 발표에 차세대 모델을 직접 언급한 것은 경쟁 모델에 쏠린 시장의 관심을 동시에 흡수하려는 포석으로 읽힙니다.
구글, 제미나이 스파크 출시···기기 꺼도 24시간 실행
![[IT 동아] [위클리AI] '전략 달라도 목표는 하나' 앤트로픽·구글·오픈AI, 에이전트 AI 경쟁 심화 2 구글이 제미나이 스파크를 출시했습니다 / 출처=구글](https://it.donga.com/media/__sized__/images/2026/6/2/8ac6c0069abf4701-thumbnail-1920x1080-70.jpg)
글로벌 빅테크 기업 구글(Google)이 5월 29일부터 미국 내 구글 AI 울트라(Google AI Ultra) 구독자를 대상으로 ‘제미나이 스파크(Gemini Spark)’ 베타 서비스를 시작했습니다. 단순히 묻는 말에 답하던 AI에서 벗어나, 사용자가 지시한 작업을 24시간 스스로 처리하는 에이전트형 AI의 본격 시대가 열린 셈입니다.
제미나이 스파크는 제미나이 3.5(Gemini 3.5) 모델과 에이전트 실행 프레임워크 안티그래비티(Antigravity)를 기반으로 작동합니다. 가장 큰 특징은 클라우드 기반 상시 실행입니다. 노트북을 닫거나 스마트폰 화면을 꺼도 구글 클라우드 전용 가상 머신에서 계속 돌아갑니다. 이메일을 받으면 자동으로 처리하고, 회의 노트를 종합해 문서로 만들고, 마감일을 추출해 파트너에게 알림을 보내는 식입니다. 사용자가 자리를 비운 사이에도 업무가 진행된다는 뜻이기도 합니다.
구글은 이를 두고 “질문에 답하는 어시스턴트에서 실제 업무를 대신 처리하는 능동적인 파트너로의 전환”이라고 설명했습니다. AI 업계에서 에이전트 경쟁이 본격화한 가운데, 구글이 자신만의 방식으로 판을 정의하려는 시도로 읽힙니다.
특히 제미나이 스파크는 ▲반복 작업 자동화 ▲맞춤 정보 수집·전달 ▲복합 워크플로우 처리 등이 가능합니다. 예를 들어 반복 작업 자동화 기능을 활용하면 매월 신용카드 명세서를 자동 분석해 새로 추가되거나 숨겨진 구독료를 감지하고 알림을 받을 수 있습니다. 맞춤 정보 수집·전달 기능을 활용하면 자녀 학교에서 오는 공지를 받은 편지함에서 자동으로 추출하거나 중요 마감일을 정리해 가족에게 일일 요약본을 발송하는 것이 가능합니다. 또 복합 워크플로우 처리 기능 사용 시 이메일·채팅에 흩어진 회의 메모를 종합해 구글 문서를 작성하고, 프로젝트 킥오프 이메일 초안까지 자동 생성할 수 있습니다.
에이전트 AI 경쟁에서 구글이 가진 가장 강력한 카드는 모델 성능이 아닙니다. 경쟁사는 외부 서비스와 하나씩 연동을 협상해야 하는 반면, 구글은 수십억 명이 이미 매일 쓰는 지메일·캘린더·문서·드라이브를 그대로 활용할 수 있습니다. 제미나이 스파크가 이 데이터를 처음부터 읽고 처리할 수 있다는 점은 경쟁사가 단기간에 따라잡기 어려운 구조적 우위입니다.
구글은 올 여름까지 제미나이 스파크의 기능을 대폭 확장할 계획을 공개했습니다. 문자·이메일로 스파크에 직접 지시가 가능한 것을 포함해 맞춤형 서브에이전트 생성 기능, 크롬 브라우저 직접 조작 기능, 예산·가맹점 지정 조건의 결제 대행 등이 대표적입니다.
상시 작동 에이전트가 이메일·일정·문서를 24시간 읽고 분석한다는 것은 전례 없는 수준의 개인 데이터 접근이라고 할 수 있습니다. 구글 스스로도 이번 발표에서 개인정보 활용에 따른 프라이버시 침해 우려를 인정했으며, 비용을 지출하거나 이메일을 발송하는 등 중요한 행동은 반드시 사전 확인을 받도록 설계했다고 강조했습니다. 그러나 유럽연합(EU) 개인정보보호법(GDPR) 체계에서 이 모델이 허용될 수 있는지 여부는 글로벌 확산의 최대 변수로 남아 있습니다.
제미나이 스파크는 구글이 에이전트 AI 경쟁에서 자신만의 전장을 선택했음을 보여줍니다. 모델 성능이 아닌 데이터 통합력으로 승부하겠다는 전략인 셈입니다. 국내에서도 자체 생태계를 보유한 플랫폼들이 구글과 유사한 방향으로 에이전트 전략을 재편할 가능성이 높아 보입니다. 업계에서는 AI 에이전트 서비스의 핵심 경쟁력이 모델에서 데이터·플랫폼 통합으로 이동하고 있다는 신호로 분석하고 있습니다.
오픈AI, 기존 전략 깨고 AWS와 손잡았다
![[IT 동아] [위클리AI] '전략 달라도 목표는 하나' 앤트로픽·구글·오픈AI, 에이전트 AI 경쟁 심화 3 오픈AI가 AWS와 협업합니다 / 출처=오픈AI](https://it.donga.com/media/__sized__/images/2026/6/2/1eeae4b855244280-thumbnail-1920x1080-70.jpg)
글로벌 AI 전문 기업 오픈AI(OpenAI)가 글로벌 빅테크 기업 마이크로소프트(Microsoft) 애저 중심의 클라우드 전략을 깨고 아마존웹서비스(AWS)와 손을 잡았습니다. 이는 단순한 채널 확대가 아니라고 보는 시각이 지배적입니다. 기업 AI 도입의 최대 걸림돌이 모델 성능이 아닌 보안·조달·거버넌스 절차에 있다는 것을 오픈AI 스스로 직시한 행보로 풀이됩니다.
6월 1일 오픈AI 공식 사이트에 따르면 자사의 프론티어 모델과 코덱스(Codex)가 AWS에서 정식 출시됐습니다. 이에 따라 수백만 명의 AWS 고객이 이미 비즈니스 운영에 사용하고 있는 플랫폼을 통해 오픈AI 기술을 활용할 수 있는 새로운 길이 열렸습니다.
이번 협업으로 AWS 고객은 기존 인프라를 그대로 유지하면서 오픈AI 모델을 프로덕션 환경에 올릴 수 있게 됐습니다. 아마존 베드록(Amazon Bedrock)을 통해 오픈AI 프론티어 모델과 코덱스 온 베드록(Codex on Bedrock) 등 두 가지 형태로 제공됩니다.
두 서비스 모두 일반 리전과 GovCloud(정부·공공기관 전용 클라우드) 리전에서 즉시 이용 가능합니다. GovCloud 지원은 연방 정부·국방·의료·금융 등 규제 산업을 직접 겨냥한 것으로, 이 시장은 진입 장벽이 높은 만큼 계약 규모가 크고 이탈률이 낮다는 특성이 있습니다.
미국의 글로벌 바이오 제약 기업 암젠(Amgen)은 오픈AI 모델을 AWS에서 활용하고 있습니다. 션 브루이치(Sean Bruich) 암젠 최고기술책임자(CTO)는 “오픈AI의 GPT-5.5와 프론티어 모델은 역량·품질·일관성 면에서 주목할 만한 발전을 보여줍니다. AWS에서 이용 가능해진 것은 기업 전반의 책임 있는 AI 프레임워크 안에서 이 역량을 탐색하고 확장할 수 있는 새로운 경로를 제공합니다”라고 말했습니다.
오픈AI는 그동안 마이크로소프트 애저를 핵심 클라우드 파트너로 유지해왔습니다. 이번 AWS 확장은 그 틀을 깬 것으로, 배경에는 기업 AI 도입 현실이 있습니다. 아무리 뛰어난 모델도 기업의 보안 검토·조달 절차·컴플라이언스 체계를 통과하지 못하면 실제 업무에 쓰이지 못합니다. AWS 환경에서 이미 이 모든 절차를 마친 기업들에게 오픈AI를 그대로 연결해주는 방식입니다.
이미 앤트로픽의 클로드는 아마존 베드록의 핵심 모델로 자리잡고 있습니다. 오픈AI가 같은 플랫폼에 입점함으로써 베드록 안에서 두 모델이 직접 경쟁하는 구도가 됐습니다. 앤트로픽 입장에서는 AWS라는 ‘안방’에 강력한 경쟁자가 들어온 셈입니다.
이번 발표는 여러 가지를 시사합니다. AI 모델 성능 경쟁이 이미 치열한 가운데 진짜 승부처는 기업 IT 체계에 얼마나 깊숙이 연결되느냐로 이동하는 것을 보여줍니다. 특히 오픈AI가 AWS라는 유통망을 선택한 것은 이 전장에서 우위를 점하려는 포석으로 바라보는 평가가 많습니다. 또 애저(마이크로소프트·오픈AI), 구글 클라우드(구글·앤트로픽), AWS(앤트로픽+오픈AI) 구도가 완성됐습니다. 특히 AWS는 경쟁 AI 기업들을 동시에 품으며 플랫폼 중립성을 내세우는 전략을 취하고 있다는 점도 눈에 띕니다.
향후 오픈AI는 자사의 사이버 보안 이니셔티브 데이브레이크(Daybreak)를 AWS를 통해 추가 제공할 계획입니다. 보안 코드 리뷰, 위협 모델링, 패치 검증, 종속성 위험 분석 등을 일상적인 개발 루프에 통합하는 이 서비스는 사이버 방어자가 위험을 더 일찍 파악하고 더 신속하게 대응할 수 있도록 설계됐습니다.
결과적으로 이번 협업의 핵심은 ‘오픈AI가 어디에 있느냐’가 아니라 ‘기업이 AI를 어떻게 쓰느냐’의 문제를 정면으로 건드렸다는 점입니다. 모델 경쟁에서 인프라 통합 경쟁으로의 전환은 AI 산업 성숙의 신호라고 할 수 있습니다. 이에 따라 국내 기업들도 AI 도입 전략을 모델 선택이 아닌 운영 체계 연동 관점에서 재검토할 필요가 제기됩니다.
IT동아 박귀임 기자(luckyim@itdonga.com)
<구체적인 내용이나 첨부파일은 아래 [IT 동아] 사이트의 글에서 확인하시기 바랍니다.>