[IT 동아] [위클리AI] 오픈AI·업스테이지, 전략적인 새 모델 출시로 주목 외

2026년 03월 25일

[IT동아 박귀임 기자] 인공지능(AI)이 세상을 바꾸고 있습니다. AI는 이제 우리 일상에서 떼려야 뗄 수 없는 핵심적인 요소입니다. 한 주간 세계를 들썩이게 만든 글로벌 빅테크 기업부터 우리 일상에 직접 영향을 미칠 새로운 AI 소식까지 핵심만 짚어드립니다.

오픈AI, GPT‑5.4 소형 모델 공개 ‘더 빠르고 효율적인 설계’

오픈AI가 소형 모델 GPT‑5.4 미니와 나노를 공개했습니다 / 출처=오픈AI

글로벌 AI 기업 오픈AI가 자사 AI 모델인 챗(Chat)GPT에 소형 GPT‑5.4 미니(mini)와 나노(nano)를 새롭게 공개했습니다.

오픈AI는 3월 17일(이하 현지 시간) 공식 블로그를 통해 이같이 알리며 “GPT‑5.4 미니와 나노는 지금까지 선보인 소형 모델 가운데 가장 높은 성능을 갖추고 있습니다. 플래그십 GPT‑5.4의 여러 강점을 유지하면서도 대규모 작업을 더욱 빠르고 효율적으로 처리할 수 있도록 설계됐습니다”라고 설명했습니다.

이번 출시의 핵심은 성능과 비용의 균형이라고 할 수 있습니다. GPT‑5.4 미니는 이전 세대인 GPT-5 미니 대비 코딩, 추론, 멀티모달 이해, 도구 사용 등 전반적인 영역에서 성능이 크게 향상됐습니다. 속도 역시 2배 이상 빠릅니다.

AI 모델의 성능 표준화 테스트인 벤치마크 결과도 주목할만 합니다. GPT‑5.4 미니는 코딩 성능을 측정하는 SWE-Bench Pro 항목에서 54.4%를 기록했습니다. 이전 버전인 GPT-5 미니의 45.7%보다 높고, 플래그십 GPT-5.4의 57.7%에 가까워진 수치입니다. 무엇보다 AI가 스크린샷을 해석해 실제 데스크톱을 조작하는 능력을 측정하는 OSWorld-Verified 항목에서는 GPT-5.4 미니가 72.1%를 기록하며, 이전 버전의 42.0%를 크게 앞질렀습니다. 플래그십(75.0%)과의 격차는 2.9%포인트에 불과합니다. 두 모델 모두 인간 기준선인 72.4%를 초과한 것도 눈길을 끕니다.

GPT-5.4 나노는 복잡한 추론보다 대량의 단순 반복 작업에 특화된 모델입니다. 오픈AI에 따르면 나노는 분류, 데이터 추출, 랭킹, 단순 코딩 서브에이전트 등 속도와 비용이 중요한 작업에 활용할 것을 권장합니다.

한계도 분명합니다. GPT-5.4 나노의 경우 OSWorld-Verified 항목에서 39.0%를 기록, GPT-5 미니(42.0%)에도 미치지 못한 수준으로 나타났습니다. 이는 추론 깊이가 필요 없는 작업에서는 비용 우위가 뚜렷하지만, 복잡한 화면 조작이나 고급 추론에는 적합하지 않다는 것으로 해석할 수 있습니다. 또 나노는 공개된 벤치마크 자체가 두 종류에 불과해 경쟁사 소형 모델과 객관적 비교가 어렵다는 부분도 한계로 지적됩니다.

오픈AI는 GPT‑5.4 미니와 나노의 출시를 단순한 저가 모델 추가가 아닌 에이전틱 AI 시대를 위한 플랫폼 전략의 일환으로 강조했습니다. 이에 따라 접근성도 대폭 확대됐습니다. 챗GPT 무료 및 고(Go) 플랜 사용자는 ‘+’ 메뉴의 ‘Thinking’ 기능을 통해 GPT-5.4 미니를 이용할 수 있습니다. 유료 사용자에게는 GPT-5.4 Thinking의 속도 제한 도달 시 대체 모델로 GPT-5.4 미니가 제공됩니다. GPT-5.4 나노의 경우 API 전용으로 대용량 워크로드를 처리하는 개발자를 주요 타깃으로 합니다.

이번 새 모델 공개로 오픈AI는 프리미엄 추론에 적합한 GPT-5.4, 고속 범용으로 설계된 GPT-5.4 미니, 저가로 대량 처리가 가능한 GPT-5.4 나노 등 3단계 AI 모델 생태계를 완성했습니다. AI 에이전트 시스템이 확산되는 흐름 속에서 ‘큰 모델이 생각하고 작은 모델이 실행한다’는 오픈AI의 전략이 본격적인 시장 검증에 들어갔다고 보는 시각도 지배적입니다.

뿐만 아니라 GPT-5.4 미니는 플래그십 대비 94%의 코딩 성능을 30% 비용으로 제공합니다. 이는 단순한 저가 모델 출시가 아니라, AI 시장이 성숙기에 접어들고 있다는 신호라고 평가할 수 있습니다. 초창기 AI 경쟁이 ‘누가 더 똑똑한 모델을 만드느냐’였다면, 이제는 ‘누가 더 실용적이고 저렴하게 배포할 수 있느냐’로 무게 중심이 옮겨가고 있는 것을 보여줍니다. 앞으로 주요 AI 기업들의 소형 모델 경쟁이 더욱 치열해질 가능성도 제기됩니다.

메타, AI 지원 비서 정식 출시···페이스북·인스타그램 지원 언어 모두 제공

메타가 메타 AI 지원 비서를 전 세계에 정식 출시했습니다 / 출처=메타

글로벌 IT 기업 메타(Meta)가 3월 19일 자사 소셜네트워크서비스(SNS) 페이스북과 인스타그램에 ‘메타 AI 지원 비서(Meta AI Support Assistant)’를 정식 출시했습니다. 이 서비스는 페이스북과 인스타그램이 지원하는 모든 언어로 제공하는 것이 특징입니다.

메타는 공식 블로그에 “페이스북과 인스타그램 계정 문제가 생겼을 때 사용자에게 필요한 건 제안이 아니라 해결”이라며 이번 메타 AI 지원 비서 서비스출시의 취지를 전했습니다.

메타 AI 지원 비서는 기존의 지원 채널인 FAQ 기반 헬프센터와 근본적으로 다른 설계를 갖췄습니다. 단순히 정보를 안내하는 데 그치지 않고, 사용자를 대신해 앱 내에서 직접 조치를 취할 수 있습니다.

메타 AI 지원 비서의 주요 기능은 ▲스캠 및 사칭 계정 신고 ▲콘텐츠 삭제 이유 설명 및 이의 제기 안내 ▲비밀번호 재설정 ▲개인정보 설정 및 관리 ▲프로필 업데이트 등 입니다. 메타는 해당 서비스의 응답 속도에 대해 “5초 이내를 목표로 설계했습니다”라고 밝혔습니다. 이는 기존 지원 채널과 비교하면 대기 시간을 획기적으로 줄인 수준입니다.

메타는 “미국과 캐나다를 시작으로 향후 더 많은 국가와 유형으로 적용 범위를 넓힐 계획”이라면서 “더욱 편리하고 안정적인 지원을 위해 AI 기반 도구에 지속적으로 투자하고 있습니다”라고 강조했습니다.

뿐만 아니라 메타는 메타 AI 지원 비서 출시와 동시에 고도화된 AI 기반 콘텐츠 집행 시스템도 가동하기 시작했습니다. 이 시스템은 테러, 아동 착취, 마약, 사기, 스캠 등 심각한 정책 위반 콘텐츠를 기존 방식보다 더 빠르고 정확하게 탐지 및 제거하도록 설계됐습니다. 메타에 따르면 이 시스템의 테스트 결과 기존 검토팀이 발견하지 못한 하루 5000건의 스캠 시도를 탐지 및 차단했습니다. 사칭 계정 관련 신고도 80% 이상 감소했으며, 유해 성인 콘텐츠 탐지율은 2배로 상승했습니다.

또 메타의 AI 시스템은 인터넷 사용자의 98%가 쓰는 언어를 지원합니다. 지역 슬랭, 은어, 이모지의 문화적 맥락까지 반영하는 것도 주목할 부분입니다. 그동안 비영어권이나 동남아·아프리카·중동 사용자들은 언어 지원이 부족해 스캠 피해를 입거나 부당한 콘텐츠 삭제를 당해도 효과적으로 이의를 제기하기 어려웠습니다. AI가 언어 장벽을 허물면서 디지털 플랫폼의 접근성 불평등 문제가 구조적으로 개선될 가능성도 커졌습니다.

이번 메타 AI 지원 비서의 출시는 사실상 전 세계 가장 많은 사용자를 대상으로 한 대규모 AI 서비스 배포라고 할 수 있습니다. 페이스북과 인스타그램의 월간 활성 이용자를 합산하면 40억 명 이상이기 때문입니다. 이에 따라 응답 품질에 대한 실사용자 검증과 AI 기반 콘텐츠 집행의 확대 과정에서 불거질 수 있는 인력 감축 및 과잉 차단 문제에 대한 사회적 논의가 본격화될 것으로 보입니다.

메타는 오픈AI처럼 새로운 서비스를 만들어 사용자를 유입시키는 방식과 전혀 다른 전략을 취하고 있습니다. 이미 확보된 사용자 기반 위에 AI를 얹어 기존 시스템이 처리하던 업무를 AI로 대체하는 방향입니다. 이는 빅테크가 AI를 경쟁 무기로 활용하는 방식이 성숙기에 접어들고 있음을 보여준다고도 할 수 있습니다.

업스테이지, 솔라 프로 3 공개로 에이전트 AI 시대 전략적 겨냥

국내 AI 스타트업 업스테이지(Upstage)가 에이전트 AI에 특화된 자체 개발 거대언어모델(LLM) 솔라 프로 3(Solar Pro 3)를 공개했습니다.

업스테이지는 3월 24일 보도자료를 통해 이같이 전하면서 “솔라 프로 3는 기존 솔라 프로 2 대비 3배 이상 커진 1020억 매개변수의 대형 모델임에도 비용과 처리 속도(TPS)는 동일하게 유지해 효율성을 높였습니다”라고 설명했습니다.

솔라 프로 3는 성능 면에서도 유의미한 도약을 이뤄냈습니다. 에이전트 종합 성능(Tau2-all), 코딩(Terminal Bench 2·SWE Bench), 지시 이행(IFBench) 등 주요 LLM 벤치마크에서 전작 대비 2배 이상 향상했습니다.

또 추론 능력 고도화에는 업스테이지 자체 강화학습 기술인 스냅PO(SnapPO)를 적용했습니다. 단순 답변 생성을 넘어 단계적 사고 방식으로 추론의 일관성과 맥락 판단력을 강화한 결과, 경시대회급 수학(HMMT’26·AIME’26)과 대학원 수준 과학(GPQA-Diamond) 등 고난도 평가에서도 높은 성능 향상을 기록했습니다.

솔라 프로 3는 글로벌 AI 모델 서비스 플랫폼 오픈라우터(OpenRouter)와 업스테이지 자체 API를 통해 즉시 이용할 수 있습니다. 김성훈 업스테이지 대표는 “솔라 프로 3는 단순한 모델 성능을 넘어 실제 업무 환경에서 효과를 낼 수 있는 에이전트 AI 실용성의 도약을 목표로 개발됐습니다”라며 “앞으로도 업계 최고 수준의 기술력을 바탕으로 실제 산업 현장에서 쓰이는 AI 생태계를 확장해 나가겠습니다”라고 말했습니다.

이번 보도자료에서 가장 눈에 띄는 점은 기술 스펙보다 포지셔닝입니다. 업스테이지는 솔라 프로 3를 ‘더 똑똑한 LLM’이 아니라 에이전트 AI 실용성의 도약으로 규정했습니다. 이는 단순한 마케팅 언어가 아닙니다. 벤치마크 선택 자체가 이 방향성을 뒷받침합니다. Tau2-all, Terminal Bench·SWE Bench, IFBench는 모두 AI가 멀티스텝 작업을 스스로 수행하는 능력을 측정하는 지표입니다. 단순 지식 측정 벤치마크(MMLU 등)를 내세웠던 기존 모델과 결이 다릅니다.

업스테이지가 스냅PO를 강조한 것도 눈길을 끕니다. 단순히 오픈소스 모델을 파인튜닝한 것이 아니라, 자체 강화학습 방법론을 보유하고 있다는 점을 부각시키려는 의도로 보입니다. 기술 독립성과 자체 방법론을 강조하는 것은 단순히 기술이 우수하다는 것을 넘어 AI 모델을 기초부터 만드는 ‘프롬스크래치’에 대한 역량과 설계 기술을 온전히 갖췄음을 보여주기 위한 것으로 해석됩니다.

결과적으로 업스테이지가 공개한 솔라 프로 3는 단순한 모델 업그레이드가 아니라 에이전트 AI 시대를 겨냥한 전략적 선언이라는 평가가 대부분입니다. 전작 대비 3배 이상 커진 1020억 매개변수 규모임에도 비용과 처리 속도를 동일하게 유지했고, 에이전트 종합 성능·코딩·복합 지시 이행 등 실무 중심 벤치마크에서 2배 이상의 성능 향상을 달성했기 때문입니다. 또 빅테크와의 규모 경쟁 대신 ‘현장에서 바로 쓰이는 AI’라는 실용성 전략을 에이전트 시대에 맞게 진화시키고 있는 부분도 인상적입니다.

IT동아 박귀임 기자(luckyim@itdonga.com)

<구체적인 내용이나 첨부파일은 아래 [IT 동아] 사이트의 글에서 확인하시기 바랍니다.>

헤세드온 hesedon

[IT 동아] [위클리AI] 오픈AI·업스테이지, 전략적인 새 모델 출시로 주목 외

오픈AI, GPT‑5.4 소형 모델 공개 ‘더 빠르고 효율적인 설계’

메타, AI 지원 비서 정식 출시···페이스북·인스타그램 지원 언어 모두 제공

업스테이지, 솔라 프로 3 공개로 에이전트 AI 시대 전략적 겨냥

About The Author

hesedon

오픈AI, GPT‑5.4 소형 모델 공개 ‘더 빠르고 효율적인 설계’

메타, AI 지원 비서 정식 출시···페이스북·인스타그램 지원 언어 모두 제공

업스테이지, 솔라 프로 3 공개로 에이전트 AI 시대 전략적 겨냥

Related Posts

About The Author

hesedon