[IT 동아] [위클리AI] 구글, 제미나이 옴니 플래시 공개 “말 한마디로 영상 편집” 외

[IT동아 박귀임 기자] 인공지능(AI)이 세상을 바꾸고 있습니다. AI는 이제 우리 일상에서 떼려야 뗄 수 없는 핵심적인 요소입니다. 한 주간 세계를 들썩이게 만든 글로벌 빅테크 기업부터 우리 일상에 직접 영향을 미칠 새로운 AI 소식까지 핵심만 짚어드립니다.

구글, 제미나이 옴니 플래시 출시···나노 바나나 넘어선다

구글이 제미나이 옴니 플래시를 출시했습니다 / 출처=구글
구글이 제미나이 옴니 플래시를 출시했습니다 / 출처=구글

글로벌 빅테크 기업 구글(Google)이 5월 19일(이하 현지시간) 연례 개발자 컨퍼런스 ‘구글 I/O 2026’을 통해 새로운 멀티모달 AI 모델 ‘제미나이 옴니 플래시(Gemini Omni Flash)’를 공개하고 즉시 배포했습니다. 제미나이 옴니 플래시는 이날부터 전 세계 구글 AI 플러스(Plus), 프로(Pro), 울트라(Ultra) 구독자를 대상으로 사용 가능합니다.
제미나이 옴니는 텍스트, 이미지, 오디오, 영상 등 어떤 형태의 입력으로도 고품질 영상을 생성하고 편집할 수 있는 모델입니다. 구글은 이 모델을 제미나이의 추론 능력과 창작 능력을 결합한 결과물로 소개했습니다. 지난해 이미지 생성·편집 기능으로 출시한 ‘나노 바나나(Nano Banana)’의 뒤를 잇는 후속작이기도 합니다.
가장 눈에 띄는 기능은 자연어 기반 영상 편집입니다. 사용자가 “조각상을 거품으로 만들어줘”처럼 일상적인 문장으로 명령을 내리면 영상 속 장면이 그에 맞게 변환됩니다. 편집은 누적 방식으로 이뤄집니다. 이에 이전 명령의 맥락이 유지되며, 캐릭터 일관성과 물리 법칙도 그대로 보존되는 것이 특징입니다. 거울이 액체처럼 물결치거나, 아파트 불빛이 음악 박자에 맞춰 켜지는 식의 복잡한 연출도 프롬프트 한 줄로 구현할 수 있다고 구글은 설명했습니다.
물리 표현력도 강화됐습니다. 중력, 운동 에너지, 유체역학 등을 직관적으로 이해해 보다 실감 나는 장면을 만들 수 있습니다. 단백질 접힘 같은 복잡한 과학 개념도 짧은 프롬프트만으로 클레이 애니메이션 등 다양한 형식의 영상으로 설명해줍니다. 구글은 이를 두고 “단순한 패턴 매칭을 넘어 언어, 이미지, 의미를 연결하는 능력”이라고 밝혔습니다.
입력 유연성 역시 눈길을 끕니다. 이미지, 텍스트, 영상, 오디오를 자유롭게 조합해 단일 영상으로 출력할 수 있으며, 스케치나 캐릭터 이미지를 참조 자료로 넣으면 해당 스타일에 맞는 영상이 만들어집니다. 오디오 입력은 현재 음성 참조만 지원하며 다른 유형은 순차 추가할 예정입니다.
콘텐츠 투명성을 위해 옴니로 생성된 모든 영상에는 눈에 보이지 않는 ‘신스아이디(SynthID)’ 디지털 워터마크가 자동으로 삽입됩니다. 제미나이 앱, 크롬 내 제미나이, 구글 검색에서 AI 생성 여부를 손쉽게 확인할 수 있습니다.
이번 제미나이 옴니 플래시는 구글이 영상을 차세대 핵심 전장으로 공식 선언했음을 의미합니다. 지금까지 생성 AI 창작 경쟁은 사실상 이미지 생성 모델을 중심으로 전개돼 왔습니다. 글로벌 AI 기업 오픈AI의 소라(Sora)와 숏폼 영상 플랫폼 틱톡 모회사 바이트댄스의 시던스(Seedance)에 이어 구글까지 영상 AI 경쟁이 본격적인 다자 구도로 접어들었다고 업계는 보고 있습니다.
제미나이 옴니 플래시가 단순 영상 생성보다 대화형 편집을 전면에 내세운 것에 업계도 주목하고 있습니다. 백지 상태에서 영상을 만드는 것보다, 이미 가진 소재를 다듬는 수요가 훨씬 크기 때문입니다. 유튜버, 숏폼 크리에이터, 마케터 등 실사용자 층을 직접 겨냥한 포지셔닝이라는 분석도 있습니다. 또 광고 제작, 교육 콘텐츠, 게임 시네마틱 등 다양한 산업에서 제작 비용과 인력을 대폭 줄일 수 있는 실질적 신호탄으로 풀이됩니다.
구글에 따르면 제미나이 옴니 플래시는 유튜브 쇼츠와 유튜브 크리에이트 앱에서도 무료로 이용할 수 있습니다. 구글이 옴니 플래시를 유튜브 쇼츠에 무료로 푼 것은 단순한 배포 결정이 아닙니다. 크리에이터를 유튜브 생태계에 묶어두기 위한 플랫폼 전략이라는 업계 해석이 있습니다. 틱톡·인스타그램 릴스와의 숏폼 플랫폼 경쟁에서 AI 창작 도구를 핵심 차별화 무기로 내세우겠다는 의도로 읽힙니다.

구글, 스마트 안경 선보여 ‘韓 삼성·젠틀몬스터 협업’

구글이 제미나이 AI를 탑재한 스마트 안경을 올 가을 출시한다고 공식 발표했습니다 / 출처=구글
구글이 제미나이 AI를 탑재한 스마트 안경을 올 가을 출시한다고 공식 발표했습니다 / 출처=구글
구글이 스마트 안경(Android XR Intelligent Eyewear)을 선보였습니다. 삼성, 퀄컴과 공동 구축한 안드로이드 XR(Android XR) 플랫폼을 기반으로 하는 데다가 아이웨어 브랜드 젠틀몬스터(Gentle Monster), 워비파커(Warby Parker)와 협업한 첫 번째 디자인으로 주목받았습니다. 특히 한국 기업인 삼성과 젠틀몬스터가 구글과 손잡았다는 점에서 국내 업계의 관심도 높을 것으로 보입니다.
구글은 5월 19일 구글 I/O 2026에서 제미나이 AI를 탑재한 스마트 안경을 올 가을 출시한다고 공식 발표했습니다. 디자인은 물론 기능 면에서도 제미나이의 멀티스텝 에이전트 기능을 스마트 안경에 직접 통합했습니다. 단순한 핸즈프리 도우미를 넘어선 AI 에이전트 기기로 포지셔닝한 셈입니다.
이번 발표에 따르면 스마트 안경은 두 가지 유형으로 출시될 예정입니다. 음성으로 도움을 제공하는 오디오 안경과 필요한 정보를 눈앞에 바로 표시하는 디스플레이 안경입니다. 두 제품 모두 손을 자유롭게 유지하며 음성만으로 제미나이의 도움을 받을 수 있다는 것이 특징입니다.
스마트 안경이 종일 착용 가능한 제품이 되려면 스타일과 착용감이 핵심입니다. 이에 구글은 삼성, 젠틀몬스터, 워비파커와 협력해 하루 종일 착용하고 싶을 만한 디자인을 개발했다고 밝혔습니다.
특히 젠틀몬스터와 워비파커는 각자의 브랜드 아이덴티티를 반영한 첫 번째 컬렉션 디자인을 공개했습니다. 구글은 기존 스마트 기기가 실패한 이유 중 하나로 착용감과 디자인의 한계를 지목하며, 이번 협업이 그 간극을 메우기 위한 전략적 선택임을 보여줬습니다.
사용 방법도 어렵지 않습니다. 스마트 안경의 프레임 측면을 탭하거나 ‘헤이 구글(Hey Google)’이라고 말하면 제미나이에 즉시 연결됩니다. 우선 눈 앞에 보이는 무엇이든 제미나이에게 물어볼 수 있습니다. 지나치는 식당 리뷰, 하늘의 구름 이름, 헷갈리는 주차 안내판 등이 대표적입니다. 이외에 핸즈프리 길 안내, 핸즈프리 커뮤니케이션, 실시간 번역, 멀티스텝 작업 처리 등도 가능합니다.
구글에 따르면 오디오 안경은 올 가을 판매가 시작됩니다. 다만 구체적인 가격과 출시 국가는 추후 공개될 예정입니다. 디스플레이 안경의 경우 출시 일정이 아직 공개되지 않았습니다.
이번 구글의 스마트 안경 발표는 글로벌 빅테크 기업 메타(Meta)의 레이밴 스마트 안경과의 정면 대결을 예고해 관심을 모으고 있습니다. 레이밴 메타는 패션 브랜드 협업과 AI 기능을 앞세워 스마트 안경 시장에서 주목받아 왔습니다. 구글이 젠틀몬스터, 워비파커 등 패션 브랜드를 스마트 안경 전면에 내세운 것도 메타에 대한 대응으로 평가하는 목소리가 큽니다.
스마트 안경 시장은 이제 메타와 구글의 양강 구도로 재편될 가능성이 제기되고 있습니다. 이는 성공 여부와 무관하게, 포스트 스마트폰 경쟁이 본격적인 궤도에 올랐음을 보여주는 사례이기도 합니다.
구글의 핵심 자산은 검색과 지도입니다. 스마트폰 화면 안에 갇혀 있던 이 두 가지가 스마트 안경을 통해 현실 세계로 나오게 된 만큼 그 파급력은 클 것으로 보입니다. 식당 앞에 서면 자동으로 리뷰가 들리고, 간판을 보면 번역이 나오고, 걷다 보면 길 안내가 귓속으로 들어오는 식이기 때문입니다. 이는 구글 광고 비즈니스의 새로운 확장 가능성이기도 합니다. 업계 일각에서는 위치 기반, 시선 기반, 상황 기반 광고라는 완전히 새로운 수익 모델이 열릴 수 있다는 시각도 나옵니다.
구글이 스마트 안경을 선보인 것은 이번이 처음이 아닙니다. 2013년 출시된 구글 글래스는 디자인, 가격, 사회적 거부감 등 복합적인 이유로 시장에 안착하지 못했습니다. 특히 항상 촬영 가능한 기기에 대한 주변인들의 불편함은 당시 논란을 일으키기도 했습니다. 이번 스마트 안경 역시 고화질 촬영 기능을 탑재했습니다. 착용자 본인에게는 편리하지만, 주변 사람들은 자신이 촬영되고 있는지 알 수 없습니다. 착용자가 보는 모든 것을 AI가 실시간으로 분석한다는 점 역시 주변인 입장에서는 같은 우려를 낳습니다. 기술적 완성도와 별개로, 공공장소에서의 사용 규범과 법적 기준을 어떻게 만들 것인지에 대한 사회적 논의가 제품 출시와 맞물려 불가피하게 제기될 것으로 보입니다.

앤트로픽, 글래스윙 프로젝트 성과 공개 “취약점 1만 개 발견”

앤트로픽이 프로젝트 글래스윙의 초기 성과를 공개했습니다 / 출처=앤트로픽
앤트로픽이 프로젝트 글래스윙의 초기 성과를 공개했습니다 / 출처=앤트로픽
글로벌 AI 기업 앤트로픽(Anthropic)이 5월 22일 AI 기반 사이버 보안 이니셔티브 ‘프로젝트 글래스윙(Project Glasswing)’의 초기 성과를 공개했습니다. 핵심은 한 달 만에 세계에서 가장 중요한 소프트웨어에서 고위험·치명적 취약점 1만 개 이상을 발견했다는 것입니다. AI가 취약점을 찾는 속도가 인간이 패치를 만드는 속도를 압도하기 시작했다는 점에서, 사이버 보안 생태계 전반에 구조적 변화가 시작됐다는 평가가 나옵니다.
프로젝트 글래스윙은 점점 고도화되는 AI 모델이 악용되기 전에 세계에서 가장 중요한 소프트웨어를 선제적으로 보호하기 위한 협력 프로젝트입니다. 지난달 출범한 이 프로젝트는 앤트로픽의 미공개 최신 모델 ‘클로드 미토스 프리뷰(Claude Mythos Preview)’를 활용하며, 약 50개 파트너사와 함께 운영되고 있습니다.
파트너 기업들의 성과는 구체적입니다. 대부분의 파트너사가 자사 소프트웨어에서 수백 개의 고위험·치명적 취약점을 찾아냈으며, 일부는 버그 발견 속도가 10배 이상 빨라졌다고 밝혔습니다. 클라우드플레어(Cloudflare)는 핵심 시스템 전반에서 2000개의 버그를 발견했고, 이 중 400개가 고위험·치명적 수준이었습니다. 오탐(false positive) 비율은 인간 테스터보다 낮은 수준을 기록했습니다.
외부 기관 평가도 이어졌습니다. 영국 AI 안전 연구소(AISI)는 클로드 미토스 프리뷰가 자신들의 사이버 레인지(다단계 사이버 공격 시뮬레이션) 두 가지 모두 처음부터 끝까지 자율적으로 해결한 첫 번째 모델이라고 밝혔습니다. 모질라는 클로드 미토스 프리뷰를 테스트하면서 파이어폭스 150에서 271개의 취약점을 발견 및 수정했는데, 이는 직전 버전인 파이어폭스 148에서 클로드 오퍼스 4.6으로 발견한 것보다 10배 이상 많은 수치입니다.
금융 분야에서의 활용 사례도 주목할 만합니다. 글래스윙 파트너 은행 중 한 곳에서는 클로드 미토스 프리뷰가 고객의 이메일 계정을 탈취하고 위장 전화로 해킹을 시도한 150만 달러 규모의 부정 송금을 탐지·차단하는 데 기여했습니다.
앤트로픽은 이번 성과를 강조하면서도 새로운 위기도 함께 경고했습니다. 취약점을 찾는 것은 훨씬 쉬워졌지만, 수정하는 속도는 그를 따라가지 못하고 있다는 것입니다. 클로드 미토스 프리뷰가 발견한 고위험 취약점 하나를 패치하는 데 평균 2주가 소요됩니다. 일부 오픈소스 소프트웨어 유지 관리자는 이미 역량이 한계에 달했으며, 앤트로픽에 취약점 보고 속도를 늦춰달라고 요청하기도 했습니다.
앤트로픽은 클로드 미토스 프리뷰를 아직 일반에 공개하지 않고 있습니다. 이에 대해 앤트로픽은 “클로드 미토스 프리뷰 수준의 모델이 악용을 막을 만큼 충분히 강력한 안전장치 없이 배포될 경우 전 세계 누구나 취약한 소프트웨어를 손쉽게 공격할 수 있게 됩니다”라고 설명했습니다.
글래스윙의 다음 단계로는 미국 및 동맹국 정부를 포함한 핵심 파트너로 프로젝트를 확대할 계획입니다. 충분히 강력한 안전장치가 갖춰지는 시점에 미토스급 모델의 일반 공개를 추진할 방침입니다.
지금까지 보안은 ‘공격자가 취약점 하나를 찾으면 방어자가 막는’ 구조였습니다. 글래스윙은 이 균형을 근본적으로 뒤흔듭니다. AI가 취약점을 찾는 비용과 시간이 사실상 0에 수렴하는 반면, 패치를 설계하고 배포하는 인간의 역량은 그대로이기 때문입니다. 파이어폭스에서 한 번에 271개 취약점을 발견했다는 사실은 앞으로 모든 소프트웨어가 이 속도를 따라가야 한다는 뜻이기도 합니다. 앤트로픽에 따르면 찾는 속도와 고치는 속도의 간극이 곧 공격자의 기회가 될 수 있습니다.
앤트로픽이 글래스윙으로 선택한 전략은 주목할 만합니다. 강력한 AI를 스스로 일반 공개하지 않으면서, 그 능력을 방어 목적으로 먼저 배치해 기술 우위를 확보하는 방식입니다. 이는 향후 다른 AI 기업들이 고위험 모델을 다루는 방식의 템플릿이 될 가능성이 높아 보입니다.
결국 글래스윙이 보여주는 가장 핵심적인 메시지는 하나입니다. AI로 인한 사이버 보안 위협은 준비 기간이 끝나고 대응 기간이 시작됐다는 것입니다. 소프트웨어 업계 전반이 패치 주기, 오픈소스 유지 인프라, 보안 인력 구조를 AI 속도에 맞게 재설계하지 않으면 이 기술이 방어보다 공격에 먼저 활용되는 상황을 막기 어려울 것으로 보입니다.
IT동아 박귀임 기자(luckyim@itdonga.com)

<구체적인 내용이나 첨부파일은 아래 [IT 동아] 사이트의 글에서 확인하시기 바랍니다.>