![[전자신문] 오픈AI 'GPT-5.5', 英 AI 보안 평가서 앤트로픽 '미토스' 제쳤다 1 오픈AI 홈페이지 메인화면 'GPT-5.5' 이미지.](https://img.etnews.com/news/article/2026/04/24/news-p.v1.20260424.7b090ef2d30e4e8b838614c57d0fb623_P1.png)
17일(현지시간) AISI 공식 홈페이지에 게재된 평가 보고서에 따르면, GPT-5.5는 전문가 수준 사이버 보안 과제 평가에서 71.4%의 평균 통과율을 보였다. 직전 모델 GPT-5.4(52.4%)를 비롯해 ‘클로드 미토스 프리뷰'(68.6%), ‘클로드 오퍼스 4.7′(48.6%) 등 앤트로픽 모델 기록을 웃도는 수치다.
평가는 암호 분석, 웹 공격, 리버스 엔지니어링, 익스플로잇, 취약점 연구 등 AI의 사이버 보안 능력을 다각도로 검증하기 위해 마련된 총 95개 과제로 진행됐다. AISI는 GPT-5.5가 이번 사이버 과제 테스트에 참여한 모델 중 가장 강력한 성능을 지녔을 가능성이 있다고 진단했다.
GPT-5.5는 AISI가 고안한 기업 네트워크 침투 모의실험 ‘더 라스트 원스’ 전체 과정을 완수한 역대 두 번째 모델이 됐다. 해당 시뮬레이션을 처음 통과한 모델은 앤트로픽 클로드 미토스 프리뷰다. 더 라스트 원스는 단순 지식 보유 여부를 넘어 AI가 자율적 공격 에이전트로서 발휘할 수 있는 위협 수준을 측정하는 핵심 기준이다.
총 32단계로 진행되는 시뮬레이션은 AI 에이전트가 아무런 권한이 없는 공격 환경에 투입돼 정찰, 자격증명 탈취, 내부망 이동, 공급망 우회, 내부 데이터베이스(DB) 유출에 이르는 모든 공격 과정을 스스로 탐색하고 실행하도록 유도한다.
AISI는 사람이 해당 과제를 완수하려면 약 20시간이 소요될 것으로 추산한다. GPT-5.5는 총 10번의 시도 중 두 차례 전체 과정을 마쳤으며 클로드 미토스 프리뷰는 동일 조건에서 세 번 성공했다.
GPT-5.5는 산업제어시스템(ICS) 공격 모의실험 ‘쿨링 타워’ 과제는 해결하지 못했다. 앞서 클로드 미토스 프리뷰를 비롯해 현재까지 해당 과제를 완전히 끝낸 AI 모델은 전무하다.
AISI는 이번 평가 결과에 대해 통제된 실험실 환경에서 이루어진 만큼 실제 출시된 서비스에서 일반 사용자가 쓸 수 있는 기능을 고스란히 대변하는 것은 아니라고 설명했다. 실제 배포되는 모델에는 모니터링, 접근 통제, 추가 안전장치 등이 결합되기 때문이다. 실험 환경 역시 실제 기업 보안망처럼 탐지 도구, 방어자, 경보 대응 체계 등이 완벽히 구현되진 않았다.
또 AI 모델의 사이버 공격 능력이 코딩 능력 향상, 추론, 장기 자율성과 맞물려 급속도로 발전하고 있다며 성능 향상이 지속될 수 있다고 전망했다.
박종진 기자 truth@etnews.com