앤트로픽이 최고 전문가 수준의 해킹 능력을 갖춘 인공지능(AI) ‘미토스(Mythos)’를 개발했으나, 악용을 우려해 선별된 기업에만 이를 제공하기로 했다. 미토스는 단순 버그 찾기를 넘어 수십 단계의 복잡한 해킹 공정을 스스로 수행하며, 한번도 드러난 적이 없는 취약점을 수천 개 찾아냈다.
미토스 등장으로 단기적으로는 아마추어 해커들의 ‘바이브 해킹’이 확산돼 대혼란이 예상된다. 하지만, 장기적으로 이는 출시 전 보안 점검 도구로 활용돼 방어자에게 유리해질 것이라고 영국 시사주간지 이코노미스트가 최근 밝혔다. 다만, 버그 탐색에 드는 건당 수천만 원의 막대한 비용과 관리 주체가 없는 구형 기기의 보안 취약성 등은 여전한 숙제로 남아 있다.
보안체계의 붕괴를 우려한 미국과 영국, 캐나다 등 각국 금융당국은 업계와 긴급 간담회 등을 열고 금융시스템 방어 등을 논의했다. 한국 금융감독원도 최근 국내 은행 등 주요 금융사 정보보안담당자들을 긴급 소집해 AI발 보안위협과 대응방안 점검에 나섰다.
기술 기업들은 보통 출시 예정 제품을 홍보하며 기대감을 조성한다. 그러나 미국 AI 연구소 앤트로픽은 출시하지 않을 제품으로도 큰 관심과 동시에 상당한 우려를 불러일으켰다. 지난 4월 7일, 이 회사는 ‘미토스’라는 새로운 AI 모델을 일반에는 공개하지 않겠다고 발표했다. 대신 ‘프로젝트 글래스윙’이라는 프로그램을 통해, 이 모델에 대한 접근을 엄격히 통제하기로 했다. 이 프로젝트의 창립 멤버 12곳에는 애플, 구글, 엔비디아 등이 포함돼 있다.
문제는 미토스가 결함이 있거나 신뢰할 수 없어서가 아니다. 오히려 너무 뛰어나기 때문에, 공개될 경우 전 세계 디지털 인프라를 위험에 빠뜨릴 수 있다는 점이라고 이코노미스트는 강조했다.
앤트로픽에 따르면, 이 모델은 대중적인 운영체제부터 전자상거래와 금융 네트워크를 보호하는 암호 소프트웨어에 이르기까지 보안 취약점을 찾고 악용하는 능력에서 “최고 수준의 인간 전문가를 제외한 거의 모든 사람을 능가한다.” 게다가 최소한의 인간 개입만으로도 이런 취약점을 찾아낼 수 있다. 이에 질세라 경쟁사인 오픈AI도 며칠 뒤, 해킹 기능이 강화된 폐쇄형 모델(‘GPT 5.4 Cyber’)을 발표했다.
‘바이브 해킹(vibe hacking)’ 시대가 온다는 전망은 매우 위협적으로 들린다. AI 모델을 활용해 비전문가도 소프트웨어 취약점을 찾고, 이를 공격 코드로 발전시켜 시스템을 마비시키거나 몸값을 요구하거나 원격으로 장악할 수 있게 된다는 것.
앤트로픽 발표 직후 스콧 베센트 미국 재무장관은 주요 은행 최고경영자(CEO)들을 소집해 AI 기반 해킹이 금융산업에 미칠 영향을 논의했다. 영국 금융 규제당국도 유사한 회의를 열었다.
그러나 보안 전문가들은 조심스럽게 낙관적인 입장을 보이고 있다고 이코노미스트는 전했다. 미국 보안 전문가 브루스 슈나이어는 “중기적으로는 혼란이 클 것”이라면서도 “장기적으로는 방어자에게 도움이 될 것”이라고 전망했다.
미토스가 얼마나 혁신적인지는 아직 제한된 정보만 공개돼 평가가 어렵다. 영국 정부 산하 AI 보안 연구기관 테스트 결과, 단순한 보안 테스트에서는 다른 모델과 큰 차이가 없었다. 하지만, 수십 단계의 공격 과정을 수행해야 하는 고급 테스트에서는 뚜렷한 우위를 보였다.
앤트로픽 연구진은 특히 ‘제로데이(zero-day)’ 취약점 탐지 능력에 주목했다. 이는 아직 누구도 발견하지 못한 새로운 보안 결함을 의미한다. 이를 발견할 수 있다면, 단순히 기존 데이터를 재활용하는 것이 아니라 새로운 취약점을 창출해내는 능력을 갖췄다는 의미라고 이코노미스트는 설명했다.
소프트웨어 보안 기업인 콘트래스트 시큐리티 공동창업자인 제프 윌리엄스는 “제로데이는 어디에나 존재한다”고 말한다. 앤트로픽은 미토스가 “수천 개의 고위험 취약점”을 발견했다고 밝혔지만, 대부분은 수정될 때까지 비공개 상태로 유지하고 있다. 다만 일부 사례로, 널리 쓰이는 운영체제(FreeBSD), 영상 라이브러리(FFmpeg), 그리고 아직 수정되지 않은 클라우드 핵심 소프트웨어 취약점 등을 공개했다.
흥미로운 점은 이러한 취약점들이 완전히 새로운 수준이라기보다, 인간이나 기존 AI도 발견할 수 있는 범주라는 점이다. AI 보안 기업 아일 창업자인 스타니슬라브 포트는 더 작은 AI 모델들을 활용해 동일한 취약점을 찾아냈다고 밝혔다. 그는 현재 AI 보안 경쟁은 “뚜렷한 승자가 없는 들쭉날쭉한 상태”라고 평가했다.
그럼에도, 기술 발전 속도는 매우 빠르다. 과거 AI 기반 버그 탐지는 오류가 많았지만, 최근에는 품질이 크게 개선됐다. 실제로 오픈에스에스엘(OpenSSL) 업데이트에서는 AI가 발견한 12개의 보안 취약점이 수정됐다. 앤트로픽은 자사 구형 모델이 2025년 파이어폭스에서 발견된 주요 취약점의 약 20%를 찾아냈다고 밝혔다.
문제는 AI가 취약점을 더 빨리 찾는 만큼, 이를 공격자가 악용하는 속도가 방어자가 수정하는 속도를 앞지를 수 있느냐는 점. 이를 해결하기 위해 프로젝트 글래스윙이 등장한 것이다. 앤트로픽은 인터넷 핵심 인프라 기업 40곳에 추가로 접근 권한을 제공해, 취약점을 먼저 찾아내고 수정할 시간을 확보하려 하고 있다고 이코노미스트는 진단했다.
이코노미스트가 인터뷰한 모든 연구자는, 장기적으로는 AI 기반 해킹이 공격자보다 방어자에게 더욱 도움이 될 것이라고 본다. 기업들이 소프트웨어 출시 전에 더 철저하게 점검할 수 있기 때문이다.
하지만 단기적으로는 걱정할 거리가 많다. 우선은 비용 문제. 앤트로픽에 따르면, 하나의 취약점을 찾는 데 약 2만 달러(약 2961만 원)의 비용이 들기도 한다. 자원봉사자 중심으로 운영되는 리눅스 같은 오픈소스 프로젝트에는 큰 부담이다.
더 큰 문제는 가정용 라우터, 스마트 가전, 산업 장비 등 상당수 소프트웨어가 사실상 관리되지 않고 있다는 점. 이런 영역에서는 공격자들이 큰 이득을 볼 수 있다고 이코노미스트는 우려했다.
권선무 기자