Claude Mythos: Anthropic의 역대 최강 AI 모델이 데이터 유출로 드러나다

Anthropic은 AI 안전을 가장 진지하게 다루는 회사로 알려져 있습니다. 그런 회사가 스스로도 예상치 못한 방식으로 차세대 모델의 존재를 세상에 알리게 됐습니다. CMS(콘텐츠 관리 시스템) 설정 실수 한 번으로 약 3,000개의 비공개 자산이 공개됐고, 그 안에는 Anthropic이 지금껏 개발한 가장 강력한 AI 모델 "Claude Mythos"의 정보가 담겨 있었습니다.

CMS 설정 실수가 드러낸 역대급 AI 모델

2026년 3월, 보안 연구원 Roy Paz(LayerX Security)와 Cambridge 대학의 Alexandre Pauwels가 이상한 점을 발견했습니다. Anthropic 웹사이트의 CMS에서 원래라면 비공개여야 할 수천 개의 문서와 페이지가 외부에서 접근 가능한 상태였던 것입니다.

Anthropic은 이를 "human error", 즉 담당자의 실수로 인한 설정 오류라고 밝혔습니다. CMS에 업로드된 자산이 기본값으로 "public"으로 설정되는 구조적 문제가 원인이었으며, AI 도구인 Claude나 Cowork와는 무관한 보안 사고였습니다. 유출된 자산은 약 3,000개에 달했으며, 그 안에는 아직 공식 발표되지 않은 새 AI 모델에 관한 상세한 내용이 포함돼 있었습니다. Fortune의 기자 Beatrice Nolan이 이를 독점 보도하면서 "Claude Mythos"의 존재가 처음으로 세상에 알려졌습니다.

유출된 자료에는 모델의 성능 지표, 출시 전략, 사이버보안 역량에 대한 Anthropic 내부의 평가뿐 아니라 영국 18세기 저택에서 열린 유럽 CEO 리트릿(Dario Amodei 참석) 정보도 포함돼 있었습니다. 공식 발표도 없이 이처럼 구체적인 정보가 공개된 것은 AI 업계 역사상 이례적인 사건입니다.

Claude Mythos란 무엇인가

**Claude Mythos(코드명: Capybara)**는 Anthropic이 개발한 새로운 최상위 AI 모델 티어입니다. 기존 최고 성능 모델이었던 Opus보다 크고 더 강력하며, Anthropic 스스로 "지금껏 개발한 가장 강력한 AI 모델(by far the most powerful AI model we've ever developed)"이라고 표현하고 있습니다.

"Capybara"는 내부 티어명으로, 기존 Claude 라인업인 Haiku(경량·빠름) → Sonnet(범용) → Opus(고성능) 위에 새로운 최상위 등급을 추가하는 개념입니다. 코딩, 학술 추론, 사이버보안 영역에서 Claude Opus 4.6 대비 "dramatically higher scores"를 기록했습니다. Anthropic 내부 문서는 이를 단순한 성능 개선이 아닌 "a step change", 즉 질적 도약이라고 표현하고 있습니다.

성능이 높은 만큼 가격도 Opus보다 비싸며, 현재는 일반 출시 준비가 완료되지 않은 상태입니다. 훈련은 완료됐고, 현재 소수의 early access 고객을 대상으로 테스트가 진행 중입니다. Anthropic이 아직 공개 발표를 하지 않은 것은 일반 출시 전 추가 안전 평가와 단계적 접근 전략 때문으로 보입니다.

관련 글: Claude Code 활용법 완벽 가이드

"전례 없는 사이버보안 위험"

Mythos에서 가장 눈에 띄는 부분은 성능 수치가 아닙니다. 바로 Anthropic 스스로가 자사 모델에 대해 경고하는 방식입니다.

유출된 문서에 따르면 Anthropic은 Mythos를 두고 "현재 사이버 역량 면에서 다른 어떤 AI 모델보다 훨씬 앞서 있다(currently far ahead of any other AI model in cyber capabilities)"고 평가했습니다. 동시에 이 모델이 "전례 없는 사이버보안 위험(unprecedented cybersecurity risks)"을 야기한다고도 명시했습니다.

구체적으로는 "방어자들의 대응 속도를 훨씬 앞서는 방식으로 취약점을 악용할 수 있는 모델들의 파동이 다가오고 있다"는 표현도 등장합니다. AI 모델이 공격 도구로 활용될 경우 기존 사이버보안 체계가 버티지 못할 수 있다는 경고입니다.

이는 단순한 이론적 우려가 아닙니다. 이미 중국 국가 연계 해킹 그룹이 Claude Code를 활용해 기술기업, 금융기관, 정부기관을 포함한 약 30개 조직에 침투를 시도한 사례가 확인됐습니다. Anthropic은 10일간의 조사 끝에 해당 계정을 차단하고 관련 조직에 통보했습니다. AI 모델의 코딩 및 자동화 역량이 사이버 공격에 실제로 활용되고 있다는 사실은 Mythos 수준의 모델이 가져올 위험을 더욱 구체적으로 만들어줍니다.

이른바 "dual-use(이중 사용)" 문제입니다. 강력한 AI는 방어와 공격 모두에 쓰일 수 있으며, 그 역량 격차가 클수록 잠재적 피해도 커집니다. OpenAI도 GPT-5.3-Codex를 출시하면서 사이버보안 분야에서 "high capability"로 최초 분류한 바 있어, 이는 Anthropic만의 문제가 아닌 업계 전반의 과제가 되고 있습니다.

방어자 우선 출시 전략

Anthropic이 Mythos를 당장 일반 공개하지 않는 데는 이유가 있습니다. 회사의 출시 전략은 사이버보안 방어 조직에 먼저 early access를 제공하는 방식입니다.

공격자보다 방어자가 먼저 이 기술을 이해하고 대비책을 갖출 수 있도록 하겠다는 접근입니다. Anthropic은 "방어자에게 head start를 제공하여, AI 기반 공격의 파도가 본격화되기 전에 코드베이스의 견고성을 개선할 시간을 준다"고 밝혔습니다. 취약점 탐지, 침해 사고 대응, 보안 코드 리뷰 등 방어 용도로 먼저 역량을 쌓은 뒤 단계적으로 접근 범위를 확대하는 전략입니다.

이는 Anthropic의 "책임 있는 스케일링 정책(Responsible Scaling Policy, RSP)"과 맥락을 같이합니다. 모델의 역량이 특정 위험 임계치를 넘을 경우 출시를 늦추거나 접근을 제한할 수 있다는 방침이며, Mythos는 그 기준을 실제로 적용해야 하는 첫 사례가 될 가능성이 높습니다. AI 개발사가 스스로 "이 모델은 위험하다"고 밝히면서도 개발을 계속하는 것 자체가 업계에 새로운 규범을 만들어가는 과정이기도 합니다.

AI 경쟁의 새 국면

Mythos의 등장은 AI 역량 경쟁이 새로운 단계에 접어들었음을 보여줍니다.

Claude Opus 4.6과의 차이도 주목할 만합니다. 코딩 벤치마크에서의 극적인 점수 차이는 단순한 업그레이드가 아니라 새로운 아키텍처 또는 훈련 방식의 전환을 암시합니다. "step change"라는 표현이 과장이 아닐 수 있습니다. 기존 Opus가 이미 전문가 수준의 코딩 지원과 복잡한 추론을 소화했다는 점을 감안하면, 그 위에 "극적인 차이"가 있다는 것은 적지 않은 의미를 갖습니다.

경쟁 구도도 치열해지고 있습니다. OpenAI의 GPT-5.3-Codex는 사이버보안 "high capability" 분류를 받았으며, 다른 주요 AI 연구소들도 유사한 고역량 모델을 개발 중인 것으로 알려져 있습니다. Mythos가 유출된 내용대로 "현존하는 모든 AI 모델보다 사이버 역량이 앞선다"면, 이는 일시적 우위일 뿐 곧 경쟁이 따라붙을 것입니다.

모델 출시 사이클도 빨라지고 있습니다. Anthropic은 최근 Claude 3.5, 3.6, 4.x 시리즈를 빠르게 출시했으며, Mythos는 그 다음 차원의 도약을 의미합니다. 2026년 하반기는 AI 역량 경쟁의 분기점이 될 것으로 보입니다.

시사점: AI 안전과 투명성의 역설

이번 사건에는 아이러니가 있습니다. AI 안전을 핵심 가치로 내세우는 Anthropic이, 정작 자사의 가장 강력할 수 있는 모델 정보를 보안 실수로 유출했다는 점입니다.

물론 CMS 설정 오류는 기술적 문제이지 의도적 은폐와는 다릅니다. 오히려 유출된 내용을 보면 Anthropic이 내부적으로는 Mythos의 위험성을 매우 진지하게 다루고 있음을 알 수 있습니다. "전례 없는 위험"이라는 표현을 내부 문서에 명시했다는 것 자체가, 이 회사가 성능만큼 안전을 중요하게 고민하고 있다는 증거이기도 합니다.

다만 이번 사건은 AI 개발 조직에 중요한 교훈을 남깁니다. 모델 역량이 강력할수록, 그 정보를 다루는 방식도 더욱 엄격해야 한다는 것입니다. 내부 평가 문서, 출시 전략, 위험 분석 자료는 모두 적절한 접근 제어 아래 관리돼야 하며, 특히 "전례 없는 위험"을 내포한 모델에 관한 자료라면 더욱 그렇습니다.

AI 투명성 논의에서도 중요한 질문이 제기됩니다. 모델의 위험성을 외부에 얼마나 공개해야 하는가? 사전 공개가 방어자에게 도움이 될 수도, 공격자에게 정보를 제공할 수도 있습니다. Mythos의 사례는 이 균형을 어떻게 잡을 것인지에 대한 업계 전반의 논의를 촉발할 가능성이 높습니다.

마무리

Claude Mythos는 아직 공식 발표된 모델이 아닙니다. 그러나 이번 유출을 통해 우리는 AI 역량의 다음 단계가 이미 존재하며, 그것이 예상보다 훨씬 강력하다는 사실을 알게 됐습니다.

사이버보안 역량에서의 극적인 도약은 방어와 공격 모두에 영향을 미칩니다. Claude Mythos를 먼저 방어 조직에 제공하는 전략이 실제로 위험을 얼마나 통제할 수 있을지, 그리고 경쟁사들이 어떻게 대응할지가 앞으로 주목해야 할 지점입니다.

AI가 단순한 생산성 도구를 넘어 사이버 안보의 핵심 변수가 되는 시대가 본격적으로 열리고 있습니다. Mythos는 그 시대의 시작을 알리는 신호탄일 수 있습니다.

AI 최신 동향과 실무 활용 인사이트가 궁금하시다면 QJC 뉴스레터를 구독해 보세요. 매주 검증된 AI 소식을 정리해 전달해 드립니다.

자주 묻는 질문 (FAQ)

Q: Claude Mythos와 Claude Opus의 차이는 무엇인가요?

Claude Mythos(코드명 Capybara)는 Opus 위에 새롭게 추가된 최상위 모델 티어입니다. 코딩, 학술 추론, 사이버보안 벤치마크에서 Opus 4.6 대비 극적으로 높은 점수를 기록했으며, Anthropic은 이를 단순한 개선이 아닌 질적 도약("step change")으로 표현하고 있습니다. 가격도 Opus보다 높을 예정입니다.

Q: Claude Mythos는 언제 일반 출시되나요?

정확한 출시 일정은 아직 공개되지 않았습니다. 현재 훈련이 완료된 상태로 early access 테스트 중이며, Anthropic은 사이버보안 방어 조직을 우선으로 접근권을 제공하는 단계적 출시 전략을 취하고 있습니다. 일반 출시 전 추가적인 안전 평가 과정을 거칠 것으로 예상됩니다.

Q: "전례 없는 사이버보안 위험"은 어떤 의미인가요?

Anthropic 내부 문서에 따르면 Mythos는 현존하는 AI 모델 중 사이버 역량이 가장 뛰어나며, 기존 보안 방어 체계의 대응 속도를 앞서는 방식으로 취약점을 악용할 수 있는 잠재력을 지닌다는 평가입니다. 실제로 AI를 활용한 사이버 공격 사례가 이미 발생했기 때문에, 이는 이론적 우려가 아닌 현실적 위험으로 받아들여지고 있습니다.

Q: 이번 유출은 어떻게 발생했나요?

Anthropic의 CMS(콘텐츠 관리 시스템) 설정 오류로 인해 약 3,000개의 비공개 자산이 외부에서 접근 가능한 상태가 됐습니다. Anthropic은 이를 "human error"로 인한 사고라고 밝혔으며, AI 도구(Claude, Cowork 등)와는 별개의 문제라고 설명했습니다. LayerX의 Roy Paz와 Cambridge의 Alexandre Pauwels가 이를 발견했으며, Fortune이 독점 보도했습니다.

Q: 중국 해킹 그룹의 Claude Code 악용 사례는 어떤 내용인가요?

중국 국가 연계 해킹 그룹이 Claude Code를 활용해 기술기업, 금융기관, 정부기관을 포함한 약 30개 조직에 침투를 시도한 사례가 확인됐습니다. Anthropic은 10일간의 조사 끝에 해당 계정을 차단하고 피해 조직에 통보했습니다. Mythos처럼 더 강력한 모델이 등장할 경우 이런 위협이 더욱 정교해질 수 있다는 우려가 제기되고 있습니다.

Claude Mythos: Anthropic의 역대 최강 AI 모델이 데이터 유출로 드러나다