Fable 5 금지가 드러낸 AI의 다음 문제, 그리고 Sakana Fugu라는 해답

지난 몇 년간 AI 업계는 한 방향으로만 달렸습니다. 더 크게, 더 똑똑하게, 더 강력하게. 그런데 2026년 6월, 단 며칠 사이 벌어진 두 사건이 그 경주의 전제 자체를 흔들었습니다. 경쟁의 축이 "누가 가장 좋은 모델을 만드나"에서 "누가 여러 모델을 가장 잘 지휘하나"로 옮겨갈 수 있다는 신호입니다.

이 글에서는 무슨 일이 있었는지, 그것이 왜 AI의 "다음 큰 문제"를 드러냈는지, 그리고 일본 스타트업 Sakana AI의 새 모델 Fugu가 어떤 해답을 제시하는지 — 벤치마크 수치와 한계까지 균형 있게 정리합니다.

무슨 일이 있었나: 출시 직후 꺼져버린 Fable 5

2026년 6월 12일(미국 동부시간 오후 5시 21분), Anthropic은 미국 상무부로부터 수출통제 명령서를 받았습니다. 내용은 강력했습니다. 자사 최신·최강 모델인 Claude Fable 5와 Mythos 5를, 미국 안팎을 막론하고 모든 외국 국적자(미국 내 외국인 직원 포함)가 사용하지 못하게 하라는 것이었죠.

현실적으로 이 명령은 두 모델을 전 세계 모든 고객에게서 즉시 비활성화하라는 의미였습니다. Anthropic은 규정 준수를 위해 그렇게 했습니다. 공개된 지 며칠 만의 일이었습니다.

명분은 국가안보였습니다. 정부는 Fable 5의 안전 가드레일을 우회하는 "탈옥(jailbreak)" 기법이 존재해, 소비자용 AI가 사실상 제약 없는 사이버 도구로 변할 수 있다고 봤습니다. 중국·러시아 등의 군·정보기관 오용 가능성도 거론됐습니다.

Anthropic은 반박했습니다. "정부가 제시한 건 좁고 비보편적인 탈옥에 대한 구두 증거뿐이며, 그 수준의 능력은 OpenAI의 GPT-5.5 등 다른 공개 모델에서도 이미 가능하다"는 입장입니다. 회사는 복구를 위해 정부와 협의 중이라고 밝혔습니다.

이 사건은 수출통제 권한으로 상용 배포된 AI 모델의 접근을 제한한 최초의 사례로 기록됐습니다. 사이버보안 전문가 80여 명이 결정 철회를 촉구하는 공개서한을 냈고, Adobe·Nvidia 같은 기업도 Anthropic을 지지했습니다.

진짜 문제는 "모델 하나"가 아니었다

여기서 멈추면 그저 한 회사의 불운한 뉴스입니다. 하지만 더 깊은 교훈이 있습니다.

문제의 본질은 "강력한 모델 하나가 막혔다"가 아니었습니다. **"하나의 회사 API에 핵심 워크플로를 통째로 걸어두면, 규제·수출통제·외교 결정 하나로 접근이 하룻밤 사이 사라질 수 있다"**는 것이었습니다.

기업의 인프라, 금융 시스템, 거버넌스, 그리고 점점 더 많은 개발팀의 코딩 파이프라인까지 — 이 모든 게 특정 프런티어 모델 한 곳에 묶여 있다면, 그 의존 자체가 비즈니스 연속성의 약점이 됩니다. Fable 5 사건은 이 리스크를 "가설"에서 "현실"로 끌어내렸습니다. 이것이 AI의 다음 큰 문제, **단일 벤더 의존(single-vendor dependency)**입니다.

Sakana Fugu: 모델을 만드는 대신, 모델을 고르는 시스템

바로 이 지점을 일본 도쿄의 스타트업 Sakana AI가 파고들었습니다. 2026년 6월 21일, 회사는 새 제품 Sakana Fugu(복어)를 정식 출시했습니다.

Fugu의 정체는 한마디로 **"단일 모델처럼 동작하는 멀티에이전트 시스템"**입니다. 사용자가 하나의 엔드포인트로 요청을 보내면, Fugu가 알아서 판단합니다.

간단하면 직접 답하고,
복잡하면 작업을 쪼개 코딩은 A 모델, 과학은 B 모델에 위임하고,
각 결과를 검증한 뒤 하나의 답으로 합칩니다.

이 모델 선택·위임·검증·종합 과정을 전부 내부에서 처리하기 때문에, 멀티에이전트 시스템의 복잡함이 사용자 코드에는 전혀 드러나지 않습니다. 게다가 OpenAI 호환 API라, 기존 클라이언트나 코딩 하네스를 Fugu 엔드포인트로 돌리기만 하면 됩니다. SDK를 갈아끼울 필요가 없죠.

흥미로운 건 Fugu 자체가 LLM이라는 점입니다. "언제 위임할지, 에이전트끼리 어떻게 소통할지, 결과를 어떻게 합칠지"를 학습한 모델입니다. 이 접근은 Sakana가 ICLR 2026에 발표한 두 논문, Trinity와 Conductor(학습된 모델 오케스트레이션)에 기반합니다.

Fugu와 Fugu Ultra

출시 시점에 Fugu는 두 가지로 나옵니다.

Fugu: 저지연 기본형. 일상적인 코딩·코드 리뷰·챗봇처럼 빠른 반응이 중요한 작업에 적합합니다. Codex 같은 도구에 자연스럽게 붙습니다.
Fugu Ultra: 더 깊은 전문가 풀을 동원하는 플래그십. AI 연구, 논문 재현, 사이버보안 분석, 특허 조사처럼 정확도와 깊이가 중요한 고난도 작업용입니다.

벤치마크: 진짜 강한가? (균형 있게)

성능 주장은 빈말이 아닙니다. 다만 "모든 면에서 이겼다"는 과장은 사실이 아니므로, 수치를 그대로 봅니다.

벤치마크	Fugu Ultra	Anthropic	결과
LiveCodeBench (코딩)	93.2	Fable 5: 89.8	Fugu 우세
GPQA-D (대학원 과학)	95.5	Mythos Preview: 94.6	Fugu 소폭 우세
SWE-Bench Pro (실무 SW)	73.7	Fable 5: 80.0	Fable 우세

LiveCodeBench와 GPQA-D에서는 Fugu가 (현재 차단된) Anthropic 모델을 넘어섰습니다. 하지만 실무 소프트웨어 엔지니어링을 측정하는 SWE-Bench Pro에서는 Fable 5가 80.0으로 Fugu Ultra 73.7을 확실히 앞섭니다.

또 하나 짚을 점. Fable과 Mythos는 비공개 상태라 Fugu의 모델 풀에 포함돼 있지 않습니다. Sakana는 "포함됐다면 점수가 더 높았을 것"이라고 주장합니다. 비교 기준치는 각 모델 제공사의 공개 수치를 사용했습니다.

"오케스트레이션이 다음 프런티어" — 그리고 그 한계

Sakana CEO이자 공동창업자인 **데이비드 하(David Ha, 전 구글 브레인)**의 메시지가 이 제품의 철학을 압축합니다.

"오케스트레이션 모델이 더 큰 모델을 넘어선 다음 프런티어다. 한 회사의 모델에 국가 인프라를 거는 것은 막대한 리스크다. 최근 수출통제가 보여줬듯, 최상위 모델 접근은 하룻밤에 사라질 수 있다. 집단 지성이 이 권력 집중에 대한 현실적인 헤지다."

즉 Fugu는 모델을 고르는 시스템 자체를 상품화했습니다. 라우팅 지능을 학습시켜 제품의 중심에 둔 것이죠. "코디네이터를 워커만큼 중요하게" 만든 셈입니다.

그렇다고 만능은 아닙니다. 냉정한 한계도 분명합니다.

진정한 주권은 아니다: 상위 공급자 여러 곳이 동시에 접근을 막으면 Fugu의 선택지도 함께 줄어듭니다. 회복탄력성을 높이는 것과 진짜 독립은 다릅니다.
투명성 부족: Fugu는 어떤 작업에 어떤 모델을 썼는지 사용자에게 알리지 않습니다.
동어반복 비판: "프런티어급 성능을, 프런티어 AI 모델들을 동원해서 낸다"는 점에서 본질적 자체 역량이 아니라는 지적도 있습니다.

그럼에도 분명한 변화가 있습니다. 핵심 질문이 **"어떤 모델이 최고냐?"에서 "어떤 시스템이 모델을 가장 잘 고르냐?"**로 이동하고 있다는 것입니다.

기업 AI 전환에 주는 시사점

이 흐름은 AI를 실무에 도입하는 모든 조직에 직접적인 함의를 줍니다. 단일 벤더 의존을 비즈니스 연속성 리스크로 다뤄야 한다는 것이죠. 구체적으로는:

교체 가능성을 전제로 설계하라. 특정 모델·벤더에 코드를 직접 묶지 말고, OpenAI 호환 API 같은 표준 인터페이스로 결합도를 낮춥니다.
벤더를 갈아끼울 수 있는 추상화 계층을 둬라. 한 공급자가 막혀도 다른 모델로 라우팅할 수 있어야 합니다.
접근 리스크를 운영 항목으로 관리하라. 규제·수출통제·정책 변화는 더 이상 남의 일이 아닙니다.

실제로 한 도구에 올인하지 않는 멀티 스택 운영은 이미 현실적인 선택지입니다. 여러 AI 도구를 상황에 맞게 조합하면, 한 곳이 막혀도 워크플로가 멈추지 않습니다. Fable 5 사건은 바로 그 이유를 증명했습니다.

자주 묻는 질문 (FAQ)

Q. Fable 5는 영영 못 쓰나요? A. 2026-06-24 기준 Anthropic은 정부와 복구를 협의 중입니다. 펜타곤의 "공급망 리스크" 지정에 대해서는 별도 소송이 진행 중이며, 미 법원이 펜타곤 지시의 집행 불가를 판결해 정부·군 관련 기관은 소송 진행 중에도 Anthropic 모델을 계속 사용할 수 있는 상태입니다. 상황은 유동적입니다.

Q. Fugu는 어디서 쓸 수 있나요? A. 출시 시점 기준 대부분 지역에서 즉시 사용 가능하며, 일상용 구독 + 종량제 요금이 있습니다. 단, EU·EEA는 한시적으로 제외됩니다.

Q. Fugu가 Fable 5보다 무조건 좋은가요? A. 아닙니다. 코딩(LiveCodeBench)·과학(GPQA-D)에서는 Fugu가 앞서지만, 실무 소프트웨어(SWE-Bench Pro)에서는 Fable 5가 더 높습니다. 작업 종류에 따라 다릅니다.

Q. 오케스트레이션 모델이 정말 "다음 프런티어"인가요? A. 모델 크기·벤치마크·원천 능력은 여전히 중요합니다. 다만 "어떤 시스템이 모델을 가장 잘 조합하느냐"가 새로운 경쟁 축으로 부상하고 있다는 신호는 분명합니다.

참고자료

Anthropic 공식 성명 (Fable 5/Mythos 5 접근 중단): https://www.anthropic.com/news/fable-mythos-access
Sakana AI 공식 출시문 (Sakana Fugu): https://sakana.ai/fugu-release/
Sakana Fugu 제품 페이지: https://sakana.ai/fugu/
Tom's Guide (Fable 5 금지와 Fugu 분석, 2026-06-23): https://www.tomsguide.com/ai/anthropics-fable-five-ban-exposed-ais-next-big-problem-but-sakanas-fugu-may-have-the-answer
VentureBeat (Fugu 출시, 2026-06-22): https://venturebeat.com/orchestration/no-claude-fable-5-no-problem-sakana-achieves-frontier-performance-with-new-fugu-multi-model-auto-synthesis-system
The Decoder (벤치마크 분석, 2026-06-22): https://the-decoder.com/sakana-ais-fugu-orchestrates-multiple-llms-to-match-anthropics-fable-and-mythos-benchmarks/
Nikkei Asia (2026-06-22): https://asia.nikkei.com/business/technology/artificial-intelligence/japan-s-sakana-fugu-multiagent-ai-scores-well-against-fable-5-gpt-5.5
BBC (Fable 5/Mythos 5 중단, 2026-06-13): https://www.bbc.com/news/articles/c932g3v3e13o

접속: 2026-06-24 KST

Fable 5 금지가 드러낸 AI의 다음 문제, 그리고 Sakana Fugu라는 해답