클로드코드 ultracode 모드란? 수백 명의 AI가 서로 반박하며 답을 검증하는 방식
클로드코드 ultracode 모드란? 수백 명의 AI가 서로 반박하며 답을 검증하는 새 방식
클로드코드(Claude Code)에 ultracode 모드가 생겼어요. 2026년 5월 28일, Claude Opus 4.8과 함께 research preview로 공개됐으니 글 쓰는 시점(2026년 5월 29일)으로는 공개된 지 하루밖에 안 됐죠. 한 줄로 요약하면 "AI 한 명이 답하는 게 아니라, 수십~수백 명이 서로 반박하면서 살아남은 답만 내놓는 모드"예요. 이 글에서는 클로드코드 ultracode가 정확히 무엇인지, 어떻게 켜고, 안에서 무슨 일이 벌어지는지, fast 모드와는 뭐가 다른지까지 차근차근 정리해 드릴게요.
ultracode는 'effort 옵션'이 아니라 세션 설정이에요
가장 먼저 오해부터 풀고 가야 해요. ultracode는 모델의 추론 강도(effort level)를 고르는 옵션이 아니에요. low, medium, high, xhigh, max 같은 effort 레벨과는 결이 달라요. ultracode는 클로드코드의 세션 설정이에요.
켜면 두 가지가 동시에 작동해요.
- 모델에게
xhigh수준의 깊은 추론을 요청하고 - 클로드코드가 substantive task(의미 있는 작업)마다 dynamic workflows(다중 에이전트 오케스트레이션)를 알아서 띄울 상시 권한을 갖게 돼요.
즉 "깊은 추론 + 멀티에이전트 워크플로우 자동 실행 권한"의 결합인 셈이에요. 한 가지 더, ultracode는 **현재 세션에만 적용(session-only)**돼요. 그리고 xhigh effort를 지원하는 모델에서만 /effort 메뉴에 ultracode가 나타나요. 지원하지 않는 모델에서는 아예 선택지에 보이지 않죠.
참고로 프롬프트에 ultrathink를 넣는 것과도 헷갈리기 쉬운데요, ultrathink는 그 턴에만 더 깊이 생각하라는 요청일 뿐 세션 설정을 바꾸지 않아요. ultracode와는 별개 개념이에요.
어떻게 켜고 끄나요
활성화 방법은 세 가지예요.
| 방법 | 형태 |
|---|---|
| 명령어 | /effort ultracode (effort 메뉴에서 선택) |
| 설정 전달 | --settings로 "ultracode": true |
| Agent SDK | control request로 "ultracode": true |
끄는 건 간단해요. /effort로 다른 레벨(low/medium/high/xhigh/max)로 전환하면 ultracode가 해제돼요. 세션 단위 설정이라 새 세션을 열면 기본값으로 돌아온다는 점도 기억해 두세요.
켜면 안에서 무슨 일이 벌어지나요
여기가 진짜 핵심이에요. ultracode가 켜진 세션에서 클로드는 다음 패턴으로 동작해요.
1. 워크플로우를 즉석에서 짜요
클로드가 "이 작업이 워크플로우를 쓸 만큼 무거운가?"를 스스로 판단해요. 그렇다고 보면, 작업을 잘게 쪼개는 자바스크립트 오케스트레이션 스크립트를 즉석에서 작성하고 런타임이 이걸 백그라운드에서 실행해요. 하나의 요청이 "코드 이해 → 변경 → 검증" 같은 여러 워크플로우의 연쇄로 확장되기도 하고요.
2. 수십~수백 명이 분업해요
작성된 스크립트가 수십~수백 개의 subagent를 동시에 풀어놓아요. 각 subagent는 같은 문제를 서로 다른 각도에서 독립적으로 파고들죠. 혼자 끙끙대는 게 아니라 팀이 분업하는 구조예요.
3. 서로 반박해요 (adversarial verification)
가장 인상적인 부분이에요. 한 subagent가 "이 함수에 동시성 버그가 있어요"라고 주장하면, 다른 subagent의 임무는 그 주장을 반증하는 것이에요. 반박을 견뎌낸 주장만 사용자에게 도달하죠. 토론으로 거짓을 걸러내고 진실만 남기는 방식이라, 그냥 한 번에 답을 뱉는 것보다 결과가 훨씬 단단해요.
4. 수렴할 때까지 반복하고, 컨텍스트는 아껴요
답이 수렴할 때까지 이 과정을 반복해요. 그리고 똑똑한 설계가 하나 더 있는데요, 계획과 중간 결과가 클로드의 컨텍스트 창이 아니라 스크립트 코드와 변수 안에 머물러요. 클로드의 컨텍스트에는 최종 답만 올라오죠. 그래서 수백 명이 일해도 본체의 컨텍스트는 깔끔하게 유지돼요.
규모로 보면 한 번 돌릴 때 최대 1,000개 subagent, 동시 실행은 최대 16개까지로 보고돼요. 다만 이 1,000/16 수치는 테크 미디어(marktechpost, 2026년 5월 28일) 보도를 인용한 것이고, 공식 블로그는 "수십~수백 개(tens to hundreds)"라고 표현하고 있어요. 그러니 정확한 상한은 공식 문서로 한 번 더 확인하시는 게 좋아요.
fast 모드 vs ultracode — 정반대 우선순위
자주 받는 질문이 "그럼 fast 모드랑 뭐가 다르냐"인데요, 둘은 우선순위가 정반대예요.
| 항목 | fast 모드 | ultracode |
|---|---|---|
| 본질 | 출력 속도 우선(throughput) | 클로드코드 설정(xhigh + 워크플로우 권한) |
| 우선순위 | 속도 / 처리량 | 철저함 / 정확도 + 자동 멀티에이전트 |
| 동작 | 같은 모델에서 출력 토큰 최대 2.5배 | 깊은 추론 + 멀티에이전트 워크플로우 자동 실행 |
| 가격 | premium pricing(Opus 4.8 fast는 표준의 약 2배) | 모델 표준 단가이나 토큰 소비량이 큼 |
fast 모드는 속도를 높이지만 정확도를 위한 추론·검증을 늘리지는 않아요. 단순 작업에서 낮은 effort와 조합하면 최대 속도를 낼 수 있죠. 반면 ultracode는 xhigh의 깊은 추론에 멀티에이전트 검증을 더해 철저함을 극대화하는 쪽이에요. 한 가지 주의할 점은, ultracode가 effort 메뉴에 표시되긴 하지만 추가 API effort level은 아니라는 거예요. 대화 중 시스템 메시지로 워크플로우 실행 권한이 부여되는 형태죠.
비용은 얼마나 들고, 언제 쓰면 좋나요
dynamic workflows는 일반 클로드코드 세션보다 토큰을 상당히 더 소비할 수 있어요. 그래서 공식 문서도 사용량 감을 잡기 위해 scoped task(범위를 좁힌 작업)부터 시작하라고 권하고 있어요.
비용을 아끼는 방법도 몇 가지 알려드릴게요.
/effort로 effort 레벨을 낮추기/config에서 thinking 끄기- 단순 작업은
MAX_THINKING_TOKENS=8000으로 예산 줄이기 - 단순 subagent 작업은
model: haiku지정, 대부분의 코딩은 Sonnet으로 충분, Opus는 복잡한 아키텍처 결정이나 다단계 추론에만 예약
공식 문서가 ultracode의 적정 사례로 드는 건 codebase 규모의 마이그레이션, 대규모 병렬 분석, 머지 전 철저한 버그 검증 같은 작업이에요. 정확도가 토큰 비용보다 중요한 무거운 작업이라는 공통점이 있죠. 반대로 단순하고 작은 작업은 fast 모드 + 낮은 effort가 더 어울려요.
ultracode · ultrareview · ultraplan — 'ultra' 3종 정리
ultracode 혼자만 있는 게 아니에요. 'ultra' 시리즈는 셋이에요.
| 이름 | 분류 | 역할 |
|---|---|---|
| ultracode | 세션 설정(/effort ultracode) | xhigh + 워크플로우 자동 오케스트레이션을 모든 substantive task에 적용 |
| ultrareview | 명령(/code-review ultra) | 클라우드에서 도는 deep 멀티에이전트 코드 리뷰 — 머지 전 버그 검증 |
| ultraplan | 명령/기능 | 로컬 plan 작업을 클라우드 Claude Code(plan mode)로 위임, 브라우저에서 섹션별 코멘트·수정 |
ultracode가 일반 코딩 세션 전반에 작동하는 광범위 설정이라면, ultrareview는 코드 리뷰에, ultraplan은 사전 설계·계획에 특화돼 있어요. 셋 다 멀티에이전트/dynamic workflows 기반은 공유하고, 적용하는 영역만 다른 거죠.
자주 묻는 질문 (FAQ)
Q. ultracode는 GPT의 reasoning effort 같은 건가요?
아니에요. ultracode는 effort 레벨 자체가 아니라 클로드코드의 세션 설정이에요. 모델에 xhigh 추론을 보내는 동시에, 멀티에이전트 워크플로우를 자동으로 띄울 권한을 함께 부여하는 결합 개념이죠. effort 메뉴에 표시되긴 하지만 추가 API effort level은 아니에요.
Q. ultracode를 켜면 비용이 많이 나오나요?
네, 일반 세션보다 토큰을 상당히 더 소비할 수 있어요. 수십~수백 개의 subagent가 병렬로 돌고 반복 검증하니까요. 그래서 공식 문서도 처음엔 범위를 좁힌 작업(scoped task)으로 시작해 사용량 감을 잡으라고 권해요. 대규모 마이그레이션이나 머지 전 버그 검증처럼 정확도가 비용보다 중요한 작업에 쓰는 걸 추천해요.
Q. ultracode와 ultrareview, ultraplan은 어떻게 다른가요?
셋 다 멀티에이전트/dynamic workflows 기반은 같지만 적용 영역이 달라요. ultracode는 코딩 세션 전반에 작동하는 설정, ultrareview는 /code-review ultra로 도는 클라우드 코드 리뷰, ultraplan은 plan 작업을 클라우드로 위임하는 기능이에요.
마무리
ultracode를 한마디로 정리하면 **"정확도가 돈보다 중요할 때 켜는 스위치"**예요. AI 한 명에게 맡기는 대신, 수십~수백 명이 분업하고 서로 반박하면서 살아남은 답만 내놓는 방식이니까요. 토큰 비용이 큰 만큼, 처음엔 범위를 좁힌 작업으로 감을 잡아보는 걸 추천해요.
가용 범위는 Claude Code CLI/Desktop/VS Code 확장에서 Max·Team·Enterprise 플랜, 그리고 Claude API·Amazon Bedrock·Vertex AI·Microsoft Foundry예요. 아직 2026년 5월 28일 기준 research preview 단계라 사양(상한, 가격, 가용 플랜)이 바뀔 수 있으니, 실제로 켜기 전에 공식 문서로 최신 정보를 한 번 더 확인하시길 권해요.
출처
- Claude Code 모델 설정 문서
- Claude Code dynamic workflows 문서
- Dynamic workflows 공식 블로그
- ultrareview 문서
- ultraplan 문서
- Claude Opus 4.8 발표
https://code.claude.com/docs/en/model-config https://code.claude.com/docs/en/workflows https://claude.com/blog/introducing-dynamic-workflows-in-claude-code