Claude Code 에이전트 팀 인원 최적 가이드: 3명이 Sweet Spot인 이유

Claude Code의 Agent Team 기능을 처음 접하면 누구나 같은 질문을 합니다. "몇 명으로 팀을 구성해야 가장 효율적일까?" 직관적으로는 에이전트가 많을수록 빠를 것 같지만, Anthropic 공식 문서는 정반대의 이야기를 합니다. "teams of 3 performing better than teams of 6." 이 글에서는 공식 문서, 학술 논문, 커뮤니티 실측 데이터를 종합하여 Claude Code 에이전트 팀 인원의 최적값을 분석합니다.

Claude Code 에이전트 팀이란 무엇인가

Claude Code Agent Team은 여러 AI 에이전트가 독립적인 컨텍스트 윈도우를 가지고 상호 커뮤니케이션하며 협업하는 Claude Code의 멀티 에이전트 시스템입니다.

Agent Team은 단순한 Subagent와 다릅니다. Subagent는 메인 에이전트가 서브 작업을 위임하고 결과만 받는 일방향 구조입니다. 반면 Agent Team은 팀원 간 SendMessage로 소통하고, 파일을 나눠서 편집하고, Lead가 전체를 조율하는 양방향 협업 구조입니다.

Anthropic 공식 문서에 따르면 Agent Team을 사용해야 하는 경우는 "상호 커뮤니케이션이 필요한 복잡한 작업"입니다. 단순히 병렬로 독립 작업을 돌리고 싶다면 Subagent가 더 효율적입니다.

구분	Subagent	Agent Team
통신 방식	일방향 (위임-결과)	양방향 (SendMessage)
컨텍스트	독립	독립 (각자 컨텍스트 윈도우)
조율	메인 에이전트가 직접	Lead가 Delegate 모드로 조율
토큰 비용	상대적 저렴	상대적 비쌈 (통신 오버헤드)
적합 작업	독립적 병렬 작업	상호 의존적 협업 작업

3명이 Sweet Spot인 이유: 공식 문서 근거

Anthropic 공식 문서에는 "teams of 3 performing better than teams of 6"이라는 명확한 문장이 있습니다. 권장 패턴은 teammate당 5-6개 태스크를 배정하는 것이며, "Keep teams small"이 핵심 원칙입니다.

이 원칙의 배경에는 통신 경로 폭발 문제가 있습니다. 팀원 수가 늘어날수록 통신 경로가 기하급수적으로 증가합니다.

3명: 통신 경로 3개
4명: 통신 경로 6개
5명: 통신 경로 10개
6명: 통신 경로 15개

Anthropic Engineering Blog의 C 컴파일러 실험이 이를 극명하게 보여줍니다. 16개 에이전트를 투입해 100,000줄의 Rust 코드를 생성하는 프로젝트에서, 총 2,000 세션과 $20,000의 API 비용이 발생했습니다. 핵심 문제는 "모든 에이전트가 같은 버그를 발견하고 서로 덮어쓰는 현상"이었습니다. 작업을 독립적인 단위로 분해한 후에야 문제가 해결되었습니다.

반면 멀티 에이전트 리서치 시스템에서는 3-5개의 Subagent를 활용하여 단일 에이전트 대비 90.2%의 성능 향상을 달성했습니다. Lead에 Opus, Subagent에 Sonnet을 배치하는 전략이 비용 효율적이었습니다.

Google DeepMind 논문이 밝힌 "Rule of 4"

Google DeepMind가 2024년 12월 발표한 논문 "Towards a Science of Scaling Agent Systems"는 180개 설정을 실험하여 멀티 에이전트 시스템의 스케일링 법칙을 정립했습니다.

가장 중요한 발견은 **"Rule of 4"**입니다. 에이전트 수가 4명을 넘기면 조정 비용이 **초선형(n^1.724)**으로 증가합니다. 이는 에이전트를 2배로 늘려도 성능이 2배가 되지 않고, 오히려 조정 오버헤드가 성능 이점을 잠식한다는 의미입니다.

논문의 핵심 발견을 정리하면 다음과 같습니다.

비구조화 병렬("Bag of Agents"): 에러 17.2배 증폭
중앙 집중형(Hub-and-Spoke): 에러 4.4배 증폭 (가장 효과적인 토폴로지)
45% 포화 임계치: 단일 에이전트가 이미 45% 이상 달성하면 추가 에이전트 투입의 효과가 미미함
순차적 추론 작업: 멀티 에이전트 적용 시 -39%에서 -70%까지 성능 저하

이 연구 결과는 "에이전트가 많으면 좋다"는 직관이 완전히 틀렸음을 보여줍니다. 4명 이하에서 최적의 비용 대비 성능을 얻을 수 있습니다.

커뮤니티 실측 데이터: 토큰 비용과 실패 패턴

이론적 분석을 넘어 실제 사용자들의 데이터는 더 생생한 교훈을 줍니다.

토큰 소비 비교

GitHub Issues에 보고된 실측 데이터를 기반으로 구성별 토큰 소비를 비교하면 다음과 같습니다.

구성	토큰 소비	배수
Solo session	약 200K	1x
3 Subagents	약 440K	약 2.2x
3-person Team	약 800K	약 4x
Team (Plan mode)	약 1.4M	약 7x

GitHub Issue #13579에서 보고된 사례가 특히 인상적입니다. 7명 병렬 팀이 410K 토큰을 소비한 작업을, 1명 순차 세션으로 전환하니 20K 토큰으로 해결했습니다. 95%의 비용 절감입니다.

극단적인 사례로는 49개 subagent를 동시에 실행하여 분당 887K 토큰을 소비한 경우가 있습니다. 추정 비용은 $8,000에서 $15,000입니다.

실패 원인 1위: 파일 충돌

커뮤니티에서 가장 많이 보고되는 실패 원인은 파일 충돌입니다. 같은 파일을 2명의 에이전트가 동시에 편집하면 한쪽의 변경 사항이 덮어씌워집니다. 이 문제의 해결책은 명확합니다: 파일 소유권을 팀원별로 분리해야 합니다.

Claude Code 창시자 Boris Cherny는 10-15개의 독립 세션을 병렬로 운영하는 방식을 공유했습니다. 이는 팀이 아닌 독립 세션이라는 점이 핵심입니다. 상호 의존성이 없는 작업은 팀보다 독립 세션이 효율적입니다.

시스템 리소스 제약

Agent Team을 운영할 때 시스템 리소스도 고려해야 합니다.

정상 범위: teammate당 270-370MB RAM
비정상 사례: 129GB RAM 누수, CPU 100% 고정 보고 (GitHub Issue #11315)
16GB RAM: 3명 안정, 5명 위험 구간
32GB RAM: 5명까지 안정 운영 가능

작업 유형별 최적 팀 사이즈 가이드

모든 작업에 3명이 정답은 아닙니다. 작업의 성격에 따라 최적 인원이 달라집니다.

작업 유형	권장 인원	근거
코드 리뷰	3명	보안/성능/테스트 분리 (공식 예시)
새 모듈 개발	3-4명	FE/BE/Test 레이어 분리
디버깅 (경쟁 가설)	3-5명	앵커링 바이어스 방지 (공식 예시)
리서치/분석	2-3명	병렬 조사 + 교차 검증
대규모 리팩토링	3-4명	모듈별 소유권 분리
단순 버그 수정	1명	조정 오버헤드가 이점보다 큼
순차적 의존 작업	1명	멀티 에이전트 시 -39% ~ -70% 저하
대규모 병렬 테스트	5명 이상	독립적 검증 도메인

핵심 원칙은 독립성입니다. 작업을 독립적인 단위로 분해할 수 있고, 파일 소유권이 명확히 분리될 때만 멀티 에이전트의 이점이 발휘됩니다.

의사결정 프레임워크: 4가지 질문

팀 구성을 결정할 때 다음 4가지 질문에 답해보세요.

작업이 독립적으로 분해 가능한가? No라면 Solo가 정답입니다.
파일 소유권이 깔끔히 분리되는가? No라면 Solo 또는 2명이 적절합니다.
단일 에이전트로 45% 이상 해결 가능한가? Yes라면 Solo가 오히려 유리합니다.
비용 4배 증가를 감수할 가치가 있는가? No라면 Subagent를 사용하세요.

이 프레임워크를 적용하면 대부분의 일상적 개발 작업은 Solo 또는 2-3개의 Subagent가 최적입니다. Agent Team이 빛나는 순간은 코드 리뷰, 대규모 모듈 개발, 경쟁 가설 디버깅처럼 "상호 커뮤니케이션이 필수인 복잡한 작업"입니다.

비용 최적화 전략

Claude Code 에이전트 팀 인원을 결정할 때 비용은 무시할 수 없는 요소입니다.

Tier별 안정 운영 인원

API Tier	Rate Limit	안정 운영	한계
Tier 2	1,000 RPM	3명	5명 시 간헐적 제한
Tier 3	2,000 RPM	5명	8명까지 가능
Tier 4	4,000 RPM	8명 이상	비용 주의

비용 절감 팁

Lead만 Opus, Teammate는 Sonnet: Anthropic 리서치 시스템이 검증한 전략입니다. Lead의 판단력은 유지하면서 실행 비용을 절감합니다.
Plan mode 주의: Plan mode 에이전트는 Read-only이지만 토큰 소비가 7배까지 증가합니다. 꼭 필요한 경우에만 사용하세요.
Subagent 우선 고려: 상호 커뮤니케이션이 불필요하면 Team 대신 Subagent를 사용하세요. 동일 작업에서 토큰 소비가 절반 이하입니다.

마무리: 3명으로 시작하고, 필요할 때만 늘리세요

Anthropic 공식 문서, Google DeepMind 논문, 커뮤니티 실측 데이터가 모두 같은 결론을 가리킵니다. Claude Code 에이전트 팀 인원의 Sweet Spot은 3명이며, 최대 5명을 넘지 않는 것이 안전합니다.

핵심을 정리하면 다음과 같습니다.

3명이 6명보다 낫다 (Anthropic 공식)
4명 넘으면 조정 비용이 초선형 증가 (DeepMind 논문)
파일 소유권 분리가 성패를 가른다 (커뮤니티 합의)
비용 4배 증가를 감수할 가치가 있는지 먼저 판단하라

에이전트를 많이 투입하는 것이 능사가 아닙니다. 작업의 성격에 맞는 최소한의 팀으로 시작하고, 병목이 확인될 때만 인원을 추가하는 것이 Claude Code 에이전트 팀 운영의 정석입니다.

FAQ

Claude Code Agent Team과 Subagent의 차이는 무엇인가요?

Agent Team은 팀원 간 양방향 소통(SendMessage)이 가능한 협업 구조입니다. Subagent는 메인 에이전트가 작업을 위임하고 결과만 받는 일방향 구조입니다. 상호 커뮤니케이션이 필요한 작업은 Agent Team, 독립 병렬 작업은 Subagent가 적합합니다.

에이전트를 10명 이상 사용하면 안 되나요?

기술적으로 가능하지만 권장하지 않습니다. 4명을 넘으면 조정 비용이 초선형으로 증가하고, 파일 충돌 위험이 급격히 높아집니다. Boris Cherny(Claude Code 창시자)도 10-15개 세션을 병렬로 돌리지만 이는 Team이 아닌 독립 세션입니다.

16GB RAM MacBook에서 Agent Team을 돌릴 수 있나요?

3명까지는 안정적입니다. teammate당 270-370MB RAM을 사용하므로 3명이면 약 1GB 추가 메모리가 필요합니다. 5명부터는 메모리 부족이나 성능 저하 위험이 있으며, 32GB RAM 환경에서 5명까지 안정 운영 가능합니다.

Agent Team의 적정 태스크 수는 어떻게 되나요?

Anthropic 공식 문서에서 teammate당 5-6개 태스크를 권장합니다. 3명 팀이면 15-18개 태스크를 분배하게 됩니다. 태스크가 너무 적으면 팀을 구성할 필요가 없고, 너무 많으면 컨텍스트 윈도우가 포화됩니다.

Claude Code 에이전트 팀 인원 최적 가이드: 3명이 Sweet Spot인 이유 (2026)