Anthropic Managed Agents 아키텍처 분석 — 뇌와 손의 분리로 AI 에이전트 스케일링하기

2026년 4월 8일, Anthropic이 "Scaling Managed Agents: Decoupling the brain from the hands"라는 제목의 엔지니어링 블로그를 공개했습니다. Claude Platform의 퍼블릭 베타로 출시된 Managed Agents의 핵심 아키텍처를 상세히 설명하는 이 글은, AI 에이전트를 프로덕션 레벨로 스케일링하기 위한 설계 원칙을 제시합니다.

이 글에서는 Anthropic의 아키텍처를 분석하고, 왜 "뇌와 손의 분리"가 AI 에이전트의 미래를 결정짓는 핵심 설계 결정인지 살펴보겠습니다.

Managed Agents란 무엇인가

Managed Agents는 Claude Platform에서 사용자를 대신해 장기간 실행되는(long-horizon) 에이전트를 호스팅하는 서비스입니다. Anthropic은 이를 운영체제의 하드웨어 가상화에 비유합니다.

운영체제가 물리 하드웨어를 추상화해서 프로그래머가 디스크나 메모리를 직접 관리하지 않아도 되게 만든 것처럼, Managed Agents는 에이전트 실행에 필요한 인프라(컴퓨팅, 스토리지, 네트워크)를 추상화합니다.

핵심적으로, 이 서비스는 "아직 생각되지 않은 프로그램(programs as yet unthought of)" 문제를 해결합니다. 에이전트가 어떤 도구를 어떤 순서로 사용할지 미리 알 수 없기 때문에, 인프라 레이어가 이를 유연하게 지원해야 한다는 것입니다.

3가지 가상화 컴포넌트: Session, Harness, Sandbox

Managed Agents의 아키텍처는 세 가지 핵심 컴포넌트로 구성됩니다. 각각의 역할과 특성이 명확히 분리되어 있다는 점이 설계의 핵심입니다.

Session — 영속적인 기억

Session은 에이전트가 실행되는 동안 일어난 모든 일의 기록입니다. Append-only 로그 형태로 작동하며, Claude의 컨텍스트 윈도우 바깥에 존재하는 영속적인 저장소입니다.

Session의 핵심 특성은 다음과 같습니다:

Append-only: 한번 기록된 이벤트는 변경되지 않습니다
getEvents() 인터페이스: 선택적으로 이벤트를 조회할 수 있습니다
되감기, 슬라이싱, 위치 접근: 유연한 이벤트 탐색이 가능합니다
컨텍스트 윈도우 독립: Claude의 컨텍스트 제한과 무관하게 전체 히스토리를 유지합니다

이는 "복구 가능한 저장소(Session)"와 "컨텍스트 엔지니어링(Harness)"을 완전히 분리하는 설계입니다. Harness가 Session의 이벤트를 변환해서 Claude의 컨텍스트 윈도우에 전달하기 때문에, Session 자체가 컨텍스트 관리의 복잡성을 떠안지 않습니다.

Harness — 상태 없는 오케스트레이터

Harness는 Claude를 호출하고 도구 호출을 라우팅하는 루프입니다. 핵심적으로 상태가 없습니다(stateless). 이것은 의도적인 설계 결정입니다.

상태가 없다는 것은 Harness가 언제든 크래시하고 복구될 수 있다는 의미입니다. Session 로그에 모든 상태가 기록되어 있으므로, 새로운 Harness 인스턴스가 Session을 읽고 이전 지점부터 재개할 수 있습니다.

Harness의 역할은 다음과 같습니다:

Claude API 호출 및 응답 처리
도구 호출을 적절한 Sandbox로 라우팅
Session 이벤트를 Claude의 컨텍스트 윈도우에 맞게 변환
실패 시 자동 복구 및 재개

Sandbox — 일회용 실행 환경

Sandbox는 에이전트가 코드를 실행하는 격리된 환경입니다. 컨테이너 기반으로 운영되며, Anthropic의 표현을 빌리면 "가축(cattle)"이지 "반려동물(pet)"이 아닙니다.

이 비유가 의미하는 바는 명확합니다. Sandbox 컨테이너는 언제든 버리고 새로 만들 수 있어야 합니다. 특정 컨테이너에 의존하는 상태가 있으면 안 됩니다.

Brain vs Hands — 핵심 설계 결정

Managed Agents 아키텍처의 가장 중요한 설계 결정은 "뇌(Brain)"와 "손(Hands)"의 분리입니다.

Brain = Claude + Harness (추론)
Hands = Sandbox + Tools (실행)
Session = Event Log (기억)

각 컴포넌트가 독립적으로 실패하고 교체될 수 있다는 점이 핵심입니다. 뇌가 고장나면 새 뇌를 붙이면 되고, 손이 고장나면 새 손을 붙이면 됩니다. Session 로그가 있기 때문에 어디서든 이어서 작업할 수 있습니다.

인터페이스는 놀라울 정도로 단순합니다:

execute(name, input) → string

모든 도구(손)는 이 인터페이스를 구현합니다. Harness 입장에서는 Sandbox가 컨테이너인지, 스마트폰인지, 포켓몬 에뮬레이터인지 알 필요가 없습니다. 이것이 진정한 추상화입니다.

Pets vs Cattle — 모놀리식에서 분리 아키텍처로

Anthropic은 초기 단계에서 모든 컴포넌트를 하나의 컨테이너에 넣는 방식을 시도했습니다. Session, Harness, Sandbox가 모두 같은 프로세스에서 실행되는 "반려동물(Pet)" 방식이었습니다.

이 방식의 문제점은 명확했습니다:

실패 = 전체 손실: 컨테이너가 죽으면 Session 데이터까지 날아감
디버깅 어려움: 어떤 컴포넌트가 문제인지 분리하기 어려움
스케일링 제한: 각 에이전트가 전용 컨테이너를 점유
리소스 낭비: 에이전트가 대기 중일 때도 컨테이너가 리소스를 점유

이를 해결하기 위해 모든 컴포넌트를 분리하고, 컨테이너를 "가축(Cattle)"으로 전환했습니다. 결과는 인상적이었습니다.

성능 개선 수치

분리 아키텍처로 전환한 후의 성능 개선은 상당했습니다:

p50 TTFT(Time To First Token): 약 60% 감소
p95 TTFT: 90% 이상 감소
Lazy Initialization: 컨테이너는 실제로 필요할 때만 프로비저닝

특히 p95(상위 5% 느린 요청)에서 90% 이상의 개선은 꼬리 지연(tail latency) 문제를 사실상 해결한 것입니다. 이는 프로덕션 환경에서 사용자 경험에 직접적인 영향을 미치는 지표입니다.

Lazy initialization은 비용과 성능 모두를 개선합니다. 에이전트가 실제로 코드를 실행해야 할 때만 Sandbox 컨테이너를 프로비저닝하므로, 리소스 낭비가 줄어듭니다.

보안 모델 — 분리가 가져온 자연스러운 강화

Brain과 Hands의 분리는 보안에도 자연스러운 이점을 제공합니다.

크레덴셜 격리

크레덴셜은 절대 Sandbox에 도달하지 않습니다. 이것은 설계의 기본 원칙입니다.

Git 토큰: 초기화 시 로컬 리모트에 와이어링됩니다. 에이전트는 토큰을 직접 다루지 않습니다
MCP 도구: 전용 프록시를 통해 세션 스코프 토큰으로 접근합니다
OAuth 토큰: 보안 볼트에 저장되며, Sandbox 환경에 노출되지 않습니다

이 구조에서는 Sandbox가 탈취되더라도 크레덴셜에 접근할 수 없습니다. 뇌와 손이 분리되어 있기 때문에, 실행 환경의 보안 침해가 인증 정보의 유출로 이어지지 않습니다.

Session as External Context — 장기 에이전트의 핵심

장기간 실행되는 에이전트의 가장 큰 도전 중 하나는 컨텍스트 관리입니다. Claude의 컨텍스트 윈도우는 유한하지만, 에이전트의 실행 시간은 이를 초과할 수 있습니다.

Anthropic의 해결책은 Session을 "외부 컨텍스트(External Context)"로 사용하는 것입니다.

Session 로그는 Claude의 컨텍스트 윈도우 바깥에 존재하는 컨텍스트 객체입니다. getEvents() 인터페이스를 통해 필요한 이벤트만 선택적으로 가져올 수 있으며, 되감기, 슬라이싱, 위치 접근이 가능합니다.

Harness가 Session의 이벤트를 Claude의 컨텍스트 윈도우에 전달하기 전에 변환(transform)하는 과정이 핵심입니다. 이를 통해 복구 가능한 저장소(Session)와 컨텍스트 엔지니어링(Harness)이 완전히 분리됩니다.

이 설계는 에이전트가 수 시간, 수 일에 걸쳐 작업을 수행하면서도 관련 컨텍스트를 유지할 수 있게 해줍니다.

Many Brains, Many Hands — 진짜 스케일링

분리 아키텍처의 궁극적인 이점은 "Many Brains, Many Hands" 패턴입니다.

여러 개의 Brain

Harness가 stateless이기 때문에, 여러 개의 Harness 인스턴스를 동시에 실행할 수 있습니다. 이는 수평 확장을 자연스럽게 가능하게 합니다.

여러 개의 Hands

각 Hand(도구)는 execute(name, input) → string 인터페이스를 구현합니다. MCP 서버, 커스텀 도구, Anthropic의 자체 도구 등 어떤 것이든 이 인터페이스만 구현하면 됩니다.

Anthropic의 표현을 빌리면, "Harness는 Sandbox가 컨테이너인지, 폰인지, 포켓몬 에뮬레이터인지 모릅니다." 이것이 진정한 추상화의 힘입니다.

Brain 간 Hand 공유

더 나아가, 뇌끼리 손을 넘길 수도 있습니다. 이는 멀티 에이전트 협업의 기반이 됩니다. 한 에이전트가 특정 도구를 사용한 후, 다른 에이전트에게 해당 도구의 결과와 함께 작업을 넘길 수 있습니다.

비즈니스 관점

Managed Agents의 비즈니스 모델과 현황을 정리하면 다음과 같습니다.

가격 정책

표준 API 토큰 가격 (입력/출력 토큰)
세션 시간당 $0.08 추가 과금

세션 시간 과금은 컴퓨팅 리소스 점유에 대한 비용으로, 에이전트가 활성화된 시간에 대해서만 과금됩니다.

초기 채택 기업

Notion: 워크스페이스 자동화
Rakuten: 이커머스 에이전트
Asana: 프로젝트 관리 자동화

이들 기업은 배포 속도가 10배 빨라졌다고 보고하고 있습니다.

로드맵

멀티 에이전트 협업(coordination)과 자기 평가(self-evaluation) 기능은 현재 리서치 프리뷰 단계입니다.

AI 에이전트 아키텍처에 주는 시사점

Anthropic의 Managed Agents 아키텍처는 AI 에이전트를 프로덕션에 배포하려는 모든 팀에게 중요한 시사점을 줍니다.

1. 모놀리식은 스케일하지 않는다

모든 컴포넌트를 하나의 프로세스에 넣는 방식은 프로토타입에서는 작동하지만, 프로덕션에서는 실패합니다. 컴포넌트 분리는 선택이 아니라 필수입니다.

2. 상태의 외부화가 핵심이다

에이전트의 상태(기억)를 외부에 영속적으로 저장함으로써, 실행 환경(Harness, Sandbox)을 stateless로 만들 수 있습니다. 이것이 복구, 스케일링, 디버깅의 기반입니다.

3. 단순한 인터페이스가 최고의 추상화다

execute(name, input) → string이라는 단순한 인터페이스가 어떤 도구든 통합할 수 있게 합니다. 복잡한 프로토콜이 아니라 단순한 계약이 확장성을 만듭니다.

4. 보안은 아키텍처 설계에서 나온다

보안을 "추가 레이어"로 덧씌우는 것이 아니라, 컴포넌트 분리라는 아키텍처 결정 자체에서 보안이 자연스럽게 강화됩니다.

FAQ

Q: Managed Agents는 무료인가요?

A: 아닙니다. 표준 API 토큰 가격에 세션 시간당 $0.08가 추가 과금됩니다. 에이전트가 활성화된 시간에 대해서만 세션 요금이 부과됩니다.

Q: 기존 Claude API 사용자도 Managed Agents를 사용할 수 있나요?

A: 네. 2026년 4월 8일부터 퍼블릭 베타로 제공됩니다. Claude Platform에서 접근할 수 있습니다.

Q: Session, Harness, Sandbox의 차이가 무엇인가요?

A: Session은 영속적인 이벤트 로그(기억), Harness는 상태 없는 오케스트레이터(추론 루프), Sandbox는 일회용 실행 환경(코드 실행)입니다. 각각이 독립적으로 실패하고 복구될 수 있습니다.

Q: MCP(Model Context Protocol)와 어떤 관계인가요?

A: Managed Agents는 MCP 서버를 도구(Hand)로 지원합니다. MCP 도구는 전용 프록시를 통해 세션 스코프 토큰으로 접근하므로, 보안도 강화됩니다.

Q: 멀티 에이전트 협업은 가능한가요?

A: 기본적으로 "뇌끼리 손을 넘기는" 패턴이 지원됩니다. 멀티 에이전트 협업(coordination)과 자기 평가(self-evaluation) 기능은 현재 리서치 프리뷰 단계입니다.

Q: 어떤 기업이 사용하고 있나요?

A: 초기 채택 기업으로 Notion, Rakuten, Asana가 언급되었으며, 배포 속도가 10배 빨라졌다고 보고하고 있습니다.

결론

Anthropic의 Managed Agents 아키텍처는 AI 에이전트 인프라의 중요한 전환점을 보여줍니다. 운영체제가 하드웨어를 추상화해서 소프트웨어 혁명을 일으킨 것처럼, 에이전트 인프라도 실행 환경의 추상화를 통해 다음 단계로 나아가고 있습니다.

"뇌와 손의 분리"라는 단순하지만 강력한 설계 원칙이, 성능, 보안, 스케일링, 비용 효율이라는 네 마리 토끼를 동시에 잡는 핵심이었습니다. 이 아키텍처 패턴은 Anthropic뿐만 아니라, AI 에이전트를 구축하는 모든 팀에게 참고할 만한 레퍼런스가 될 것입니다.

원문 출처 https://www.anthropic.com/engineering/managed-agents

Anthropic Managed Agents 아키텍처 분석 — 뇌와 손의 분리로 AI 에이전트 스케일링하기

Anthropic Managed Agents 아키텍처 분석 — 뇌와 손의 분리로 AI 에이전트 스케일링하기

Managed Agents란 무엇인가

3가지 가상화 컴포넌트: Session, Harness, Sandbox

Session — 영속적인 기억

Harness — 상태 없는 오케스트레이터

Sandbox — 일회용 실행 환경

Brain vs Hands — 핵심 설계 결정

Pets vs Cattle — 모놀리식에서 분리 아키텍처로

성능 개선 수치

보안 모델 — 분리가 가져온 자연스러운 강화

크레덴셜 격리

Session as External Context — 장기 에이전트의 핵심

Many Brains, Many Hands — 진짜 스케일링

여러 개의 Brain

여러 개의 Hands

Brain 간 Hand 공유

비즈니스 관점

가격 정책

초기 채택 기업

로드맵

AI 에이전트 아키텍처에 주는 시사점

1. 모놀리식은 스케일하지 않는다

2. 상태의 외부화가 핵심이다

3. 단순한 인터페이스가 최고의 추상화다

4. 보안은 아키텍처 설계에서 나온다

FAQ

Q: Managed Agents는 무료인가요?

Q: 기존 Claude API 사용자도 Managed Agents를 사용할 수 있나요?

Q: Session, Harness, Sandbox의 차이가 무엇인가요?

Q: MCP(Model Context Protocol)와 어떤 관계인가요?

Q: 멀티 에이전트 협업은 가능한가요?

Q: 어떤 기업이 사용하고 있나요?

결론

댓글 (0)

관련 글

댓글 (0)

관련 글