TradingAgents: UCLA·MIT가 만든 멀티 에이전트 AI 트레이딩 프레임워크 완전 분석

AI가 증권사를 통째로 운영한다면 어떤 모습일까요? 애널리스트가 보고서를 쓰고, 연구팀이 찬반 토론을 벌이고, 트레이더가 주문을 내리고, 리스크 매니저가 포지션을 점검하는 그 모든 과정을 LLM(대형 언어 모델) 에이전트들이 대신한다면요?

UCLA와 MIT 연구팀이 이 질문에 실제로 답했습니다. 2024년 12월 공개된 TradingAgents는 실제 트레이딩 펌의 조직 구조를 7개 LLM 에이전트로 시뮬레이션한 오픈소스 멀티 에이전트 금융 트레이딩 프레임워크입니다. 발표 이후 GitHub 스타가 빠르게 쌓이며 AI 금융 연구 커뮤니티의 주목을 받고 있습니다.

이 글에서는 TradingAgents의 아키텍처, 실제 성과 수치, 기술 스택, 그리고 반드시 알아야 할 한계점까지 균형 잡힌 시각으로 분석합니다.

TradingAgents란 무엇인가요?

TradingAgents는 실제 트레이딩 펌의 조직 구조를 모방한 멀티 에이전트 LLM 프레임워크입니다. 여러 AI 에이전트가 각자의 역할을 맡아 협업하면서 주식 투자 의사결정을 내립니다. 연구 목적의 오픈소스 프로젝트로, UCLA의 Yijia Xiao·Wei Wang과 MIT의 Di Luo·Edward Sun이 Tauric Research 주도로 개발했습니다.

핵심 아이디어는 단순합니다. 기존의 단일 LLM 트레이딩 시스템이 "한 명의 제너럴리스트"에게 모든 것을 맡기는 방식이라면, TradingAgents는 "전문가 팀"이 분업해서 의사결정을 내리는 방식을 택했습니다.

논문은 arXiv(2412.20138)에 공개되어 있으며, 코드는 GitHub(TauricResearch/TradingAgents)에서 누구나 클론할 수 있습니다.

7개 에이전트, 5개 팀: 아키텍처 심층 분석

TradingAgents의 가장 독특한 점은 실제 트레이딩 펌의 조직도를 그대로 가져왔다는 것입니다. 단순히 "AI 여러 개를 붙여놓은 것"이 아니라, 각 에이전트에게 명확한 역할과 정보 흐름을 부여했습니다.

팀 구조와 역할

1단계: 애널리스트 팀 (Analysts Team)

네 명의 전문 애널리스트가 서로 다른 각도에서 시장을 분석합니다.

Fundamentals Analyst: 재무제표, 밸류에이션, 기업 펀더멘털을 분석합니다. PER, PBR, 매출 성장률 등 정량 지표에 집중합니다.
Sentiment Analyst: 소셜 미디어, 투자자 심리, 시장 분위기를 스캔합니다. 공포·탐욕 지수나 공매도 비율 같은 심리 데이터를 활용합니다.
News Analyst: 최신 뉴스, 공시, 이벤트 리스크를 추적합니다. 어닝 서프라이즈나 M&A 뉴스처럼 주가에 즉각 영향을 주는 이벤트를 감지합니다.
Technical Analyst: 차트 패턴, 이동평균선, 모멘텀 지표를 분석합니다. MACD, RSI, 볼린저밴드 같은 기술적 지표를 해석합니다.

2단계: 리서치 팀 (Research Team)

Researcher 에이전트가 4명의 애널리스트 보고서를 종합한 후, Bull(강세) 연구원과 Bear(약세) 연구원이 공개 토론을 벌입니다. 이 토론 구조가 단순 집계와 다른 TradingAgents만의 특징입니다. 한쪽으로 쏠린 편향을 교정하고, 상반된 근거를 모두 검토해서 더 균형 잡힌 시각을 만들어냅니다.

3단계: 트레이더 (Trader)

리서치 팀의 종합 보고서를 받아 실제 매매 신호(매수/매도/관망)와 포지션 크기를 결정합니다.

4단계: 리스크 관리 (Risk Management)

트레이더의 결정을 독립적으로 검토합니다. 포트폴리오 리스크, 최대 손실 허용 범위, 변동성 수준을 기준으로 트레이더의 주문을 승인하거나 수정합니다.

5단계: 펀드 매니저 (Fund Manager)

최종 의사결정자입니다. 리스크 관리팀의 검토를 거친 주문에 최종 승인을 내립니다.

LangGraph 기반 워크플로우

이 다단계 협업 구조는 LangGraph를 통해 구현됩니다. LangGraph는 LangChain 팀이 만든 에이전트 오케스트레이션 프레임워크로, 여러 에이전트 간의 정보 흐름과 상태 관리를 그래프 형태로 정의할 수 있습니다. TradingAgents는 이를 통해 "애널리스트 → 리서치 → 트레이더 → 리스크 → 펀드 매니저"로 이어지는 파이프라인을 체계적으로 관리합니다.

벤치마크 성과: 숫자로 본 TradingAgents

논문에서 제시한 성과 수치들이 주목을 받고 있습니다.

주요 성과 수치

지표	TradingAgents	Buy & Hold 베이스라인
AAPL 누적 수익률	26.62%	2.05%
연환산 수익률 (최대)	30.5%	—
Sharpe Ratio	8.21	—

AAPL(애플) 주식 기준으로, TradingAgents는 단순 보유 전략(Buy & Hold) 대비 약 13배 높은 수익률을 기록했습니다. MACD, KDJ+RSI, ZMR, SMA 등 5개 전통적인 기술적 분석 전략도 모두 상회했습니다.

반드시 알아야 할 맥락

이 수치들은 인상적이지만, 그대로 받아들이기 전에 몇 가지 중요한 맥락을 짚어야 합니다.

3개월 벤치마크의 한계: 테스트 기간이 약 3개월에 불과합니다. 단기 성과가 장기적으로 유지된다는 보장이 없으며, 특히 다양한 시장 국면(bull/bear/sideways)을 모두 커버하지 못했습니다.

Sharpe Ratio 8.21의 이례성: 통상적으로 Sharpe Ratio 2 이상이면 매우 우수한 전략으로 평가받습니다. 8.21이라는 수치는 현실적으로 매우 이례적인 값으로, 과적합(overfitting) 또는 테스트 환경의 특수성을 의심해볼 필요가 있습니다.

LLM의 방향성 편향: 연구팀 스스로도 인정하는 한계로, LLM은 상승장에서 과도하게 보수적이고 하락장에서 반대로 공격적인 경향이 있습니다. 이는 LLM이 학습 데이터의 패턴을 반영하기 때문으로 추정됩니다.

기술 스택과 설치 방법

기술 스택

오케스트레이션: LangGraph
언어: Python
LLM 프로바이더: GPT-5.x (OpenAI), Gemini 3.x (Google), Claude 4.x (Anthropic), Grok 4.x (xAI), Ollama (로컬 모델)
데이터 소스: FinnHub, Alpha Vantage
최신 버전: v0.2.2 (2026년 3월) — 팩토리 패턴 멀티 프로바이더, 5단계 레이팅 시스템, OpenAI Responses API 지원

v0.2.2에서 도입된 팩토리 패턴은 LLM 프로바이더를 쉽게 교체할 수 있게 해줍니다. 예를 들어 분석 에이전트에는 비용이 저렴한 로컬 Ollama 모델을, 최종 의사결정 에이전트에는 최고 성능의 상용 모델을 조합해서 사용할 수 있습니다.

기본 설치 방법

# 1. 저장소 클론
git clone https://github.com/TauricResearch/TradingAgents.git
cd TradingAgents

# 2. 패키지 설치 (editable 모드)
pip install -e .

# 3. 환경 변수 설정 (.env 파일 생성)
OPENAI_API_KEY=your_openai_key
FINNHUB_API_KEY=your_finnhub_key
ALPHA_VANTAGE_API_KEY=your_alpha_vantage_key

Python API 기본 사용 예시

from tradingagents.graph.trading_graph import TradingAgentsGraph
from tradingagents.default_config import DEFAULT_CONFIG

# 설정 구성
config = DEFAULT_CONFIG.copy()
config["llm_provider"] = "openai"
config["deep_think_llm"] = "gpt-5"
config["quick_think_llm"] = "gpt-4o-mini"

# 그래프 초기화
ta = TradingAgentsGraph(debug=True, config=config)

# 분석 실행 (AAPL, 2025-12-01 기준)
state, decision = ta.propagate("AAPL", "2025-12-01")
print(decision)

한계점과 주의사항: 균형 잡힌 시각

TradingAgents는 흥미로운 연구 프로젝트이지만, 실제 투자에 활용하려는 분이라면 반드시 아래 한계점을 인지해야 합니다.

연구 목적 전용

프로젝트 README에 명시되어 있듯, TradingAgents는 교육·연구 목적으로만 사용해야 합니다. 실제 자금으로 운용하기 위한 프로덕션 시스템이 아닙니다. 연구팀 자신도 실제 투자에 사용하지 말 것을 권고하고 있습니다.

API 비용 문제

7개의 LLM 에이전트가 매 거래 결정마다 순차적으로 추론을 수행하므로, API 호출 비용이 상당히 높습니다. 실시간으로 수백 개 종목을 모니터링하는 방식으로는 사실상 운영이 불가능합니다.

실시간 환경 미검증

현재 벤치마크는 모두 과거 데이터(백테스트) 기반입니다. 슬리피지, 유동성 제약, 시장 충격 비용 같은 실거래 요소가 반영되어 있지 않습니다.

과적합 우려

짧은 테스트 기간과 특정 종목(AAPL) 중심의 벤치마크는 과적합 가능성을 높입니다. 다양한 종목·기간·시장 국면에서 동일한 성과가 재현된다는 보장이 없습니다.

후속 연구와 전망

TradingAgents의 성공은 여러 후속 연구로 이어졌습니다.

Trading-R1 (2026년 1월): 강화학습(RL)을 접목한 후속 연구입니다. LLM의 추론을 강화학습으로 파인튜닝해서 트레이딩 의사결정의 일관성을 개선하는 것을 목표로 합니다.

TradingAgents-CN: 중국 A주 시장에 특화된 버전입니다. 중국 금융 시장의 고유한 규제·데이터·시장 구조를 반영했습니다.

멀티 에이전트 AI 트레이딩 연구의 큰 방향은 세 가지로 정리됩니다. 첫째, LLM과 강화학습의 결합을 통한 의사결정 품질 개선. 둘째, 실시간 데이터 처리와 저지연 실행 환경 구현. 셋째, 다양한 자산 클래스(채권, 외환, 파생상품)로의 확장입니다.

마무리

TradingAgents는 "AI가 트레이딩 펌의 역할을 수행할 수 있는가"라는 질문에 흥미로운 첫 번째 답을 제시했습니다. 실제 증권사의 조직 구조를 그대로 모방한 멀티 에이전트 아키텍처, LangGraph 기반의 체계적인 워크플로우, 그리고 전통 전략을 상회하는 백테스트 성과는 분명히 주목할 만합니다.

하지만 연구 목적 프레임워크라는 본질적 한계, 짧은 테스트 기간, 높은 API 비용, 실시간 환경 미검증은 실용적 활용에 있어 여전히 큰 장벽입니다. TradingAgents를 AI 투자 연구와 학습의 출발점으로 활용하되, 실제 자금 운용에는 신중한 접근이 필요합니다.

오픈소스로 공개된 만큼, 연구자와 개발자라면 직접 코드를 뜯어보고 자신만의 에이전트 조합을 실험해볼 수 있습니다. AI 금융의 가능성과 한계를 직접 체험하고 싶다면, TradingAgents는 훌륭한 학습 도구가 될 것입니다.

자주 묻는 질문 (FAQ)

Q: TradingAgents를 실제 주식 투자에 사용할 수 있나요?

사용하지 않는 것을 강력히 권장합니다. TradingAgents는 연구·교육 목적으로만 설계된 프레임워크이며, 개발팀 스스로도 실제 투자에 사용하지 말 것을 명시하고 있습니다. 백테스트 성과가 미래 수익을 보장하지 않으며, 실거래 비용과 시장 충격이 반영되지 않았습니다.

Q: 어떤 LLM을 사용하면 가장 좋은 성과를 낼 수 있나요?

v0.2.2 기준으로 GPT-5, Gemini 3, Claude 4, Grok 4 등 최신 모델을 모두 지원합니다. 다만 성능은 모델보다 데이터 품질과 에이전트 프롬프트 설계에 더 크게 영향을 받습니다. 비용을 고려한다면 팩토리 패턴을 활용해 역할별로 다른 모델을 조합하는 방식을 추천합니다.

Q: TradingAgents를 실행하려면 얼마나 많은 API 비용이 드나요?

7개 에이전트가 각각 LLM 추론을 수행하므로 단일 분석당 비용이 상당합니다. GPT-5 같은 고성능 모델을 모든 에이전트에 사용하면 하루 수십 달러 이상이 발생할 수 있습니다. Ollama 같은 로컬 모델을 일부 에이전트에 활용하면 비용을 크게 줄일 수 있습니다.

Q: FinnHub, Alpha Vantage 외에 다른 데이터 소스를 추가할 수 있나요?

네, 가능합니다. LangGraph 기반 아키텍처이므로 커스텀 데이터 소스 연동이 상대적으로 용이합니다. 한국 주식 데이터를 활용하려면 한국투자증권 Open API나 KRX 공공 데이터 포털과 연동하는 방식으로 확장할 수 있습니다.

Q: TradingAgents와 일반 알고리즘 트레이딩의 차이점은 무엇인가요?

일반 알고리즘 트레이딩은 사전에 정의된 규칙(예: 20일 이동평균 돌파 시 매수)에 따라 기계적으로 실행됩니다. TradingAgents는 LLM의 자연어 추론 능력을 활용해 뉴스, 공시, 시장 심리 같은 비정형 데이터를 해석하고, 여러 에이전트의 토론을 통해 의사결정을 내린다는 점에서 근본적으로 다른 접근법입니다.

TradingAgents: UCLA·MIT가 만든 멀티 에이전트 AI 트레이딩 프레임워크 완전 분석

TradingAgents: UCLA·MIT가 만든 멀티 에이전트 AI 트레이딩 프레임워크 완전 분석

TradingAgents란 무엇인가요?

7개 에이전트, 5개 팀: 아키텍처 심층 분석

팀 구조와 역할

LangGraph 기반 워크플로우

벤치마크 성과: 숫자로 본 TradingAgents

주요 성과 수치

반드시 알아야 할 맥락

기술 스택과 설치 방법

기술 스택

기본 설치 방법

Python API 기본 사용 예시

한계점과 주의사항: 균형 잡힌 시각

연구 목적 전용

API 비용 문제

실시간 환경 미검증

과적합 우려

후속 연구와 전망

마무리

자주 묻는 질문 (FAQ)

Q: TradingAgents를 실제 주식 투자에 사용할 수 있나요?

Q: 어떤 LLM을 사용하면 가장 좋은 성과를 낼 수 있나요?

Q: TradingAgents를 실행하려면 얼마나 많은 API 비용이 드나요?

Q: FinnHub, Alpha Vantage 외에 다른 데이터 소스를 추가할 수 있나요?

Q: TradingAgents와 일반 알고리즘 트레이딩의 차이점은 무엇인가요?

참고 자료

댓글 (0)

관련 글

댓글 (0)

관련 글