본문으로 건너뛰기
블로그로 돌아가기
Kronos: 금융 시장을 위한 최초의 오픈소스 파운데이션 모델 분석
트렌드

Kronos: 금융 시장을 위한 최초의 오픈소스 파운데이션 모델 분석

6분 읽기0

Kronos: 금융 시장을 위한 최초의 오픈소스 파운데이션 모델 분석

GPT가 자연어를 이해하는 것처럼, 금융 시장의 캔들스틱 데이터를 이해하는 AI 모델이 등장했습니다. 칭화대학교와 난징대학교 연구진이 개발한 Kronos는 120억 개 이상의 K-line 레코드로 사전 학습된 최초의 금융 특화 오픈소스 파운데이션 모델입니다.

Kronos는 캔들스틱(OHLCV) 데이터를 토큰으로 변환하여 트랜스포머가 시장 패턴을 학습하는, 금융 도메인 특화 파운데이션 모델입니다.

Kronos란 무엇인가

Kronos는 금융 시장의 캔들스틱(K-line) 데이터를 위해 특별히 설계된 파운데이션 모델입니다. Yu Shi 외 6명의 연구진이 개발했으며, AAAI 2026 학회에 논문이 채택되었고(Vol. 40, No. 30, pp. 25366-25373), NeurIPS 2025 Workshop에서도 발표되었습니다.

기존의 범용 시계열 예측 모델(TSFM)들은 금융 데이터에서 좋은 성능을 내지 못했습니다. 금융 데이터 특유의 낮은 신호 대 잡음비(SNR), 강한 비정상성, 고차 의존성 때문입니다. Kronos는 이 문제를 "금융 시장의 언어"라는 관점에서 접근합니다.

GitHub에서 14,800개 이상의 스타와 2,900개 이상의 포크를 기록하며, MIT 라이선스로 완전 오픈소스입니다.

핵심 기술: 2단계 프레임워크

Kronos의 기술적 혁신은 두 단계로 구성된 프레임워크에 있습니다.

1단계: 특화 토크나이저

연속적인 다차원 K-line 데이터(Open, High, Low, Close, Volume)를 계층적 이산 토큰으로 양자화합니다. Binary Spherical Quantization(BSQ)과 계층적 서브토큰 구조를 사용하여 가격 동학과 거래 활동 패턴을 보존하면서 토큰화합니다.

2단계: 오토리그레시브 트랜스포머

Decoder-only 구조(GPT 스타일)를 채택하여, 45개 글로벌 거래소에서 수집한 120억 개 이상의 K-line 레코드로 사전 학습됩니다. 주식, 선물, 외환, 옵션, 암호화폐를 아우르며, 1분부터 격주간까지 다양한 시간 단위를 지원합니다.

벤치마크 성능 비교

Kronos의 zero-shot 벤치마크 결과는 기존 모델 대비 압도적인 성능 향상을 보여줍니다.

평가 항목개선 폭비교 대상
가격 시계열 예측 RankIC93% 향상TimeMoE (기존 최고 TSFM)
변동성 예측 MAE9% 개선기존 TSFM
합성 K-line 생성 충실도22% 향상기존 모델
수익률 예측 RankIC (zero-shot)27% 향상Moirai
수익률 예측 RankIC (full-shot)60% 향상DLinear
투자 시뮬레이션 수익률 (zero-shot)33% 향상기존 모델

특히 범용 시계열 모델인 TimeMoE 대비 93% 향상된 예측 정확도는, 금융 도메인 특화 사전 학습의 효과를 명확히 입증합니다.

모델 라인업과 활용 방법

Kronos는 Hugging Face에서 바로 다운로드할 수 있는 여러 크기의 모델을 제공합니다.

모델파라미터컨텍스트 길이공개 여부
Kronos-mini4.1M2,048공개
Kronos-small24.7M512공개
Kronos-base102.3M512공개
Kronos-large499.2M512비공개

Python 코드 몇 줄로 바로 예측을 실행할 수 있습니다:

from model import Kronos, KronosTokenizer, KronosPredictor

tokenizer = KronosTokenizer.from_pretrained("NeoQuasar/Kronos-Tokenizer-base")
model = Kronos.from_pretrained("NeoQuasar/Kronos-small")
predictor = KronosPredictor(model, tokenizer, max_context=512)

pred_df = predictor.predict(df=x_df, x_timestamp=x_ts, y_timestamp=y_ts, pred_len=120)

2025년 8월에는 파인튜닝 스크립트도 공개되어, Qlib 기반 A주 시장 데이터 예제와 멀티 GPU 학습, 백테스팅 파이프라인을 제공합니다.

실전 활용 시나리오

Kronos는 단순한 가격 예측을 넘어 다양한 금융 태스크에 활용할 수 있습니다.

  • 가격 시계열 예측: 주식, 암호화폐, 외환 등 다양한 자산의 미래 가격 추이 예측
  • 변동성 예측: 옵션 가격 책정과 리스크 관리를 위한 변동성 추정
  • 합성 데이터 생성: 백테스팅이나 전략 시뮬레이션을 위한 현실적인 시장 데이터 합성
  • 투자 전략 백테스팅: 파인튜닝 후 특정 시장에 최적화된 투자 시뮬레이션

BTC/USDT 24시간 예측 라이브 데모도 운영되고 있어 즉시 성능을 확인할 수 있습니다.

알아야 할 한계점

Kronos는 강력한 도구이지만, 명확한 한계가 있습니다.

  • 컨텍스트 길이 제약: small/base 모델은 512 토큰으로 제한되어 매우 긴 패턴 인식에는 한계가 있습니다
  • 블랙스완 예측 불가: 전례 없는 시장 충격이나 레짐 전환은 예측할 수 없습니다
  • 확률적 도구: 수익을 보장하는 도구가 아니라 확률적 예측을 제공하는 분석 도구입니다
  • 대형 모델 비공개: 가장 큰 Kronos-large(499M)는 아직 공개되지 않았습니다

금융 AI의 새로운 방향

Kronos는 LLM의 성공 공식을 금융 시계열에 적용한 중요한 이정표입니다. "금융 시장의 언어"라는 프레이밍으로 K-line을 토큰으로 변환하고, 시장 패턴을 자연어처럼 학습하는 접근법은 범용 모델이 해결하지 못한 금융 특화 문제를 효과적으로 해결합니다.

MIT 라이선스 오픈소스로 공개되어 개발자와 퀀트 연구자가 즉시 활용할 수 있으며, 파인튜닝을 통해 특정 시장이나 전략에 맞춤 최적화도 가능합니다.

자주 묻는 질문 (FAQ)

Q: Kronos를 실제 투자에 바로 사용할 수 있나요? A: Kronos는 확률적 예측 도구이며, 수익을 보장하지 않습니다. 투자 의사결정의 보조 도구로 활용하되, 단독으로 투자 판단에 사용하는 것은 권장하지 않습니다.

Q: 어떤 자산 유형을 지원하나요? A: 주식, 선물, 외환, 옵션, 암호화폐 등 캔들스틱(OHLCV) 데이터가 있는 모든 자산을 지원합니다. 45개 글로벌 거래소 데이터로 학습되었습니다.

Q: GPU 없이도 사용할 수 있나요? A: Kronos-mini(4.1M 파라미터)는 가벼운 모델로 CPU에서도 실행 가능합니다. 더 큰 모델은 GPU 사용을 권장합니다.

Q: 한국 주식 시장 데이터에도 적용 가능한가요? A: 네. 45개 글로벌 거래소 데이터로 사전 학습되었으며, 파인튜닝 스크립트를 통해 특정 시장에 최적화할 수 있습니다.

참고 자료