Claude Opus 4.8 출시: 가격 그대로, 성능은 한 단계 위 — Claude Code 관점 완전 정리
Claude Opus 4.8 출시: 가격 그대로, 성능은 한 단계 위 — Claude Code 관점 완전 정리
Anthropic이 2026년 5월 28일 Claude Opus 4.8을 발표하고 당일 즉시 정식 출시(GA)했어요. 가격은 전작 Opus 4.7과 동일하게 유지하면서 코딩 벤치마크와 수학 추론 모두 끌어올렸고, 클로드 코드(Claude Code) 사용자를 위한 굵직한 신기능도 함께 나왔습니다.
이 글에서는 리서치 리포트 사실만 토대로 — 추측 없이 — 무엇이 얼마나 달라졌는지 정리해드릴게요.
한눈에 보는 Opus 4.8 vs 4.7 비교
숫자부터 보는 게 빠릅니다.
| 항목 | Opus 4.8 | Opus 4.7 | 변화 |
|---|---|---|---|
| Input 가격 (1M tokens) | $5 | $5 | 동일 |
| Output 가격 (1M tokens) | $25 | $25 | 동일 |
| SWE-bench Verified | 88.6% | 87.6% | +1.0%p |
| SWE-bench Pro | 69.2% | 64.3% | +4.9%p |
| USAMO 2026 (수학) | 96.7% | 69.3% | +27.4%p |
| GraphWalks @1M (장문 이해) | 68.1% | 40.3% | +27.8%p |
| 컨텍스트 윈도우 | 1M 토큰 (표준 가격) | — | 강조 |
| 최대 출력 | 128K 토큰 | — | — |
| 모델 ID | claude-opus-4-8 | claude-opus-4-7 | — |
가격 동결 + 성능 향상이라는 조합은 실무자 입장에서 가장 좋은 소식이에요.
벤치마크: 코딩과 수학에서 두드러진 진전
SWE-bench — 실제 GitHub 이슈 해결 능력
SWE-bench Verified 88.6%는 현재 공개된 주요 모델 중 최상위권이에요. Opus 4.7의 87.6%에서 1%p 오른 수치인데, 절대값 자체가 높다 보니 이 구간에서 1%p 올리는 게 쉽지 않습니다.
더 주목할 건 SWE-bench Pro예요. 4.7의 64.3%에서 4.8이 69.2%로 올랐습니다. SWE-bench Pro는 더 어려운 실제 코드베이스 문제로 구성되어 있어서, 이 격차가 실제 복잡한 프로젝트에서 체감 차이로 이어질 가능성이 높아요.
USAMO 2026 — 수학 추론의 도약
경쟁 수학 올림피아드 문제(USAMO 2026) 정확도가 4.7의 69.3%에서 4.8에서 96.7%로 올랐어요. 절대적으로 큰 폭입니다. 코드 생성 외에도 복잡한 알고리즘 설계나 논리 추론이 필요한 작업에서 체감할 수 있는 개선이에요.
GraphWalks @1M — 긴 컨텍스트 이해력
100만 토큰 컨텍스트에서의 장문 그래프 탐색 정확도(F1)가 40.3%에서 68.1%로 올랐어요. 대규모 코드베이스를 한 번에 다루거나 긴 대화 히스토리 속에서 참조를 정확히 찾는 능력이 실질적으로 높아진 거예요.
가격 구조: 달라진 것과 알아둘 것
기본 가격은 Opus 4.7과 동일합니다.
- Input: $5 / 1M tokens
- Output: $25 / 1M tokens
- Prompt caching: 최대 90% 절감
- Batch: 50% 절감
Fast mode (research preview)는 "토큰당 2배 단가, 이전 모델 fast mode 대비 3배 저렴"으로 공식 문서에 기재되어 있어요. 일부 테크 미디어에서 "$10/$50"으로 계산해 보도하고 있지만, 이는 미디어 측 계산값이고 공식 문서에서 절대 수치로 명시한 건 아니니 실제 프로젝트 예산 계산 시엔 공식 pricing 페이지를 직접 확인하는 게 좋습니다.
1M 토큰 컨텍스트를 표준 가격으로 기본 제공한다는 점도 이번 출시의 강조 포인트예요. Claude API, Amazon Bedrock, Google Cloud Vertex AI 모두 동일하게 적용됩니다. (Microsoft Foundry는 200K 제한)
Claude Code 신기능: 실무에서 바로 쓸 수 있는 변화
이번 출시에서 Claude Code 사용자에게 가장 직접적인 변화는 세 가지예요.
1. Dynamic Workflows (research preview)
수백 개의 병렬 서브에이전트를 통해 복잡한 작업을 관리하는 기능이에요. Anthropic 공식 문서에 따르면 Claude Code + Opus 4.8 조합으로 수십만 라인 규모의 코드베이스 마이그레이션을 kickoff부터 merge까지, 기존 테스트 스위트를 기준 삼아 수행했다고 해요.
아직 research preview 단계라 모든 사용자에게 동일하게 열려 있지 않을 수 있지만, 방향은 명확합니다. "혼자 하나씩" 처리하던 에이전트가 "팀처럼 병렬로" 처리하는 구조로 진화하는 거예요.
2. Fast mode (research preview)
API 파라미터로 speed: "fast"를 설정하면 동일 모델에서 출력 토큰/초를 최대 2.5배 높일 수 있어요. 실시간 코드 완성이나 빠른 초안 생성처럼 응답 속도가 중요한 시나리오에 유용합니다.
이전 모델의 fast mode 대비 3배 저렴해졌다는 점도 주목할 부분이에요. 속도와 비용 두 방향 모두 개선됐습니다.
참고로 Claude Code 클라이언트의 정확한 토글 명령 형태는 공식 문서에서 직접 확인이 필요해요. API 레벨에서는 speed: "fast" 파라미터로 확인됩니다.
3. Mid-task system messages
Messages API에서 작업 진행 중에 시스템 메시지를 주입할 수 있게 됐어요. 긴 agentic 태스크 중간에 방향을 바꾸거나 컨텍스트를 추가해야 할 때 유용한 기능입니다. 오케스트레이션 파이프라인을 짜는 개발자라면 특히 활용 범위가 넓어요.
Opus 4.7 대비 내부 개선: 체감 차이가 나는 부분
벤치마크 외에 실제 사용에서 달라지는 부분도 있어요.
자기 작성 코드 결함 감소: Opus 4.8이 스스로 작성한 코드에서 결함이 통과되는 비율이 Opus 4.7 대비 약 4배 감소했다고 해요. 쉽게 말해 AI가 짠 코드가 테스트를 잘못 통과하는 경우가 크게 줄었다는 뜻입니다. 신뢰도 측면에서 중요한 변화예요.
Prompt caching 최소 길이 하향: 최소 캐시 가능 프롬프트가 1,024 토큰으로 낮아졌어요. 짧은 시스템 프롬프트를 쓰는 프로젝트에서도 캐시 혜택을 받을 수 있게 된 거예요.
Long-horizon agentic coding 강화: 긴 컨텍스트를 다루는 에이전트 코딩에서 compaction 빈도가 줄고 복구 능력이 향상됐어요. 여러 파일에 걸친 리팩토링이나 대규모 코드 수정 작업이 더 안정적으로 돌아간다는 얘기예요.
Tool triggering 신뢰도: 도구 호출 누락이 줄었어요. 에이전트가 필요한 도구를 빠뜨리거나 잘못 호출하는 경우가 감소했습니다.
실무 적용: 어떤 프로젝트에 바로 써볼 수 있을까
Claude Opus 4.8이 체감 차이를 낼 수 있는 시나리오: 대규모 코드베이스 마이그레이션 / 복잡한 알고리즘 설계 / 에이전트 오케스트레이션 파이프라인 / 비용 최적화가 필요한 반복 호출 작업
대규모 코드베이스 마이그레이션: Dynamic Workflows와 개선된 long-horizon 처리 덕분에 수만 라인 이상의 마이그레이션 작업을 Claude Code에 위임할 수 있는 범위가 넓어졌어요.
복잡한 알고리즘 설계: USAMO 수준의 수학 추론 개선은 단순 코드 생성 외에 복잡한 로직 설계나 최적화 문제에서도 체감될 거예요.
오케스트레이션 파이프라인: Mid-task system messages와 향상된 tool triggering을 조합하면 에이전트 체인을 더 정밀하게 제어할 수 있어요.
비용 최적화가 필요한 프로젝트: Fast mode(research preview)로 속도를 높이거나, prompt caching 최소 길이 하향으로 더 많은 요청에서 캐시 혜택을 받는 구조를 설계할 수 있어요.
API 호출 시 모델 ID는 claude-opus-4-8이에요.
마무리
Claude Opus 4.8은 "가격 동결 + 성능 향상"이라는 조합으로 나왔어요. SWE-bench Pro +4.9%p, 수학 추론 +27.4%p는 숫자만 보면 크지만, 실제 체감은 복잡한 코딩 작업과 long-horizon 에이전트 시나리오에서 더 뚜렷하게 나타날 거예요.
Claude Code를 이미 쓰고 계신다면 Dynamic Workflows와 fast mode(둘 다 research preview)의 진행 상황을 주시하는 게 좋고, 아직 Opus 4.7을 쓰고 계신 분이라면 모델 ID만 바꾸면 바로 업그레이드할 수 있습니다.
아, 그리고 한 가지. 이 글은 Claude Opus 4.8이 직접 작성했어요. 자신의 출시 소식을 자신이 정리하는 기묘한 상황인데 — 벤치마크 숫자는 정확하게 나왔길 바랍니다.