클로드 소넷 4.6 완벽 정리: Opus급 성능을 5분의 1 가격에
클로드 소넷 4.6 완벽 정리: Opus급 성능을 5분의 1 가격에
2026년 2월 17일, Anthropic이 클로드 소넷 4.6(Claude Sonnet 4.6)을 공개했습니다. Opus 4.6 출시로부터 겨우 12일 만입니다. 2주 안에 두 번째 모델을 내놓은 셈이죠. claude.ai와 Claude Cowork에서 무료 및 Pro 사용자의 기본 모델로 즉시 설정되었고, API(claude-sonnet-4-6), Amazon Bedrock, Azure AI Foundry, GitHub Copilot에서 동시에 사용 가능합니다.
핵심은 단순합니다. Opus급 지능을 Sonnet 가격에 제공한다는 것. 입력 $3/MTok, 출력 $15/MTok으로 Opus 4.6 대비 5배 저렴하면서도 SWE-bench Verified 79.6%, OSWorld 72.5%라는 벤치마크 성적을 기록했습니다.
이 글에서는 클로드 소넷 4.6의 성능, 가격, 신규 기능, 그리고 실무에서 Opus와 어떻게 구분해서 써야 하는지를 상세하게 분석합니다.
클로드 소넷 4.6의 핵심 벤치마크 성능
클로드 소넷 4.6은 SWE-bench Verified에서 79.6%, OSWorld에서 72.5%를 기록하며 Opus급 코딩 성능과 인간 수준의 컴퓨터 사용 능력을 보여준 Anthropic의 최신 AI 모델입니다.
SWE-bench Verified 79.6%: 코딩의 새 기준
SWE-bench Verified는 실제 GitHub 이슈를 해결하는 능력을 측정하는 벤치마크입니다. 소넷 4.6이 기록한 79.6%는 Opus급 점수로, 이전 세대인 Sonnet 4.5 대비 극적인 향상을 보여줍니다. Claude Code 사용자 대상 선호도 조사에서도 Sonnet 4.5 대비 70%가 소넷 4.6을 선호했고, 심지어 2025년 11월 출시된 플래그십 모델 Opus 4.5와 비교해서도 59%가 소넷 4.6을 더 선호한다고 응답했습니다.
코딩 분야에서 구체적으로 개선된 영역은 다음과 같습니다.
- 일관성 향상: 동일한 지시에 대해 더 안정적인 출력
- 지시사항 준수: 프롬프트의 요구사항을 더 정확하게 반영
- 과도한 엔지니어링 감소: 요청한 것 이상으로 불필요한 코드를 생성하는 경향 감소
- 할루시네이션 감소: 존재하지 않는 API나 라이브러리를 만들어내는 빈도 감소
- 멀티스텝 완성도 향상: 여러 단계로 이루어진 코딩 작업을 끝까지 수행
기업 실사용 환경에서도 검증되었습니다. Box의 평가에서 추론 Q&A 작업 기준 Sonnet 4.5 대비 +15 퍼센트포인트 향상을 보였습니다.
OSWorld 72.5%: 인간 수준의 컴퓨터 사용
OSWorld는 AI가 실제 컴퓨터 환경에서 작업을 수행하는 능력을 측정합니다. 소넷 4.6이 기록한 72.5%는 역대 최고 점수이며, "인간 수준"이라는 표현이 과장이 아닌 시점에 도달했다고 할 수 있습니다.
실제로 가능한 작업은 다음과 같습니다.
- 복잡한 스프레드시트 탐색 및 데이터 조작
- 멀티스텝 웹 폼 작성 (회원가입, 주문 프로세스 등)
- 브라우저 기반 자동화 작업
- 데스크톱 애플리케이션 조작
이는 AI가 단순히 코드를 작성하는 것을 넘어, 실제 사용자처럼 컴퓨터를 조작할 수 있다는 의미입니다.
가격 구조: Opus 대비 5배 저렴
클로드 소넷 4.6의 가격 경쟁력은 이 모델의 가장 큰 장점 중 하나입니다.
| 항목 | Opus 4.6 | 소넷 4.6 | 차이 |
|---|---|---|---|
| 입력 가격 | $15/MTok | $3/MTok | 5배 저렴 |
| 출력 가격 | $75/MTok | $15/MTok | 5배 저렴 |
| 최대 출력 토큰 | 128K | 64K | Opus가 2배 |
| 컨텍스트 윈도우 | 200K (기본) | 200K (기본), 1M (베타) | 소넷이 베타로 더 큼 |
Sonnet 4.5와 비교하면 가격은 동일합니다(입력 $3, 출력 $15). 성능만 대폭 올라간 셈이죠. 기존 Sonnet 4.5 사용자라면 API 모델 ID만 claude-sonnet-4-6으로 변경하면 동일한 비용으로 훨씬 나은 결과를 얻을 수 있습니다.
고볼륨 API 호출이 필요한 프로덕션 환경에서는 이 가격 차이가 특히 중요합니다. 월 수만 건의 API 호출을 하는 서비스라면 Opus 대비 80%의 비용을 절감하면서도 거의 동일한 품질을 유지할 수 있습니다.
소넷 4.6의 신규 기능
Adaptive Thinking: 스스로 생각의 깊이를 조절
클로드 소넷 4.6에 도입된 가장 주목할 만한 기능입니다. 기존에는 budget_tokens로 모델의 사고 토큰 수를 수동으로 지정해야 했습니다. 이제는 thinking: {type: "adaptive"}와 effort 파라미터를 통해 Claude가 문제의 복잡도에 따라 얼마나 깊이 생각할지를 동적으로 결정합니다.
Sonnet에 effort 파라미터가 도입된 것은 이번이 처음입니다. 권장 설정은 medium이며, 이를 통해 간단한 질문에는 빠르게, 복잡한 문제에는 충분히 깊이 생각하는 자원 배분이 가능해졌습니다.
참고로 budget_tokens는 deprecated 상태이므로, 기존에 이를 사용하고 있었다면 effort 파라미터로 마이그레이션하는 것을 권장합니다.
Compaction API (베타): 사실상 무한 대화
서버 측에서 자동으로 컨텍스트를 요약하는 기능입니다. 긴 대화를 이어갈 때 컨텍스트 윈도우가 가득 차면 자동으로 핵심 내용만 남기고 요약합니다. 이를 통해 사실상 무한에 가까운 대화가 가능해집니다.
개발자 입장에서는 컨텍스트 관리를 위한 별도 로직을 구현할 필요가 줄어든다는 의미입니다.
1M 토큰 컨텍스트 윈도우 (베타)
기본 200K 토큰 컨텍스트에 더해, 베타로 1M(100만) 토큰 컨텍스트를 지원합니다. 이를 활용할 수 있는 시나리오는 다양합니다.
- 전체 코드베이스 분석: 대규모 프로젝트의 소스 코드를 한 번에 넣고 리팩토링 방향 논의
- 다수 논문 동시 처리: 수십 편의 학술 논문을 한 번에 넣고 비교 분석
- 긴 계약서 검토: 수백 페이지 분량의 법률 문서 전체 분석
- 대규모 데이터 분석: 구조화된 데이터를 통째로 넣고 패턴 탐색
기타 신규 기능
- Web Search/Fetch 동적 필터링 (베타): 코드 실행으로 검색 결과를 필터링하여 정확도를 높이고 토큰을 절약합니다.
- Code Execution 무료화: Web Search/Fetch와 함께 사용하면 코드 실행 비용이 무료입니다.
- Fast Mode (리서치 프리뷰): Opus 모델의 출력 속도를 최대 2.5배까지 높이는 모드입니다.
- Data Residency:
inference_geo파라미터로 추론이 실행되는 물리적 위치를 지정할 수 있습니다(글로벌 또는 미국).
디자인과 프론트엔드 역량 향상
개발자 커뮤니티에서 특히 반응이 좋았던 부분은 디자인 감각의 향상입니다. 소넷 4.6은 레이아웃, 애니메이션, 전반적인 디자인 품질이 이전 모델 대비 눈에 띄게 세련되어졌습니다.
프론트엔드 개발 워크플로우에서 체감할 수 있는 변화는 다음과 같습니다.
- 첫 번째 결과물의 품질 자체가 높아져서 프로덕션 품질까지 도달하는 반복 횟수가 감소
- CSS 레이아웃과 반응형 디자인에 대한 이해도 향상
- 애니메이션 타이밍과 이징 함수 선택이 더 자연스러움
- 전반적인 UI/UX 감각이 개선되어 디자이너와의 협업 효율 증가
이는 프로토타이핑이나 MVP 개발 단계에서 특히 유용합니다. AI가 생성한 초기 결과물의 품질이 높을수록 인간 개발자가 수정에 투입하는 시간이 줄어들기 때문입니다.
Breaking Changes: 마이그레이션 시 주의사항
기존 Opus 4.6이나 Sonnet 4.5 API를 사용하고 있다면, 소넷 4.6으로 전환할 때 몇 가지 주의해야 할 변경사항이 있습니다.
Prefill 제거
Opus 4.6에서는 어시스턴트 메시지의 prefill이 더 이상 지원되지 않습니다. 기존에 prefill을 사용하고 있었다면 400 에러가 발생하므로, 프롬프트 구조를 수정해야 합니다.
output_format에서 output_config.format으로 변경
구조화된 출력(Structured Output) 파라미터가 output_format에서 output_config.format으로 이동했습니다. JSON 출력을 사용하는 모든 코드에서 파라미터 경로를 업데이트해야 합니다.
budget_tokens Deprecated
앞서 언급한 대로 budget_tokens는 deprecated 상태입니다. thinking: {type: "adaptive"}와 effort 파라미터 조합으로 대체하세요.
Opus 4.6 vs 소넷 4.6: 언제 무엇을 쓸까
두 모델 모두 2026년 2월에 출시되었고, 성능 면에서 상당 부분 겹칩니다. 하지만 각각의 최적 사용 시나리오는 다릅니다.
| 기준 | Opus 4.6 추천 | 소넷 4.6 추천 |
|---|---|---|
| 작업 복잡도 | 극도로 복잡한 멀티스텝 추론 | 대부분의 일반적 작업 |
| 코딩 | 대규모 코드베이스 리팩토링 | 일상적 코딩, 버그 수정, 기능 추가 |
| 아키텍처 | 시스템 설계, 멀티에이전트 오케스트레이션 | 단일 에이전트 워크플로우 |
| 비용 민감도 | 비용보다 품질 우선 | 비용 효율 최적화 |
| 출력 길이 | 128K 토큰까지 필요한 경우 | 64K 토큰이면 충분한 경우 |
| API 볼륨 | 소량 고품질 호출 | 대량 반복 호출 |
실무적인 기준을 제시하자면, 전체 작업의 80% 이상은 소넷 4.6으로 충분합니다. Opus가 필요한 순간은 코드베이스 전체를 리팩토링하거나, 여러 에이전트를 동시에 조율하거나, 최대 깊이의 추론이 필요한 아키텍처 결정을 내릴 때입니다.
사용 가능한 플랫폼
클로드 소넷 4.6은 출시와 동시에 다양한 플랫폼에서 사용 가능합니다.
- claude.ai: 무료 및 Pro 사용자의 기본 모델로 자동 설정
- Claude Cowork: 팀 협업 환경에서 사용 가능
- Claude Code: CLI 기반 코딩 어시스턴트
- Claude API:
claude-sonnet-4-6모델 ID로 직접 호출 - Amazon Bedrock: 동시 출시, AWS 인프라에서 바로 사용
- Azure AI Foundry: 동시 출시, Azure 생태계 통합
- GitHub Copilot: GA(General Availability)로 GitHub 개발 환경에서 사용
특히 Amazon Bedrock과 Azure AI Foundry에서 동시 출시된 점은 엔터프라이즈 고객에게 중요한 의미가 있습니다. 기존 클라우드 인프라를 변경하지 않고도 최신 모델을 바로 적용할 수 있기 때문입니다.
마무리: AI 모델 시장의 새로운 게임 체인저
클로드 소넷 4.6은 "플래그십 성능을 합리적 가격에"라는 트렌드를 명확히 보여주는 모델입니다. SWE-bench 79.6%, OSWorld 72.5%라는 벤치마크 성적은 불과 몇 개월 전만 해도 최상위 모델에서나 볼 수 있던 수치입니다.
Adaptive Thinking, 1M 토큰 컨텍스트, Compaction API 같은 신규 기능은 AI를 실무에 도입하는 과정에서 실질적인 병목을 해소해줍니다. 비용 부담 없이 Opus급 성능을 활용할 수 있다는 점은 개인 개발자부터 엔터프라이즈까지 모든 규모의 사용자에게 의미가 있습니다.
기존 Sonnet 4.5를 사용하고 있었다면 모델 ID만 바꾸면 됩니다. Opus를 비용 때문에 망설이고 있었다면, 소넷 4.6이 그 고민을 해결해줄 것입니다.
자주 묻는 질문 (FAQ)
Q: 클로드 소넷 4.6은 무료로 사용할 수 있나요?
네, claude.ai에서 무료 사용자도 소넷 4.6을 기본 모델로 사용할 수 있습니다. 다만 무료 계정은 사용량 제한이 있으며, API를 통한 사용은 토큰 기반 과금이 적용됩니다.
Q: Sonnet 4.5에서 소넷 4.6으로 마이그레이션하려면 어떻게 해야 하나요?
API를 사용하고 있다면 모델 ID를 claude-sonnet-4-6으로 변경하면 됩니다. 가격은 동일하므로 비용 변동은 없습니다. 다만 budget_tokens를 사용하고 있었다면 effort 파라미터로 전환해야 하며, output_format도 output_config.format으로 업데이트가 필요합니다.
Q: Opus 4.6과 소넷 4.6의 가장 큰 차이는 무엇인가요?
가격(5배 차이)과 최대 출력 토큰(128K vs 64K)이 주요 차이입니다. 성능 면에서는 대부분의 작업에서 비슷한 결과를 보이지만, 극도로 복잡한 멀티스텝 추론이나 대규모 코드베이스 리팩토링에서는 Opus가 여전히 우위에 있습니다.
Q: 1M 토큰 컨텍스트 윈도우는 어떻게 사용하나요?
현재 베타 상태이며, API를 통해 사용할 수 있습니다. 기본 컨텍스트는 200K 토큰이고, 1M 토큰은 별도 요청이나 설정이 필요할 수 있습니다. 전체 코드베이스 분석, 다수 문서 동시 처리 등에 적합합니다.
Q: Amazon Bedrock이나 Azure에서 바로 사용할 수 있나요?
네, 소넷 4.6은 Amazon Bedrock과 Azure AI Foundry에서 동시 출시되었습니다. 해당 플랫폼에서 모델을 선택하면 바로 사용할 수 있으며, 기존 클라우드 인프라와의 통합이 용이합니다.
참고 자료
- Anthropic 공식 발표: Claude Sonnet 4.6
- Anthropic API 문서: What's New in Claude 4.6
- CNBC: Anthropic releases Claude Sonnet 4.6
- TechCrunch: Anthropic releases Sonnet 4.6
- VentureBeat: Sonnet 4.6 matches flagship performance at one-fifth cost
- AWS: Claude Sonnet 4.6 Available in Amazon Bedrock
- GitHub Blog: Claude Sonnet 4.6 in GitHub Copilot