Claude 4.6은 차세대 Claude 모델로, 중요한 새로운 기능과 API 개선 사항을 제공합니다. 이 페이지에서는 출시 시점에 사용 가능한 모든 새로운 기능을 요약합니다.
| 모델 | API 모델 ID | 설명 |
|---|---|---|
| Claude Opus 4.6 | claude-opus-4-6 | 에이전트 구축 및 코딩을 위한 가장 지능적인 모델 |
Claude Opus 4.6은 200K 컨텍스트 윈도우(1M 토큰 컨텍스트 윈도우는 베타로 제공), 128K 최대 출력 토큰, 확장된 사고, 그리고 모든 기존 Claude API 기능을 지원합니다.
전체 가격 및 사양은 모델 개요를 참조하세요.
적응형 사고 (thinking: {type: "adaptive"})는 Opus 4.6에 권장되는 사고 모드입니다. Claude는 언제, 얼마나 사고할지를 동적으로 결정합니다. 기본 노력 수준(high)에서 Claude는 거의 항상 사고합니다. 더 낮은 노력 수준에서는 간단한 문제에 대해 사고를 건너뛸 수 있습니다.
thinking: {type: "enabled"}와 budget_tokens는 Opus 4.6에서 더 이상 사용되지 않습니다(deprecated). 여전히 작동하지만 향후 모델 릴리스에서 제거될 예정입니다. 대신 적응형 사고와 노력 파라미터를 사용하여 사고 깊이를 제어하세요. 적응형 사고는 또한 인터리브 사고를 자동으로 활성화합니다.
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=16000,
thinking={"type": "adaptive"},
messages=[{"role": "user", "content": "Solve this complex problem..."}]
)노력 파라미터가 이제 정식 출시되었습니다(베타 헤더 불필요). 새로운 max 노력 수준은 Opus 4.6에서 절대적으로 가장 높은 성능을 제공합니다. 최적의 비용-품질 트레이드오프를 위해 노력을 적응형 사고와 결합하세요.
압축은 자동 서버 측 컨텍스트 요약을 제공하여 사실상 무한한 대화를 가능하게 합니다. 컨텍스트가 윈도우 한계에 가까워지면 API가 대화의 이전 부분을 자동으로 요약합니다.
세밀한 도구 스트리밍이 이제 모든 모델과 플랫폼에서 정식 출시되었습니다. 베타 헤더가 필요하지 않습니다.
Opus 4.6은 최대 128K 출력 토큰을 지원하여 이전 64K 한도를 두 배로 늘렸습니다. 이를 통해 더 긴 사고 예산과 더 포괄적인 응답이 가능합니다. SDK는 HTTP 타임아웃을 방지하기 위해 큰 max_tokens 값을 가진 요청에 스트리밍을 필요로 합니다. 이벤트를 점진적으로 처리할 필요가 없다면 .stream()과 .get_final_message()를 사용하여 완전한 응답을 받으세요 — 자세한 내용은 메시지 스트리밍을 참조하세요.
데이터 상주 제어를 사용하면 inference_geo 파라미터를 사용하여 모델 추론이 실행되는 위치를 지정할 수 있습니다. 요청별로 "global"(기본값) 또는 "us" 라우팅을 선택할 수 있습니다. 미국 전용 추론은 Claude Opus 4.6 및 최신 모델에서 1.1배 가격이 적용됩니다.
type: "enabled" 및 budget_tokensthinking: {type: "enabled", budget_tokens: N}은 Opus 4.6에서 더 이상 사용되지 않습니다(deprecated). 여전히 작동하지만 향후 모델 릴리스에서 제거될 예정입니다. thinking: {type: "adaptive"}와 노력 파라미터로 마이그레이션하세요.
interleaved-thinking-2025-05-14 베타 헤더interleaved-thinking-2025-05-14 베타 헤더는 Opus 4.6에서 더 이상 사용되지 않습니다(deprecated). 포함되어도 안전하게 무시되지만 더 이상 필요하지 않습니다. 적응형 사고는 인터리브 사고를 자동으로 활성화합니다. Opus 4.6을 사용할 때 요청에서 betas=["interleaved-thinking-2025-05-14"]를 제거하세요.
output_format구조화된 출력을 위한 output_format 파라미터가 output_config.format으로 이동되었습니다. 이전 파라미터는 여전히 작동하지만 더 이상 사용되지 않으며 향후 모델 릴리스에서 제거될 예정입니다.
# 이전
response = client.messages.create(
output_format={"type": "json_schema", "schema": {...}},
...
)
# 이후
response = client.messages.create(
output_config={"format": {"type": "json_schema", "schema": {...}}},
...
)어시스턴트 메시지 프리필(마지막 어시스턴트 턴 프리필)은 Opus 4.6에서 지원되지 않습니다. 프리필된 어시스턴트 메시지가 포함된 요청은 400 오류를 반환합니다.
대안:
output_config.formatOpus 4.6은 도구 호출 인수에서 약간 다른 JSON 문자열 이스케이프를 생성할 수 있습니다(예: 유니코드 이스케이프 또는 슬래시 이스케이프의 다른 처리). 표준 JSON 파서는 이러한 차이를 자동으로 처리합니다. 도구 호출 input을 json.loads() 또는 JSON.parse()를 사용하지 않고 원시 문자열로 파싱하는 경우, 파싱 로직이 여전히 작동하는지 확인하세요.
단계별 마이그레이션 지침은 Claude 4.6으로 마이그레이션을 참조하세요.
적응형 사고 모드 사용 방법을 알아보세요.
모든 Claude 모델을 비교하세요.
서버 측 컨텍스트 압축을 살펴보세요.
단계별 마이그레이션 지침.
Was this page helpful?