Claude Opus 4.8은 Anthropic의 가장 뛰어난 Opus 등급 모델입니다. Claude Opus 4.7을 기반으로 구축되었습니다. 이 페이지에서는 "fast mode"(고속 모드, Claude API에서 리서치 프리뷰로 제공)와 1,024 토큰으로 낮아진 최소 캐시 가능 프롬프트 길이를 포함하여 출시 시점의 모든 새로운 사항을 요약합니다.
| 모델 | API 모델 ID | 설명 |
|---|---|---|
| Claude Opus 4.8 | claude-opus-4-8 | 복잡한 추론, 장기 에이전틱 코딩, 높은 자율성 작업을 위한 Anthropic의 가장 뛰어난 Opus 등급 모델 |
Claude Opus 4.8은 Claude API, Amazon Bedrock, Vertex AI에서 기본적으로 1M 토큰 컨텍스트 윈도우를 지원하며(Microsoft Foundry에서는 200k), 128k 최대 출력 토큰, adaptive thinking(적응형 사고), 그리고 Claude Opus 4.7과 동일한 도구 및 플랫폼 기능 세트를 지원합니다.
전체 가격 및 사양은 모델 개요를 참조하세요.
Claude Opus 4.8은 messages 배열에서 사용자 턴 바로 뒤에 role: "system" 메시지를 허용합니다(배치 규칙 적용). 이를 통해 장기 실행 대화의 후반부에 전체 시스템 프롬프트를 다시 작성하지 않고도 업데이트된 지침을 추가할 수 있으며, 이전 턴에 대한 프롬프트 캐시 적중을 유지하고 에이전틱 루프에서 입력 비용을 줄일 수 있습니다. 베타 헤더는 필요하지 않습니다. 사용 세부 정보는 대화 중간 시스템 메시지를 참조하세요.
거부 응답의 stop_details 객체(Claude Opus 4.7부터 사용 가능)가 이제 공개적으로 문서화되었습니다. Claude가 요청 완료를 거부할 때, 이 객체는 기존의 refusal 중지 사유에 더해 거부 카테고리를 설명하므로, 애플리케이션이 서로 다른 유형의 거부된 요청을 구분하고 사용자를 적절한 다음 단계로 안내하기가 더 쉬워집니다. 베타 헤더는 필요하지 않습니다. 카테고리 목록 및 처리 지침은 중지 사유 처리를 참조하세요.
Claude Opus 4.8의 effort 매개변수 기본값은 Claude API 및 Claude Code를 포함한 모든 환경에서 high입니다. 현재 effort를 명시적으로 설정하고 있다면 해당 설정은 변경되지 않습니다. 레벨별 지침은 Effort를 참조하세요.
Fast mode(고속 모드)는 이제 Claude API에서 리서치 프리뷰로 Claude Opus 4.8에 사용할 수 있습니다. speed: "fast"를 설정하면 프리미엄 가격으로 동일한 모델에서 초당 출력 토큰을 최대 2.5배 더 많이 얻을 수 있습니다. 액세스, 지원 모델 및 가격은 Fast mode를 참조하세요.
Claude Opus 4.8의 최소 캐시 가능 프롬프트 길이는 1,024 토큰으로, Claude Opus 4.7보다 낮습니다. Claude Opus 4.7에서 캐시하기에 너무 짧았던 프롬프트도 이제 코드 변경 없이 캐시 항목을 생성할 수 있습니다. 모델별 최소값은 프롬프트 캐싱을 참조하세요.
이러한 제약 사항은 Claude Opus 4.7에서 변경되지 않았으므로, 이미 Claude Opus 4.7에서 실행되는 코드는 변경이 필요하지 않습니다. 이는 Messages API에만 적용되며, Claude Managed Agents는 영향을 받지 않습니다.
temperature, top_p 또는 top_k를 기본값이 아닌 값으로 설정하면 Claude Opus 4.7과 마찬가지로 Claude Opus 4.8에서 400 오류가 반환됩니다. 이러한 매개변수를 생략하고 프롬프팅을 사용하여 모델의 동작을 유도하세요.
Claude Opus 4.7과 마찬가지로 Claude Opus 4.8은 확장 사고 예산을 지원하지 않습니다. thinking: {"type": "enabled", "budget_tokens": N}을 설정하면 400 오류가 반환됩니다. 사고 깊이를 제어하려면 adaptive thinking과 effort 매개변수를 사용하세요.
# 이전 (Opus 4.6 이하)
thinking = {"type": "enabled", "budget_tokens": 32000}
# 이후 (Opus 4.7 이상)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}Claude Opus 4.7과 비교하여 Claude Opus 4.8은 다음 영역에서 동작 개선을 목표로 합니다.
Adaptive thinking이 활성화되면 Claude Opus 4.8은 해당 턴에 필요하다고 판단할 때만 추론을 트리거합니다. 간단한 조회 및 짧은 에이전틱 단계에서는 직접 응답하고, 복잡한 다단계 문제에서는 답변하기 전에 추론합니다. 이는 동일한 effort 레벨에서 Claude Opus 4.7과 비교하여 이중 모드 워크로드에서 낭비되는 사고 토큰을 줄입니다. Claude Opus 4.7과 마찬가지로, 요청에서 thinking: {type: "adaptive"}를 명시적으로 설정하지 않는 한 사고는 꺼져 있습니다.
이는 API 호환성을 깨는 변경 사항은 아니지만 프롬프트 업데이트가 필요할 수 있습니다. 전체 지침은 Claude Opus 4.8로 마이그레이션을 참조하세요.
단계별 마이그레이션 지침 및 전체 마이그레이션 체크리스트는 Claude Opus 4.8로 마이그레이션을 참조하세요. Claude Code 또는 Agent SDK를 사용하는 경우, Claude API 스킬이 이러한 마이그레이션 단계를 코드베이스에 자동으로 적용할 수 있습니다.
Claude Opus 4.7에서의 단계별 업그레이드 지침.
새로운 기본값을 포함한 레벨별 effort 지침.
Claude Opus 4.8에서 유일하게 지원되는 사고 활성화 모드.
대화 중간 시스템 메시지가 캐시 적중을 유지하는 방법.
거부 중지 세부 정보 및 처리 방법.
프리미엄 가격으로 더 높은 출력 속도.
Was this page helpful?