• Messages
  • Managed Agents
  • 관리자

Search...
⌘K
모델
모델 개요모델 ID 및 버전 관리모델 선택Claude Fable 5 및 Claude Mythos 5 소개Claude Opus 4.8의 새로운 기능모델 버전 간 업그레이드모델 지원 중단모델 카드시스템 프롬프트가격

Log in
Claude Opus 4.8의 새로운 기능
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
모델 및 가격/모델

Claude Opus 4.8의 새로운 기능

Claude Opus 4.8의 새로운 기능 및 동작 변경 사항 개요.

Claude Opus 4.8은 Anthropic의 가장 뛰어난 Opus 등급 모델입니다. Claude Opus 4.7을 기반으로 구축되었습니다. 이 페이지에서는 "fast mode"(고속 모드, Claude API에서 리서치 프리뷰로 제공)와 1,024 토큰으로 낮아진 최소 캐시 가능 프롬프트 길이를 포함하여 출시 시점의 모든 새로운 사항을 요약합니다.

새로운 모델

모델API 모델 ID설명
Claude Opus 4.8claude-opus-4-8복잡한 추론, 장기 에이전틱 코딩, 높은 자율성 작업을 위한 Anthropic의 가장 뛰어난 Opus 등급 모델

Claude Opus 4.8은 Claude API, Amazon Bedrock, Vertex AI에서 기본적으로 1M 토큰 컨텍스트 윈도우를 지원하며(Microsoft Foundry에서는 200k), 128k 최대 출력 토큰, adaptive thinking(적응형 사고), 그리고 Claude Opus 4.7과 동일한 도구 및 플랫폼 기능 세트를 지원합니다.

전체 가격 및 사양은 모델 개요를 참조하세요.

새로운 기능

대화 중간 시스템 메시지

Claude Opus 4.8은 messages 배열에서 사용자 턴 바로 뒤에 role: "system" 메시지를 허용합니다(배치 규칙 적용). 이를 통해 장기 실행 대화의 후반부에 전체 시스템 프롬프트를 다시 작성하지 않고도 업데이트된 지침을 추가할 수 있으며, 이전 턴에 대한 프롬프트 캐시 적중을 유지하고 에이전틱 루프에서 입력 비용을 줄일 수 있습니다. 베타 헤더는 필요하지 않습니다. 사용 세부 정보는 대화 중간 시스템 메시지를 참조하세요.

거부 중지 세부 정보

거부 응답의 stop_details 객체(Claude Opus 4.7부터 사용 가능)가 이제 공개적으로 문서화되었습니다. Claude가 요청 완료를 거부할 때, 이 객체는 기존의 refusal 중지 사유에 더해 거부 카테고리를 설명하므로, 애플리케이션이 서로 다른 유형의 거부된 요청을 구분하고 사용자를 적절한 다음 단계로 안내하기가 더 쉬워집니다. 베타 헤더는 필요하지 않습니다. 카테고리 목록 및 처리 지침은 중지 사유 처리를 참조하세요.

Effort 기본값

Claude Opus 4.8의 effort 매개변수 기본값은 Claude API 및 Claude Code를 포함한 모든 환경에서 high입니다. 현재 effort를 명시적으로 설정하고 있다면 해당 설정은 변경되지 않습니다. 레벨별 지침은 Effort를 참조하세요.

Fast mode

Fast mode(고속 모드)는 이제 Claude API에서 리서치 프리뷰로 Claude Opus 4.8에 사용할 수 있습니다. speed: "fast"를 설정하면 프리미엄 가격으로 동일한 모델에서 초당 출력 토큰을 최대 2.5배 더 많이 얻을 수 있습니다. 액세스, 지원 모델 및 가격은 Fast mode를 참조하세요.

더 낮은 프롬프트 캐시 최소값

Claude Opus 4.8의 최소 캐시 가능 프롬프트 길이는 1,024 토큰으로, Claude Opus 4.7보다 낮습니다. Claude Opus 4.7에서 캐시하기에 너무 짧았던 프롬프트도 이제 코드 변경 없이 캐시 항목을 생성할 수 있습니다. 모델별 최소값은 프롬프트 캐싱을 참조하세요.

Claude Opus 4.7에서 상속된 API 제약 사항



이러한 제약 사항은 Claude Opus 4.7에서 변경되지 않았으므로, 이미 Claude Opus 4.7에서 실행되는 코드는 변경이 필요하지 않습니다. 이는 Messages API에만 적용되며, Claude Managed Agents는 영향을 받지 않습니다.

샘플링 매개변수 미지원

temperature, top_p 또는 top_k를 기본값이 아닌 값으로 설정하면 Claude Opus 4.7과 마찬가지로 Claude Opus 4.8에서 400 오류가 반환됩니다. 이러한 매개변수를 생략하고 프롬프팅을 사용하여 모델의 동작을 유도하세요.

Adaptive thinking이 유일한 사고 모드

Claude Opus 4.7과 마찬가지로 Claude Opus 4.8은 확장 사고 예산을 지원하지 않습니다. thinking: {"type": "enabled", "budget_tokens": N}을 설정하면 400 오류가 반환됩니다. 사고 깊이를 제어하려면 adaptive thinking과 effort 매개변수를 사용하세요.

Python
# 이전 (Opus 4.6 이하)
thinking = {"type": "enabled", "budget_tokens": 32000}

# 이후 (Opus 4.7 이상)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}

기능 개선

개선 영역

Claude Opus 4.7과 비교하여 Claude Opus 4.8은 다음 영역에서 동작 개선을 목표로 합니다.

  • 장기 에이전틱 코딩: 더 나은 긴 컨텍스트 처리, 더 적은 압축, 더 나은 compaction(압축) 복구를 포함합니다.
  • 추론 effort 보정: 다양한 도메인에서 각 effort 레벨에 대해 더 안정적인 동작을 제공합니다.
  • 도구 트리거링: 작업에 필요한 도구 호출을 건너뛰는 경우가 줄어듭니다.

Adaptive thinking

Adaptive thinking이 활성화되면 Claude Opus 4.8은 해당 턴에 필요하다고 판단할 때만 추론을 트리거합니다. 간단한 조회 및 짧은 에이전틱 단계에서는 직접 응답하고, 복잡한 다단계 문제에서는 답변하기 전에 추론합니다. 이는 동일한 effort 레벨에서 Claude Opus 4.7과 비교하여 이중 모드 워크로드에서 낭비되는 사고 토큰을 줄입니다. Claude Opus 4.7과 마찬가지로, 요청에서 thinking: {type: "adaptive"}를 명시적으로 설정하지 않는 한 사고는 꺼져 있습니다.

동작 변경 사항

이는 API 호환성을 깨는 변경 사항은 아니지만 프롬프트 업데이트가 필요할 수 있습니다. 전체 지침은 Claude Opus 4.8로 마이그레이션을 참조하세요.

  • Adaptive thinking이 활성화된 경우 동일한 effort 레벨에서 낭비되는 사고 토큰이 감소합니다. 모델이 턴마다 사고 여부를 결정하기 때문입니다.
  • 더 나은 도구 트리거링. 일부 사용자가 Claude Opus 4.7에서 보고한 문제인, 작업에 필요한 도구 호출을 건너뛸 가능성이 줄어듭니다.
  • 더 나은 압축 처리 및 긴 컨텍스트 품질. 긴 에이전틱 트레이스가 압축 후에도 이탈이 적고 작업에 집중된 상태를 유지합니다.

마이그레이션 가이드

단계별 마이그레이션 지침 및 전체 마이그레이션 체크리스트는 Claude Opus 4.8로 마이그레이션을 참조하세요. Claude Code 또는 Agent SDK를 사용하는 경우, Claude API 스킬이 이러한 마이그레이션 단계를 코드베이스에 자동으로 적용할 수 있습니다.

다음 단계


마이그레이션 가이드

Claude Opus 4.7에서의 단계별 업그레이드 지침.

Effort

새로운 기본값을 포함한 레벨별 effort 지침.

Adaptive thinking

Claude Opus 4.8에서 유일하게 지원되는 사고 활성화 모드.

프롬프트 캐싱

대화 중간 시스템 메시지가 캐시 적중을 유지하는 방법.

중지 사유 처리

거부 중지 세부 정보 및 처리 방법.


Fast mode

프리미엄 가격으로 더 높은 출력 속도.

Was this page helpful?

  • 새로운 모델
  • 새로운 기능
  • 대화 중간 시스템 메시지
  • 거부 중지 세부 정보
  • Effort 기본값
  • Fast mode
  • 더 낮은 프롬프트 캐시 최소값
  • Claude Opus 4.7에서 상속된 API 제약 사항
  • 샘플링 매개변수 미지원
  • Adaptive thinking이 유일한 사고 모드
  • 기능 개선
  • 개선 영역
  • Adaptive thinking
  • 동작 변경 사항
  • 마이그레이션 가이드
  • 다음 단계