모델 및 가격모델

Claude Opus 5의 새로운 기능

Claude Opus 5의 새로운 기능과 동작 변경 사항에 대한 개요입니다.

Claude Opus 5는 Claude Opus 4.8에 비해 단계적 도약을 이룬 개선 모델로, 심층 추론, 에이전트 및 장기 작업, 테스트 시점 컴퓨팅 확장에서 가장 큰 향상을 보입니다. 이 페이지는 기본적으로 활성화된 사고, 대화 중 도구 변경, 사고를 비활성화할 수 있는 시점에 대한 호환성이 깨지는 변경 사항을 포함하여 Claude Opus 5의 모든 새로운 내용을 요약합니다.

새로운 모델

모델	API 모델 ID	설명
Claude Opus 5	`claude-opus-5`	복잡한 에이전트 코딩 및 엔터프라이즈 작업용

Claude Opus 5는 1M 토큰 컨텍스트 윈도우(1M 토큰이 기본값이자 최대값이며, 더 작은 컨텍스트 변형은 없습니다), 128k 최대 출력 토큰, 그리고 기본적으로 활성화된 사고를 제공합니다.

전체 가격 및 사양은 모델 개요를 참조하세요.

새로운 기능

대화 중 도구 변경 (베타)

세션이 지속되는 동안 고정된 도구 목록을 다시 보내는 대신, 프롬프트 캐시를 유지하면서 대화의 턴 사이에 도구를 추가하거나 제거할 수 있습니다. 대화 중 도구 변경은 베타 상태입니다. 요청에 mid-conversation-tool-changes-2026-07-01 베타 헤더를 포함하세요. 사용법은 대화 중 도구 변경을 참조하세요.

기본 폴백 모드

fallbacks 매개변수는 새로운 "default" 모드를 지원하며, 이는 직접 관리하는 모델 목록 대신 거부 카테고리별로 Anthropic이 권장하는 폴백 모델을 적용합니다. fallbacks 매개변수 전체는 베타 상태입니다. "default" 모드와 명시적 모델 목록을 모두 지원하는 server-side-fallback-2026-07-01 베타 헤더를 사용하세요(이전의 server-side-fallback-2026-06-01 헤더는 명시적 목록만 허용합니다). 거부 및 폴백을 참조하세요.

더 낮아진 프롬프트 캐시 최소값

Claude Opus 5에서 캐시 가능한 최소 프롬프트 길이는 512 토큰으로, Claude Opus 4.8의 1,024 토큰에서 낮아졌습니다. Claude Opus 4.8에서 캐시하기에 너무 짧았던 프롬프트도 이제 코드 변경 없이 캐시 항목을 생성할 수 있습니다. 모델별 최소값은 프롬프트 캐싱을 참조하세요.

고속 모드

고속 모드(연구 프리뷰)는 Claude API에서만 Claude Opus 5에 사용할 수 있으며, 현재 Amazon Bedrock, Google Cloud 또는 Microsoft Foundry에서는 사용할 수 없습니다. Claude Opus 5의 고속 모드 가격은 입력 토큰 100만 개당 $10, 출력 토큰 100만 개당 $50입니다. 액세스, 지원 모델 및 가격은 고속 모드를 참조하세요.

동작 변경 사항

기본적으로 활성화된 사고

Claude Opus 4.8에서는 thinking: {"type": "adaptive"}를 설정하지 않는 한 요청이 사고 없이 실행됩니다. Claude Opus 5에서는 동일한 요청이 사고가 활성화된 상태로 실행됩니다. 모델이 각 턴에서 언제, 얼마나 사고할지 결정하며, effort 매개변수가 사고 깊이를 제어합니다. 와이어 값은 변경되지 않았으며, thinking: {"type": "adaptive"}는 여전히 유효하고 기본값과 동일합니다.

max_tokens는 전체 출력(사고와 응답 텍스트를 합한 것)에 대한 엄격한 제한이므로, Claude Opus 4.8에서 사고 없이 실행되던 워크로드에 대해서는 이 값을 다시 검토하세요.

API는 아래의 effort 제한 사항에 따라 사고를 비활성화하는 옵션을 유지합니다.

더 중요해진 effort

Claude Opus 5는 이전의 어떤 Opus 모델보다 추가적인 effort를 더 안정적으로 더 나은 결과로 전환하므로, 선택하는 effort 수준이 더 큰 영향을 미칩니다. 전체 단계를 사용할 수 있습니다: low, medium, high, xhigh, max이며, max는 가능한 가장 깊은 추론을 위한 최상위 단계입니다. 기본값인 high에서 시작하여 평가 결과에 따라 양방향으로 조정하세요. 품질이 유지되는 경우 토큰과 지연 시간을 절약하기 위해 낮추거나, 가장 까다로운 작업에는 높이세요. xhigh 또는 max effort로 실행할 때는 모델이 서브에이전트와 도구 호출 전반에 걸쳐 사고하고 행동할 여유를 갖도록 큰 max_tokens를 설정하세요.

이 요청은 effort를 max까지 최대로 올립니다:

client = anthropic.Anthropic()

with client.messages.stream(
    model="claude-opus-5",
    max_tokens=64000,
    output_config={"effort": "max"},
    messages=[
        {
            "role": "user",
            "content": "Explain why the sum of two even numbers is always even.",
        }
    ],
) as stream:
    response = stream.get_final_message()

print(response)

Claude Opus 5에서는 사고가 기본적으로 활성화되어 있으므로 thinking 필드가 필요하지 않습니다.

사고 비활성화에는 effort `high` 이하가 필요

Claude Opus 5에서 thinking: {"type": "disabled"}는 effort 수준이 high 이하일 때만 허용됩니다. effort가 xhigh 또는 max인 상태에서 thinking: {"type": "disabled"}를 설정하면 400 오류가 반환됩니다. 이는 Claude Opus 5부터 정식으로 제공되는 동작으로, 각 요청마다 적용되며, 사고 비활성화가 effort 수준과 무관했던 Claude Opus 4.8과는 호환되지 않는 변경 사항입니다. 현재 높은 effort 수준에서 사고를 비활성화하고 있다면, 사고를 비활성화한 채로 effort를 high 이하로 설정하거나, effort 수준을 유지하고 thinking 필드를 제거하세요.

사고가 비활성화된 상태에서 Claude Opus 5는 때때로 tool_use 블록을 내보내는 대신 텍스트 출력에 도구 호출을 작성하거나, 표시되는 응답에 내부 XML 태그를 포함할 수 있습니다. 가능하면 사고를 활성화한 상태로 유지하고 더 낮은 effort 수준으로 토큰 비용을 제어하세요. 사고를 비활성화해야 하는 통합의 경우, 프롬프트 완화 방법은 사고 비활성화 상태로 실행하기를 참조하세요.

모델 동작 차이

위의 API 변경 사항 외에도, Claude Opus 5는 코드를 변경하지 않아도 알아차릴 수 있는 방식으로 Claude Opus 4.8과 다르게 동작합니다. 기본적으로 사용자 대상 응답과 작성된 결과물이 더 길어집니다. 에이전트 세션에서는 모델이 사용자에게 진행 상황을 더 자주 설명합니다. 멀티 에이전트 프레임워크에서는 서브에이전트에 더 적극적으로 위임합니다. 또한 지시하지 않아도 자신의 작업을 스스로 검증하므로, 이전 모델에서 가져온 검증 지시("최종 검증 단계를 포함하세요", "서브에이전트를 사용하여 검증하세요")를 제거하세요. 이러한 지시는 Claude Opus 5에서 과도한 검증을 유발합니다. 이러한 각 동작을 조정하는 프롬프트 패턴은 Claude Opus 5 프롬프팅을 참조하세요.

기능 개선

Claude Opus 4.8과 비교할 때, Claude Opus 5는 점진적 개선이 아닌 단계적 도약을 이룬 개선 모델이며, Claude Fable 5의 절반 비용으로 최첨단 지능을 제공합니다. 가장 큰 향상은 다음과 같습니다:

심층 추론: 긴 문제 체인 전반에 걸쳐 다단계 분석을 지속합니다.
에이전트 코딩 및 장기 작업: 확장된 도구 사용 루프 전반에 걸쳐 작업에 집중하고, 스텁이나 플레이스홀더를 남기지 않고 다중 파일 기능, 대규모 리팩터링, 엔드투엔드 기능 작업을 완료합니다.
테스트 시점 컴퓨팅 확장: 추가 effort(max 수준까지)를 더 나은 결과로 전환합니다.
낮은 effort 수준에서의 효율성: low 및 medium effort가 더 높은 설정의 일부에 불과한 토큰과 지연 시간으로 강력한 품질을 제공합니다.
코드 리뷰 및 버그 발견: 패스당 높은 비율로 실제 버그를 찾아내고 오탐이 적으며, 낮은 effort 수준에서도 정확성을 유지합니다.
비전: 차트, 문서, 다이어그램을 이해하고 UI 및 프런트엔드 비주얼을 재현하며, 작업을 반복적으로 분석, 자르기, 검증할 수 있는 도구가 주어졌을 때 가장 강력합니다.
긴 컨텍스트 작업: 1M 토큰 컨텍스트 윈도우가 기본값이자 최대값이며, 윈도우 전체에 걸쳐 일관된 지시 따르기, 도구 호출, 추론을 제공합니다.
오피스 및 문서 작업: 복잡한 수식이 포함된 다중 시트 스프레드시트를 생성 및 편집하고, 잘 구조화된 슬라이드 덱을 만듭니다.
멀티 에이전트 조정: 효과적인 작성자-검증자 패턴으로 서브에이전트 팀을 운영하며, 에이전트가 서로의 작업을 덮어쓰는 경우가 적습니다.

이러한 기능을 최대한 활용하는 프롬프트 패턴은 Claude Opus 5 프롬프팅을 참조하세요.

가격

Claude Opus 5의 가격은 입력 토큰 100만 개당 $5, 출력 토큰 100만 개당 $25로, Claude Opus 4.8과 동일합니다.

배치 처리, 프롬프트 캐싱, 고속 모드 요금을 포함한 전체 가격은 가격을 참조하세요.

사용 가능 여부

Claude Opus 5는 다음에서 사용할 수 있습니다:

Claude API: 모든 고객이 claude-opus-5로 사용할 수 있습니다.
AWS: Claude in Amazon Bedrock을 통해 anthropic.claude-opus-5로 사용할 수 있습니다. Claude Opus 5는 동일한 인프라에서 제공되는 bedrock-runtime의 InvokeModel API를 통해서도 접근할 수 있습니다. Claude on Amazon Bedrock (레거시) 통합의 ARN 버전 모델 ID 테이블에는 포함되어 있지 않습니다.
Google Cloud: Claude on Google Cloud를 통해 claude-opus-5로 사용할 수 있습니다.
Microsoft Foundry: Claude in Microsoft Foundry를 통해 사용할 수 있습니다.

Claude Opus 4.8은 이러한 모든 플랫폼에서 계속 사용할 수 있습니다.

마이그레이션 가이드

Claude Opus 4.8에서 마이그레이션하려면 모델 ID를 업데이트하세요:

model = "claude-opus-4-8"  # Before
model = "claude-opus-5"  # After

그런 다음 두 가지 동작 변경 사항을 검토하세요. 사고가 기본적으로 활성화되어 있으며, effort xhigh 또는 max에서 사고를 비활성화하면 400 오류가 반환됩니다. 단계별 지침은 마이그레이션 가이드를 참조하세요.

다음 단계

모델 개요

모든 현재 Claude 모델의 전체 사양 및 가격입니다.

Claude Opus 5 프롬프팅

Claude Opus 5에 특화된 동작 차이 및 프롬프트 패턴입니다.

Effort

Claude가 응답할 때 사용하는 토큰 수를 low부터 max까지 제어합니다.

사고

사고가 기본적으로 활성화되어 있을 때의 작동 방식과 비활성화할 수 있는 시점입니다.

작업 예산

Claude에게 작업 속도를 조절할 수 있는 권고성 토큰 예산을 제공합니다.

마이그레이션 가이드

이전 Claude 버전에서 최신 Claude 모델로 마이그레이션하기 위한 가이드입니다.

고속 모드

프리미엄 가격으로 Claude Opus 모델에서 초당 더 높은 출력 토큰을 얻으세요.

Was this page helpful?

모델 및 가격모델

Claude Opus 5의 새로운 기능

Claude Opus 5의 새로운 기능과 동작 변경 사항에 대한 개요입니다.

새로운 모델

모델	API 모델 ID	설명
Claude Opus 5	`claude-opus-5`	복잡한 에이전트 코딩 및 엔터프라이즈 작업용

전체 가격 및 사양은 모델 개요를 참조하세요.

새로운 기능

대화 중 도구 변경 (베타)

기본 폴백 모드

더 낮아진 프롬프트 캐시 최소값

고속 모드

동작 변경 사항

기본적으로 활성화된 사고

API는 아래의 effort 제한 사항에 따라 사고를 비활성화하는 옵션을 유지합니다.

더 중요해진 effort

이 요청은 effort를 max까지 최대로 올립니다:

client = anthropic.Anthropic()

with client.messages.stream(
    model="claude-opus-5",
    max_tokens=64000,
    output_config={"effort": "max"},
    messages=[
        {
            "role": "user",
            "content": "Explain why the sum of two even numbers is always even.",
        }
    ],
) as stream:
    response = stream.get_final_message()

print(response)

Claude Opus 5에서는 사고가 기본적으로 활성화되어 있으므로 thinking 필드가 필요하지 않습니다.

사고 비활성화에는 effort `high` 이하가 필요

모델 동작 차이

기능 개선

심층 추론: 긴 문제 체인 전반에 걸쳐 다단계 분석을 지속합니다.
에이전트 코딩 및 장기 작업: 확장된 도구 사용 루프 전반에 걸쳐 작업에 집중하고, 스텁이나 플레이스홀더를 남기지 않고 다중 파일 기능, 대규모 리팩터링, 엔드투엔드 기능 작업을 완료합니다.
테스트 시점 컴퓨팅 확장: 추가 effort(max 수준까지)를 더 나은 결과로 전환합니다.
낮은 effort 수준에서의 효율성: low 및 medium effort가 더 높은 설정의 일부에 불과한 토큰과 지연 시간으로 강력한 품질을 제공합니다.
코드 리뷰 및 버그 발견: 패스당 높은 비율로 실제 버그를 찾아내고 오탐이 적으며, 낮은 effort 수준에서도 정확성을 유지합니다.
비전: 차트, 문서, 다이어그램을 이해하고 UI 및 프런트엔드 비주얼을 재현하며, 작업을 반복적으로 분석, 자르기, 검증할 수 있는 도구가 주어졌을 때 가장 강력합니다.
긴 컨텍스트 작업: 1M 토큰 컨텍스트 윈도우가 기본값이자 최대값이며, 윈도우 전체에 걸쳐 일관된 지시 따르기, 도구 호출, 추론을 제공합니다.
오피스 및 문서 작업: 복잡한 수식이 포함된 다중 시트 스프레드시트를 생성 및 편집하고, 잘 구조화된 슬라이드 덱을 만듭니다.
멀티 에이전트 조정: 효과적인 작성자-검증자 패턴으로 서브에이전트 팀을 운영하며, 에이전트가 서로의 작업을 덮어쓰는 경우가 적습니다.

이러한 기능을 최대한 활용하는 프롬프트 패턴은 Claude Opus 5 프롬프팅을 참조하세요.

가격

Claude Opus 5의 가격은 입력 토큰 100만 개당 $5, 출력 토큰 100만 개당 $25로, Claude Opus 4.8과 동일합니다.

배치 처리, 프롬프트 캐싱, 고속 모드 요금을 포함한 전체 가격은 가격을 참조하세요.

사용 가능 여부

Claude Opus 5는 다음에서 사용할 수 있습니다:

Claude API: 모든 고객이 claude-opus-5로 사용할 수 있습니다.
AWS: Claude in Amazon Bedrock을 통해 anthropic.claude-opus-5로 사용할 수 있습니다. Claude Opus 5는 동일한 인프라에서 제공되는 bedrock-runtime의 InvokeModel API를 통해서도 접근할 수 있습니다. Claude on Amazon Bedrock (레거시) 통합의 ARN 버전 모델 ID 테이블에는 포함되어 있지 않습니다.
Google Cloud: Claude on Google Cloud를 통해 claude-opus-5로 사용할 수 있습니다.
Microsoft Foundry: Claude in Microsoft Foundry를 통해 사용할 수 있습니다.

Claude Opus 4.8은 이러한 모든 플랫폼에서 계속 사용할 수 있습니다.

마이그레이션 가이드

Claude Opus 4.8에서 마이그레이션하려면 모델 ID를 업데이트하세요:

model = "claude-opus-4-8"  # Before
model = "claude-opus-5"  # After

다음 단계

모델 개요

모든 현재 Claude 모델의 전체 사양 및 가격입니다.

Claude Opus 5 프롬프팅

Claude Opus 5에 특화된 동작 차이 및 프롬프트 패턴입니다.

Effort

Claude가 응답할 때 사용하는 토큰 수를 low부터 max까지 제어합니다.

사고

사고가 기본적으로 활성화되어 있을 때의 작동 방식과 비활성화할 수 있는 시점입니다.

작업 예산

Claude에게 작업 속도를 조절할 수 있는 권고성 토큰 예산을 제공합니다.

마이그레이션 가이드

이전 Claude 버전에서 최신 Claude 모델로 마이그레이션하기 위한 가이드입니다.

고속 모드

프리미엄 가격으로 Claude Opus 모델에서 초당 더 높은 출력 토큰을 얻으세요.

Was this page helpful?

새로운 모델

새로운 기능

대화 중 도구 변경 (베타)

기본 폴백 모드

더 낮아진 프롬프트 캐시 최소값

고속 모드

동작 변경 사항

기본적으로 활성화된 사고

더 중요해진 effort

사고 비활성화에는 effort high 이하가 필요

모델 동작 차이

기능 개선

가격

사용 가능 여부

마이그레이션 가이드

다음 단계

새로운 모델

새로운 기능

대화 중 도구 변경 (베타)

기본 폴백 모드

더 낮아진 프롬프트 캐시 최소값

고속 모드

동작 변경 사항

기본적으로 활성화된 사고

더 중요해진 effort

사고 비활성화에는 effort high 이하가 필요

모델 동작 차이

기능 개선

가격

사용 가능 여부

마이그레이션 가이드

다음 단계

새로운 모델

새로운 기능

대화 중 도구 변경 (베타)

기본 폴백 모드

더 낮아진 프롬프트 캐시 최소값

고속 모드

동작 변경 사항

기본적으로 활성화된 사고

더 중요해진 effort

사고 비활성화에는 effort `high` 이하가 필요

모델 동작 차이

기능 개선

가격

사용 가능 여부

마이그레이션 가이드

다음 단계

새로운 모델

새로운 기능

대화 중 도구 변경 (베타)

기본 폴백 모드

더 낮아진 프롬프트 캐시 최소값

고속 모드

동작 변경 사항

기본적으로 활성화된 사고

더 중요해진 effort

사고 비활성화에는 effort `high` 이하가 필요

모델 동작 차이

기능 개선

가격

사용 가능 여부

마이그레이션 가이드

다음 단계