• Messages
  • Managed Agents
  • 관리자

Search...
⌘K
첫 단계
Claude 소개빠른 시작
Claude로 빌드하기
기능 개요Messages API 사용하기중지 이유 및 폴백거부 및 폴백폴백 크레딧
모델 기능
확장 사고적응형 사고Effort작업 예산 (베타)고속 모드 (리서치 프리뷰)구조화된 출력인용스트리밍 메시지배치 처리검색 결과스트리밍 거부다국어 지원임베딩
도구
개요도구 사용 작동 방식튜토리얼: 도구 사용 에이전트 빌드하기도구 정의도구 호출 처리병렬 도구 사용Tool Runner (SDK)엄격한 도구 사용프롬프트 캐싱과 함께 도구 사용서버 도구문제 해결웹 검색 도구웹 가져오기 도구코드 실행 도구어드바이저 도구메모리 도구Bash 도구컴퓨터 사용 도구텍스트 편집기 도구
도구 인프라
도구 레퍼런스도구 컨텍스트 관리도구 조합도구 검색프로그래밍 방식 도구 호출세분화된 도구 스트리밍
컨텍스트 관리
컨텍스트 윈도우압축컨텍스트 편집프롬프트 캐싱대화 중 시스템 메시지오케스트레이션 모드 빌드하기캐시 진단 (베타)토큰 계산
파일 작업
Files APIPDF 지원이미지 및 비전
스킬
개요빠른 시작모범 사례엔터프라이즈용 스킬API에서의 스킬
MCP
원격 MCP 서버MCP 커넥터
클라우드 플랫폼의 Claude
Amazon BedrockAmazon Bedrock (레거시)AWS의 Claude PlatformMicrosoft FoundryVertex AI

Log in
Effort
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Claude on AWS
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Messages/모델 기능

Effort

effort 매개변수를 사용하여 Claude가 응답할 때 사용하는 토큰 수를 제어하고, 응답의 철저함과 토큰 효율성 간의 균형을 조정하세요.


이 기능은 Zero Data Retention (ZDR)의 적용 대상입니다. 조직에 ZDR 계약이 체결되어 있는 경우, 이 기능을 통해 전송된 데이터는 API 응답이 반환된 후 저장되지 않습니다.

effort 매개변수를 사용하면 Claude가 요청에 응답할 때 토큰을 얼마나 적극적으로 사용할지 제어할 수 있습니다. 이를 통해 단일 모델로 응답의 철저함과 토큰 효율성 간의 균형을 조정할 수 있습니다. effort 매개변수는 베타 헤더 없이 지원되는 모든 모델에서 사용할 수 있습니다.



effort 매개변수는 Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6, Claude Opus 4.5에서 지원됩니다.



Claude Opus 4.6 및 Sonnet 4.6의 경우, effort가 사고 깊이를 제어하는 권장 방법으로 budget_tokens를 대체합니다. 최상의 경험을 위해 effort를 adaptive thinking(적응형 사고, thinking: {type: "adaptive"})과 함께 사용하세요. budget_tokens는 Opus 4.6 및 Sonnet 4.6에서 여전히 허용되지만, 더 이상 사용되지 않으며 향후 모델 릴리스에서 제거될 예정입니다. high(기본값) 및 max effort에서는 Claude가 거의 항상 사고합니다. 더 낮은 effort 수준에서는 더 간단한 문제에 대해 사고를 건너뛸 수 있습니다.

effort 작동 방식

기본적으로 Claude는 high effort를 사용하여 우수한 결과를 위해 필요한 만큼의 토큰을 사용합니다. 절대적으로 가장 높은 성능을 위해 effort 수준을 max로 높이거나, 토큰 사용을 더 보수적으로 하여 속도와 비용을 최적화하면서 일부 성능 저하를 감수하도록 낮출 수 있습니다.



effort를 "high"로 설정하면 effort 매개변수를 완전히 생략하는 것과 정확히 동일한 동작이 발생합니다.

effort 매개변수는 다음을 포함하여 응답의 모든 토큰에 영향을 미칩니다.

  • 텍스트 응답 및 설명
  • 도구 호출 및 함수 인수
  • 확장 사고(활성화된 경우)

이 접근 방식에는 두 가지 주요 이점이 있습니다.

  1. 사용하기 위해 사고를 활성화할 필요가 없습니다.
  2. 도구 호출을 포함한 모든 토큰 사용에 영향을 미칠 수 있습니다. 예를 들어, 더 낮은 effort는 Claude가 더 적은 도구 호출을 수행함을 의미합니다. 이를 통해 효율성을 훨씬 더 세밀하게 제어할 수 있습니다.

Effort 수준

수준설명일반적인 사용 사례
max토큰 사용에 제약이 없는 절대적인 최대 성능. Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6에서 사용 가능합니다.가능한 가장 깊은 추론과 가장 철저한 분석이 필요한 작업
xhigh장기 작업을 위한 확장된 성능. Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Opus 4.7에서 사용 가능합니다.수백만 단위의 토큰 예산을 가진 장시간 실행(30분 이상) 에이전트 및 코딩 작업
high높은 성능. 매개변수를 설정하지 않는 것과 동일합니다.복잡한 추론, 어려운 코딩 문제, 에이전트 작업
medium적당한 토큰 절약을 제공하는 균형 잡힌 접근 방식.속도, 비용, 성능의 균형이 필요한 에이전트 작업
low가장 효율적. 일부 성능 저하와 함께 상당한 토큰 절약.서브에이전트와 같이 최고의 속도와 최저 비용이 필요한 더 간단한 작업


Effort는 엄격한 토큰 예산이 아니라 동작 신호입니다. 더 낮은 effort 수준에서도 Claude는 충분히 어려운 문제에 대해 여전히 사고하지만, 동일한 문제에 대해 더 높은 effort 수준에서보다는 덜 사고합니다.

Sonnet 4.6의 권장 effort 수준

Sonnet 4.6은 기본적으로 high effort를 사용합니다. 예상치 못한 지연 시간을 방지하려면 Sonnet 4.6을 사용할 때 effort를 명시적으로 설정하세요.

  • Medium effort(권장 기본값): 대부분의 애플리케이션에서 속도, 비용, 성능의 최적 균형. 에이전트 코딩, 도구 중심 워크플로, 코드 생성에 적합합니다.
  • Low effort: 대용량 또는 지연 시간에 민감한 워크로드용. 빠른 처리가 우선시되는 채팅 및 비코딩 사용 사례에 적합합니다.
  • High effort: 속도나 비용보다 품질이 더 중요한 복잡한 추론 및 작업용.
  • Max effort: 토큰 사용에 제약 없이 절대적으로 가장 높은 성능이 필요한 작업용.

Claude Opus 4.7의 권장 effort 수준

코딩 및 에이전트 사용 사례에는 xhigh로 시작하고, 대부분의 지능에 민감한 워크로드에는 최소 high를 사용하세요. 비용에 민감한 워크로드의 경우 medium으로 낮추거나, 평가에서 xhigh에 측정 가능한 여유가 있는 경우에만 max로 높이세요.

API 기본값은 high입니다. xhigh를 사용하려면 effort를 명시적으로 설정하세요. 전달한 값이 기본값을 재정의합니다.

EffortClaude Opus 4.7에 대한 지침
low효율적이지만 짧고 범위가 정해진 작업에 가장 적합합니다. 작업에 여러 섹션이 있는 경우 low를 명시적인 체크리스트와 함께 사용하세요.
medium비용을 줄이면서 좋은 결과를 원하는 일반적인 워크플로에 바로 적용할 수 있는 옵션입니다.
high지능과 토큰 소비의 균형이 여전히 필요한 고급 사용 사례. 품질과 토큰 효율성의 균형을 맞추는 최적점인 경우가 많습니다.
xhigh코딩 및 에이전트 작업, 그리고 반복적인 도구 호출, 상세한 웹 검색, 지식 베이스 검색과 같은 탐색적 작업의 권장 시작점입니다. high보다 토큰 사용량이 상당히 높을 것으로 예상하세요.
max진정으로 최첨단 문제를 위해 남겨두세요. 대부분의 워크로드에서 max는 상대적으로 작은 품질 향상에 비해 상당한 비용을 추가하며, 일부 구조화된 출력 또는 지능에 덜 민감한 작업에서는 과도한 사고로 이어질 수 있습니다.

Claude Opus 4.7은 또한 특히 low 및 medium에서 Claude Opus 4.6보다 effort 수준을 더 엄격하게 준수합니다. 더 낮은 effort 수준에서 모델은 요청된 것 이상으로 나아가지 않고 요청된 범위 내에서 작업합니다. Claude Opus 4.7에서 복잡한 문제에 대해 얕은 추론이 관찰되면 프롬프트로 우회하기보다 effort를 높이세요. 지연 시간 때문에 effort를 낮게 유지해야 하는 경우 "이 작업은 다단계 추론이 필요합니다. 응답하기 전에 신중하게 생각하세요."와 같은 구체적인 지침을 추가하세요.

Claude Opus 4.7을 xhigh 또는 max effort로 실행할 때는 모델이 서브에이전트와 도구 호출 전반에 걸쳐 사고하고 행동할 수 있는 여유를 갖도록 큰 max_tokens를 설정하세요. 64k 토큰에서 시작하여 조정하는 것이 합리적인 기본값입니다.

Claude Opus 4.8의 권장 effort 수준

위의 Claude Opus 4.7에 대한 지침은 Claude Opus 4.8에도 적용됩니다. 코딩 및 에이전트 사용 사례에는 xhigh로 시작하고, 대부분의 다른 지능에 민감한 워크로드에는 high를 사용하며, 평가에서 더 낮은 수준이 품질을 유지한다는 것을 측정한 경우에만 medium 또는 low로 낮추세요.

Claude API 및 Claude Code를 포함한 모든 환경에서 기본값은 high입니다. 다른 수준을 사용하려면 effort를 명시적으로 설정하세요. 전달한 값이 기본값을 재정의합니다.

Claude Opus 4.8을 xhigh 또는 max effort로 실행할 때는 모델이 서브에이전트와 도구 호출 전반에 걸쳐 사고하고 행동할 수 있는 여유를 갖도록 큰 max_tokens를 설정하세요. 64k 토큰에서 시작하여 조정하는 것이 합리적인 기본값입니다.

Claude Fable 5의 권장 effort 수준

Effort는 Claude Fable 5에서 지능, 지연 시간, 비용 간의 균형을 조정하는 주요 제어 수단입니다. 대부분의 작업에는 기본값인 high로 시작하고, 성능에 가장 민감한 워크로드에는 xhigh를 사용하며, 일상적인 작업에는 medium 또는 low로 낮추세요. Claude Fable 5의 더 낮은 effort 설정도 여전히 우수한 성능을 발휘하며 이전 모델의 xhigh 성능을 능가하는 경우가 많습니다. high 및 xhigh에서는 큰 max_tokens를 설정하세요. 이는 사고와 응답 텍스트를 합친 총 출력에 대한 엄격한 제한입니다. 비용 제어를 참조하세요.

작업이 완료되지만 필요 이상으로 오래 걸리거나, 더 빠르고 상호작용적인 작업 스타일을 원하는 경우 effort를 줄이세요. 동일한 권장 사항이 Claude Mythos 5에도 적용됩니다. 더 자세한 지침은 Claude Fable 5 프롬프트 작성을 참조하세요.

기본 사용법

effort 매개변수를 조정해야 하는 경우

  • 제약 없이 절대적으로 가장 높은 성능, 즉 가장 철저한 추론과 가장 깊은 분석이 필요한 경우 max effort를 사용하세요. Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6에서 사용 가능합니다.
  • 반복적인 도구 호출 및 상세한 검색과 같이 확장된 탐색이 필요한 고급 코딩 및 복잡한 에이전트 작업에는 xhigh effort를 사용하세요. Claude Fable 5, Claude Mythos 5, Claude Opus 4.8, Claude Opus 4.7에서 사용 가능합니다.
  • 복잡한 추론, 미묘한 분석, 어려운 코딩 문제 또는 속도나 비용보다 품질이 더 중요한 모든 작업에는 high effort(기본값)를 사용하세요.
  • high effort의 전체 토큰 소비 없이 견고한 성능을 원할 때 균형 잡힌 옵션으로 medium effort를 사용하세요.
  • 속도(Claude가 더 적은 토큰으로 응답하기 때문) 또는 비용을 최적화할 때 low effort를 사용하세요. 예를 들어, 간단한 분류 작업, 빠른 조회, 또는 미미한 품질 향상이 추가 지연 시간이나 비용을 정당화하지 못하는 대용량 사용 사례가 있습니다.


Claude Code의 ultracode 모드: ultracode는 Claude Code의 effort 메뉴에 표시되지만 추가적인 API effort 수준이 아닙니다. 이 페이지에 문서화된 값이 API가 허용하는 전체 집합입니다. Ultracode는 xhigh effort 수준을 대화 중 시스템 메시지를 통해 부여된, Claude Code가 멀티 에이전트 워크플로를 시작할 수 있는 상시 권한과 결합합니다. API로 유사한 동작을 구축하려면 오케스트레이션 모드 구축을 참조하세요.

도구 사용과 effort

도구를 사용할 때 effort 매개변수는 도구 호출에 대한 설명과 도구 호출 자체 모두에 영향을 미칩니다. 더 낮은 effort 수준은 다음과 같은 경향이 있습니다.

  • 여러 작업을 더 적은 도구 호출로 결합
  • 더 적은 도구 호출 수행
  • 서두 없이 바로 작업 진행
  • 완료 후 간결한 확인 메시지 사용

더 높은 effort 수준은 다음과 같을 수 있습니다.

  • 더 많은 도구 호출 수행
  • 작업을 수행하기 전에 계획 설명
  • 변경 사항에 대한 상세한 요약 제공
  • 더 포괄적인 코드 주석 포함

확장 사고와 effort

effort 매개변수는 확장 사고와 함께 작동합니다. 동작은 모델에 따라 다릅니다.

  • Claude Fable 5 및 Claude Mythos 5는 항상 켜져 있는 adaptive thinking(적응형 사고)을 사용합니다(thinking 구성 불필요). thinking: {type: "disabled"}는 거부됩니다. Effort는 Opus 4.8 및 Opus 4.7과 동일한 방식으로 사고 깊이를 제어합니다.
  • Claude Opus 4.8은 adaptive thinking(thinking: {type: "adaptive"})을 사용하며, 여기서 effort가 사고 깊이를 제어하는 권장 방법입니다. 수동 확장 사고(thinking: {type: "enabled", budget_tokens: N})는 지원되지 않으며 400 오류를 반환합니다. 모델은 각 요청에 따라 언제 얼마나 사고할지 결정하므로 필요할 때만 사고를 트리거합니다. high, xhigh, max effort에서는 Claude가 거의 항상 깊이 사고합니다. 더 낮은 수준에서는 더 간단한 문제에 대해 사고를 건너뛸 수 있습니다. 사고를 활성화하려면 thinking: {type: "adaptive"}를 설정하세요. 이를 설정하지 않으면 요청이 사고 없이 실행됩니다.
  • Claude Mythos Preview는 기본적으로 adaptive thinking을 사용합니다(thinking 구성 불필요). thinking: {type: "disabled"}는 거부됩니다. Effort는 Opus 4.7 및 Opus 4.6과 동일한 방식으로 사고 깊이를 제어합니다.
  • 은 ()을 사용하며, 여기서 effort가 사고 깊이를 제어하는 권장 방법입니다. 수동 확장 사고()는 Opus 4.7에서 더 이상 지원되지 않습니다. 대신 effort와 함께 adaptive thinking을 사용하세요. , , effort에서는 Claude가 거의 항상 깊이 사고합니다. 더 낮은 수준에서는 더 간단한 문제에 대해 사고를 건너뛸 수 있습니다.

effort 매개변수는 확장 사고 활성화 여부와 관계없이 사용할 수 있습니다. 사고 없이 사용할 때도 텍스트 응답 및 도구 호출에 대한 전체 토큰 사용을 여전히 제어합니다.

모범 사례

  1. effort를 명시적으로 설정하세요: API 기본값은 high이지만, 적절한 시작점은 모델과 워크로드에 따라 다릅니다.
  2. 속도에 민감하거나 간단한 작업에는 low를 사용하세요: 지연 시간이 중요하거나 작업이 간단한 경우 low effort는 응답 시간과 비용을 크게 줄일 수 있습니다.
  3. 사용 사례를 테스트하세요: effort 수준의 영향은 작업 유형에 따라 다릅니다. 배포하기 전에 특정 사용 사례에서 성능을 평가하세요.
  4. 동적 effort를 고려하세요: 작업 복잡도에 따라 effort를 조정하세요. 간단한 쿼리는 low effort가 적합할 수 있지만 에이전트 코딩 및 복잡한 추론은 high effort의 이점을 얻습니다.

Was this page helpful?

  • effort 작동 방식
  • Effort 수준
  • Sonnet 4.6의 권장 effort 수준
  • Claude Opus 4.7의 권장 effort 수준
  • Claude Opus 4.8의 권장 effort 수준
  • Claude Fable 5의 권장 effort 수준
  • 기본 사용법
  • effort 매개변수를 조정해야 하는 경우
  • 도구 사용과 effort
  • 확장 사고와 effort
  • 모범 사례
client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=4096,
    messages=[
        {
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures",
        }
    ],
    output_config={"effort": "medium"},
)

print(response.content[0].text)
Claude Opus 4.7
adaptive thinking
thinking: {type: "adaptive"}
thinking: {type: "enabled", budget_tokens: N}
high
xhigh
max
  • Claude Opus 4.6은 adaptive thinking(thinking: {type: "adaptive"})을 사용하며, 여기서 effort가 사고 깊이를 제어하는 권장 방법입니다. budget_tokens는 Opus 4.6에서 여전히 허용되지만, 더 이상 사용되지 않으며 향후 릴리스에서 제거될 예정입니다. high 및 max effort에서는 Claude가 거의 항상 깊이 사고합니다. 더 낮은 수준에서는 더 간단한 문제에 대해 사고를 건너뛸 수 있습니다.
  • Claude Sonnet 4.6은 adaptive thinking(effort가 사고 깊이를 제어)을 사용합니다. interleaved 모드를 사용한 수동 사고(thinking: {type: "enabled", budget_tokens: N})는 여전히 작동하지만 더 이상 사용되지 않습니다.
  • Claude Opus 4.5는 수동 사고(thinking: {type: "enabled", budget_tokens: N})를 사용하며, 여기서 effort는 사고 토큰 예산과 함께 작동합니다. 작업에 맞는 effort 수준을 설정한 다음 작업 복잡도에 따라 사고 토큰 예산을 설정하세요.