Loading...
  • 빌드
  • 관리
  • 모델 및 가격
  • 클라이언트 SDK
  • API 참조
Search...
⌘K
Log in
노력
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
빌드/모델 기능

노력

노력 매개변수를 사용하여 Claude가 응답할 때 사용하는 토큰 수를 제어하고, 응답의 철저함과 토큰 효율성 사이의 균형을 조정합니다.

This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

노력 매개변수를 사용하면 Claude가 요청에 응답할 때 토큰을 얼마나 적극적으로 사용할지 제어할 수 있습니다. 이를 통해 단일 모델로 응답의 철저함과 토큰 효율성 사이의 균형을 조정할 수 있습니다. 노력 매개변수는 베타 헤더가 필요 없이 지원되는 모든 모델에서 일반적으로 사용 가능합니다.

노력 매개변수는 Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6, Claude Opus 4.5에서 지원됩니다.

Claude Opus 4.6 및 Sonnet 4.6의 경우, 노력이 사고 깊이를 제어하는 권장 방법으로 budget_tokens을 대체합니다. 노력을 적응형 사고(thinking: {type: "adaptive"})와 결합하여 최고의 경험을 얻으세요. budget_tokens은 여전히 Opus 4.6 및 Sonnet 4.6에서 허용되지만 더 이상 사용되지 않으며 향후 모델 릴리스에서 제거될 예정입니다. high(기본값) 및 max 노력에서 Claude는 거의 항상 사고합니다. 더 낮은 노력 수준에서는 더 간단한 문제에 대해 사고를 건너뛸 수 있습니다.

노력이 작동하는 방식

기본적으로 Claude는 높은 노력을 사용하여 우수한 결과를 위해 필요한 만큼의 토큰을 사용합니다. 노력 수준을 max로 올려서 절대적으로 최고의 능력을 얻거나, 토큰 사용을 더 보수적으로 하여 속도와 비용을 최적화하면서 일부 능력 감소를 수용할 수 있습니다.

effort를 "high"로 설정하면 effort 매개변수를 완전히 생략하는 것과 정확히 동일한 동작을 생성합니다.

노력 매개변수는 다음을 포함한 모든 토큰에 영향을 미칩니다:

  • 텍스트 응답 및 설명
  • 도구 호출 및 함수 인수
  • 확장 사고(활성화된 경우)

이 접근 방식에는 두 가지 주요 이점이 있습니다:

  1. 사용하기 위해 사고를 활성화할 필요가 없습니다.
  2. 도구 호출을 포함한 모든 토큰 지출에 영향을 미칠 수 있습니다. 예를 들어, 더 낮은 노력은 Claude가 더 적은 도구 호출을 수행한다는 의미입니다. 이는 효율성에 대한 훨씬 더 큰 제어 수준을 제공합니다.

노력 수준

수준설명일반적인 사용 사례
max토큰 지출에 제약이 없는 절대적 최대 능력. Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6에서 사용 가능.가장 깊은 추론과 가장 철저한 분석이 필요한 작업
xhigh장기 작업을 위한 확장 능력. Claude Opus 4.7에서 사용 가능.수백만 개의 토큰 예산을 가진 장기 실행 에이전트 및 코딩 작업(30분 이상)
high높은 능력. 매개변수를 설정하지 않는 것과 동등.복잡한 추론, 어려운 코딩 문제, 에이전트 작업
medium적당한 토큰 절감을 포함한 균형 잡힌 접근.속도, 비용 및 성능의 균형이 필요한 에이전트 작업
low가장 효율적. 일부 능력 감소로 상당한 토큰 절감.최고의 속도와 최저 비용이 필요한 더 간단한 작업(예: 서브에이전트)

노력은 엄격한 토큰 예산이 아니라 행동 신호입니다. 더 낮은 노력 수준에서 Claude는 충분히 어려운 문제에 대해 여전히 사고하지만, 같은 문제에 대해 더 높은 노력 수준에서보다 덜 사고합니다.

Sonnet 4.6에 권장되는 노력 수준

Sonnet 4.6은 high 노력으로 기본 설정됩니다. Sonnet 4.6을 사용할 때 예상치 못한 지연을 피하기 위해 노력을 명시적으로 설정하세요:

  • 중간 노력(권장 기본값): 대부분의 애플리케이션에 대한 속도, 비용 및 성능의 최고 균형. 에이전트 코딩, 도구 중심 워크플로우 및 코드 생성에 적합합니다.
  • 낮은 노력: 대량 또는 지연 시간에 민감한 워크로드의 경우. 더 빠른 처리가 우선되는 채팅 및 비코딩 사용 사례에 적합합니다.
  • 높은 노력: Sonnet 4.6에서 최대 지능이 필요한 작업의 경우.
  • 최대 노력: 토큰 지출에 제약이 없는 절대적 최고 능력이 필요한 작업의 경우.

Claude Opus 4.7에 권장되는 노력 수준

코딩 및 에이전트 사용 사례의 경우 xhigh로 시작하고, 대부분의 지능 민감 워크로드의 경우 high를 최소값으로 사용하세요. 비용 민감 워크로드의 경우 medium으로 내려가거나, 평가에서 xhigh에서 측정 가능한 여유가 있을 때만 max로 올려가세요.

API 기본값은 high입니다. xhigh를 사용하려면 effort를 명시적으로 설정하세요. 전달하는 값이 기본값을 재정의합니다.

노력Claude Opus 4.7에 대한 지침
low효율적이지만 짧고 범위가 지정된 작업에 가장 적합합니다. 작업에 여러 섹션이 있는 경우 low와 명시적 체크리스트를 함께 사용하세요.
medium좋은 결과를 원하면서 비용을 줄이고 싶은 평균 워크플로우에 대한 드롭인 대체.
high여전히 지능과 토큰 소비의 균형이 필요한 고급 사용 사례. 이것은 종종 품질과 토큰 효율성의 균형을 맞추는 최적의 지점입니다.
xhigh코딩 및 에이전트 작업의 권장 시작점이며, 반복된 도구 호출, 상세한 웹 검색 및 지식 기반 검색과 같은 탐색 작업의 경우. high보다 의미 있게 높은 토큰 사용을 예상하세요.
max진정한 최전선 문제를 위해 예약하세요. 대부분의 워크로드에서 max는 상대적으로 작은 품질 향상을 위해 상당한 비용을 추가하며, 일부 구조화된 출력 또는 지능 민감도가 낮은 작업에서는 과도한 사고로 이어질 수 있습니다.

Claude Opus 4.7은 특히 low 및 medium에서 Claude Opus 4.6보다 노력 수준을 더 엄격하게 준수합니다. 더 낮은 노력 수준에서 모델은 그 이상을 하지 않고 요청된 것으로 작업 범위를 지정합니다. Claude Opus 4.7에서 복잡한 문제에 대해 얕은 추론을 관찰하면 프롬프트 주변을 하기보다는 노력을 올리세요. 지연 시간을 낮게 유지해야 하는 경우 "이 작업은 다단계 추론을 포함합니다. 응답하기 전에 신중하게 생각하세요."와 같은 대상 지침을 추가하세요.

Claude Opus 4.7을 xhigh 또는 max 노력으로 실행할 때, 모델이 서브에이전트 및 도구 호출 전체에서 생각하고 행동할 수 있는 공간을 가질 수 있도록 큰 max_tokens을 설정하세요. 64k 토큰에서 시작하여 거기서 조정하는 것이 합리적인 기본값입니다.

기본 사용법

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=4096,
    messages=[
        {
            "role": "user",
            "content": "Analyze the trade-offs between microservices and monolithic architectures",
        }
    ],
    output_config={"effort": "medium"},
)

print(response.content[0].text)

노력 매개변수를 조정해야 할 때

  • 최대 노력을 사용하세요. 제약이 없는 절대적 최고 능력이 필요할 때: 가장 철저한 추론과 가장 깊은 분석. Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6에서 사용 가능합니다.
  • xhigh 노력을 사용하세요. 반복된 도구 호출 및 상세한 검색과 같은 확장된 탐색이 필요한 고급 코딩 및 복잡한 에이전트 작업의 경우. Claude Opus 4.7에서 사용 가능합니다.
  • 높은 노력(기본값)을 사용하세요. Claude의 최고의 작업이 필요할 때: 복잡한 추론, 미묘한 분석, 어려운 코딩 문제 또는 품질이 최우선인 모든 작업.
  • 중간 노력을 사용하세요. 높은 노력의 전체 토큰 지출 없이 견고한 성능을 원할 때 균형 잡힌 옵션으로.
  • 낮은 노력을 사용하세요. 속도(Claude가 더 적은 토큰으로 응답하기 때문에) 또는 비용을 최적화할 때. 예를 들어, 간단한 분류 작업, 빠른 조회 또는 한계 품질 개선이 추가 지연 또는 지출을 정당화하지 않는 대량 사용 사례.

도구 사용과 함께 노력

도구를 사용할 때, 노력 매개변수는 도구 호출 주변의 설명과 도구 호출 자체 모두에 영향을 미칩니다. 더 낮은 노력 수준은 다음 경향이 있습니다:

  • 여러 작업을 더 적은 도구 호출로 결합
  • 더 적은 도구 호출 수행
  • 전문 없이 직접 행동으로 진행
  • 완료 후 간결한 확인 메시지 사용

더 높은 노력 수준은 다음을 할 수 있습니다:

  • 더 많은 도구 호출 수행
  • 행동을 취하기 전에 계획 설명
  • 변경 사항의 상세한 요약 제공
  • 더 포괄적인 코드 주석 포함

확장 사고와 함께 노력

노력 매개변수는 확장 사고와 함께 작동합니다. 그 동작은 모델에 따라 다릅니다:

  • Claude Mythos Preview는 기본적으로 적응형 사고를 사용합니다(thinking 구성이 필요하지 않음). thinking: {type: "disabled"}는 거부됩니다. 노력은 Opus 4.7 및 Opus 4.6과 동일한 방식으로 사고 깊이를 제어합니다.
  • Claude Opus 4.7은 적응형 사고(thinking: {type: "adaptive"})를 사용하며, 여기서 노력은 사고 깊이를 제어하는 권장 방법입니다. 수동 확장 사고(thinking: {type: "enabled", budget_tokens: N})는 더 이상 Opus 4.7에서 지원되지 않습니다. 대신 노력과 함께 적응형 사고를 사용하세요. high, xhigh, max 노력에서 Claude는 거의 항상 깊게 생각합니다. 더 낮은 수준에서는 더 간단한 문제에 대해 사고를 건너뛸 수 있습니다.
  • Claude Opus 4.6은 적응형 사고(thinking: {type: "adaptive"})를 사용하며, 여기서 노력은 사고 깊이를 제어하는 권장 방법입니다. budget_tokens은 여전히 Opus 4.6에서 허용되지만 더 이상 사용되지 않으며 향후 릴리스에서 제거될 예정입니다. high 및 max 노력에서 Claude는 거의 항상 깊게 생각합니다. 더 낮은 수준에서는 더 간단한 문제에 대해 사고를 건너뛸 수 있습니다.
  • Claude Sonnet 4.6은 적응형 사고를 사용합니다(노력이 사고 깊이를 제어함). 인터리브 모드(thinking: {type: "enabled", budget_tokens: N})를 사용한 수동 사고는 여전히 기능하지만 더 이상 사용되지 않습니다.
  • Claude Opus 4.5 및 기타 Claude 4 모델은 수동 사고(thinking: {type: "enabled", budget_tokens: N})를 사용하며, 여기서 노력은 사고 토큰 예산과 함께 작동합니다. 작업에 대한 노력 수준을 설정한 다음 작업 복잡도에 따라 사고 토큰 예산을 설정하세요.

노력 매개변수는 확장 사고 활성화 여부와 관계없이 사용할 수 있습니다. 사고 없이 사용할 때, 텍스트 응답 및 도구 호출에 대한 전체 토큰 지출을 여전히 제어합니다.

모범 사례

  1. 노력을 명시적으로 설정하세요: API는 기본값으로 high이지만, 올바른 시작점은 모델과 워크로드에 따라 다릅니다.
  2. 속도에 민감하거나 간단한 작업에 낮은 노력을 사용하세요: 지연 시간이 중요하거나 작업이 간단할 때, 낮은 노력은 응답 시간과 비용을 크게 줄일 수 있습니다.
  3. 사용 사례를 테스트하세요: 노력 수준의 영향은 작업 유형에 따라 다릅니다. 배포하기 전에 특정 사용 사례에 대한 성능을 평가하세요.
  4. 동적 노력을 고려하세요: 작업 복잡도에 따라 노력을 조정하세요. 간단한 쿼리는 낮은 노력을 보증할 수 있지만 에이전트 코딩 및 복잡한 추론은 높은 노력의 이점을 얻습니다.

Was this page helpful?

  • Sonnet 4.6에 권장되는 노력 수준
  • Claude Opus 4.7에 권장되는 노력 수준