This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.
노력 매개변수를 사용하면 Claude가 요청에 응답할 때 토큰을 얼마나 적극적으로 사용할지 제어할 수 있습니다. 이를 통해 단일 모델로 응답의 철저함과 토큰 효율성 사이의 균형을 조정할 수 있습니다. 노력 매개변수는 베타 헤더가 필요 없이 지원되는 모든 모델에서 일반적으로 사용 가능합니다.
노력 매개변수는 Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6, Claude Opus 4.5에서 지원됩니다.
Claude Opus 4.6 및 Sonnet 4.6의 경우, 노력이 사고 깊이를 제어하는 권장 방법으로 budget_tokens을 대체합니다. 노력을 적응형 사고(thinking: {type: "adaptive"})와 결합하여 최고의 경험을 얻으세요. budget_tokens은 여전히 Opus 4.6 및 Sonnet 4.6에서 허용되지만 더 이상 사용되지 않으며 향후 모델 릴리스에서 제거될 예정입니다. high(기본값) 및 max 노력에서 Claude는 거의 항상 사고합니다. 더 낮은 노력 수준에서는 더 간단한 문제에 대해 사고를 건너뛸 수 있습니다.
기본적으로 Claude는 높은 노력을 사용하여 우수한 결과를 위해 필요한 만큼의 토큰을 사용합니다. 노력 수준을 max로 올려서 절대적으로 최고의 능력을 얻거나, 토큰 사용을 더 보수적으로 하여 속도와 비용을 최적화하면서 일부 능력 감소를 수용할 수 있습니다.
effort를 "high"로 설정하면 effort 매개변수를 완전히 생략하는 것과 정확히 동일한 동작을 생성합니다.
노력 매개변수는 다음을 포함한 모든 토큰에 영향을 미칩니다:
이 접근 방식에는 두 가지 주요 이점이 있습니다:
| 수준 | 설명 | 일반적인 사용 사례 |
|---|---|---|
max | 토큰 지출에 제약이 없는 절대적 최대 능력. Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Sonnet 4.6에서 사용 가능. | 가장 깊은 추론과 가장 철저한 분석이 필요한 작업 |
xhigh | 장기 작업을 위한 확장 능력. Claude Opus 4.7에서 사용 가능. | 수백만 개의 토큰 예산을 가진 장기 실행 에이전트 및 코딩 작업(30분 이상) |
high | 높은 능력. 매개변수를 설정하지 않는 것과 동등. | 복잡한 추론, 어려운 코딩 문제, 에이전트 작업 |
medium | 적당한 토큰 절감을 포함한 균형 잡힌 접근. | 속도, 비용 및 성능의 균형이 필요한 에이전트 작업 |
low | 가장 효율적. 일부 능력 감소로 상당한 토큰 절감. | 최고의 속도와 최저 비용이 필요한 더 간단한 작업(예: 서브에이전트) |
노력은 엄격한 토큰 예산이 아니라 행동 신호입니다. 더 낮은 노력 수준에서 Claude는 충분히 어려운 문제에 대해 여전히 사고하지만, 같은 문제에 대해 더 높은 노력 수준에서보다 덜 사고합니다.
Sonnet 4.6은 high 노력으로 기본 설정됩니다. Sonnet 4.6을 사용할 때 예상치 못한 지연을 피하기 위해 노력을 명시적으로 설정하세요:
코딩 및 에이전트 사용 사례의 경우 xhigh로 시작하고, 대부분의 지능 민감 워크로드의 경우 high를 최소값으로 사용하세요. 비용 민감 워크로드의 경우 medium으로 내려가거나, 평가에서 xhigh에서 측정 가능한 여유가 있을 때만 max로 올려가세요.
API 기본값은 high입니다. xhigh를 사용하려면 effort를 명시적으로 설정하세요. 전달하는 값이 기본값을 재정의합니다.
| 노력 | Claude Opus 4.7에 대한 지침 |
|---|---|
low | 효율적이지만 짧고 범위가 지정된 작업에 가장 적합합니다. 작업에 여러 섹션이 있는 경우 low와 명시적 체크리스트를 함께 사용하세요. |
medium | 좋은 결과를 원하면서 비용을 줄이고 싶은 평균 워크플로우에 대한 드롭인 대체. |
high | 여전히 지능과 토큰 소비의 균형이 필요한 고급 사용 사례. 이것은 종종 품질과 토큰 효율성의 균형을 맞추는 최적의 지점입니다. |
xhigh | 코딩 및 에이전트 작업의 권장 시작점이며, 반복된 도구 호출, 상세한 웹 검색 및 지식 기반 검색과 같은 탐색 작업의 경우. high보다 의미 있게 높은 토큰 사용을 예상하세요. |
max | 진정한 최전선 문제를 위해 예약하세요. 대부분의 워크로드에서 max는 상대적으로 작은 품질 향상을 위해 상당한 비용을 추가하며, 일부 구조화된 출력 또는 지능 민감도가 낮은 작업에서는 과도한 사고로 이어질 수 있습니다. |
Claude Opus 4.7은 특히 low 및 medium에서 Claude Opus 4.6보다 노력 수준을 더 엄격하게 준수합니다. 더 낮은 노력 수준에서 모델은 그 이상을 하지 않고 요청된 것으로 작업 범위를 지정합니다. Claude Opus 4.7에서 복잡한 문제에 대해 얕은 추론을 관찰하면 프롬프트 주변을 하기보다는 노력을 올리세요. 지연 시간을 낮게 유지해야 하는 경우 "이 작업은 다단계 추론을 포함합니다. 응답하기 전에 신중하게 생각하세요."와 같은 대상 지침을 추가하세요.
Claude Opus 4.7을 xhigh 또는 max 노력으로 실행할 때, 모델이 서브에이전트 및 도구 호출 전체에서 생각하고 행동할 수 있는 공간을 가질 수 있도록 큰 max_tokens을 설정하세요. 64k 토큰에서 시작하여 거기서 조정하는 것이 합리적인 기본값입니다.
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=4096,
messages=[
{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures",
}
],
output_config={"effort": "medium"},
)
print(response.content[0].text)도구를 사용할 때, 노력 매개변수는 도구 호출 주변의 설명과 도구 호출 자체 모두에 영향을 미칩니다. 더 낮은 노력 수준은 다음 경향이 있습니다:
더 높은 노력 수준은 다음을 할 수 있습니다:
노력 매개변수는 확장 사고와 함께 작동합니다. 그 동작은 모델에 따라 다릅니다:
thinking 구성이 필요하지 않음). thinking: {type: "disabled"}는 거부됩니다. 노력은 Opus 4.7 및 Opus 4.6과 동일한 방식으로 사고 깊이를 제어합니다.thinking: {type: "adaptive"})를 사용하며, 여기서 노력은 사고 깊이를 제어하는 권장 방법입니다. 수동 확장 사고(thinking: {type: "enabled", budget_tokens: N})는 더 이상 Opus 4.7에서 지원되지 않습니다. 대신 노력과 함께 적응형 사고를 사용하세요. high, xhigh, max 노력에서 Claude는 거의 항상 깊게 생각합니다. 더 낮은 수준에서는 더 간단한 문제에 대해 사고를 건너뛸 수 있습니다.thinking: {type: "adaptive"})를 사용하며, 여기서 노력은 사고 깊이를 제어하는 권장 방법입니다. budget_tokens은 여전히 Opus 4.6에서 허용되지만 더 이상 사용되지 않으며 향후 릴리스에서 제거될 예정입니다. high 및 max 노력에서 Claude는 거의 항상 깊게 생각합니다. 더 낮은 수준에서는 더 간단한 문제에 대해 사고를 건너뛸 수 있습니다.thinking: {type: "enabled", budget_tokens: N})를 사용한 수동 사고는 여전히 기능하지만 더 이상 사용되지 않습니다.thinking: {type: "enabled", budget_tokens: N})를 사용하며, 여기서 노력은 사고 토큰 예산과 함께 작동합니다. 작업에 대한 노력 수준을 설정한 다음 작업 복잡도에 따라 사고 토큰 예산을 설정하세요.노력 매개변수는 확장 사고 활성화 여부와 관계없이 사용할 수 있습니다. 사고 없이 사용할 때, 텍스트 응답 및 도구 호출에 대한 전체 토큰 지출을 여전히 제어합니다.
high이지만, 올바른 시작점은 모델과 워크로드에 따라 다릅니다.Was this page helpful?