Was this page helpful?
This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.
effort 파라미터를 사용하면 Claude가 요청에 응답할 때 토큰을 얼마나 적극적으로 사용할지 제어할 수 있습니다. 이를 통해 단일 모델로 응답의 철저함과 토큰 효율성 간의 균형을 조절할 수 있습니다. effort 파라미터는 베타 헤더 없이 지원되는 모든 모델에서 일반적으로 사용 가능합니다.
effort 파라미터는 Claude Mythos Preview, Claude Opus 4.6, Claude Sonnet 4.6, Claude Opus 4.5에서 지원됩니다.
Claude Opus 4.6 및 Sonnet 4.6의 경우, effort는 사고 깊이를 제어하는 권장 방법으로 budget_tokens를 대체합니다. 최상의 경험을 위해 effort와 적응형 사고 (thinking: {type: "adaptive"})를 함께 사용하세요. budget_tokens는 Opus 4.6 및 Sonnet 4.6에서 여전히 허용되지만, 더 이상 사용되지 않으며 향후 모델 릴리스에서 제거될 예정입니다. high(기본값) 및 max effort에서 Claude는 거의 항상 사고합니다. 낮은 effort 수준에서는 더 간단한 문제에 대해 사고를 건너뛸 수 있습니다.
기본적으로 Claude는 높은 effort를 사용하여 우수한 결과를 위해 필요한 만큼 토큰을 사용합니다. effort 수준을 max로 높여 절대적으로 최고의 성능을 얻거나, 낮춰서 토큰 사용을 더 절약하고 일부 성능 저하를 감수하면서 속도와 비용을 최적화할 수 있습니다.
effort를 "high"로 설정하면 effort 파라미터를 완전히 생략한 것과 동일한 동작이 생성됩니다.
effort 파라미터는 응답의 모든 토큰에 영향을 미치며, 다음을 포함합니다:
이 접근 방식에는 두 가지 주요 장점이 있습니다:
| 수준 | 설명 | 일반적인 사용 사례 |
|---|---|---|
max | 토큰 지출에 제약 없이 절대적인 최고 성능. Claude Mythos Preview, Claude Opus 4.6, Claude Sonnet 4.6에서 사용 가능. | 가장 깊은 추론과 가장 철저한 분석이 필요한 작업 |
high | 높은 성능. 파라미터를 설정하지 않은 것과 동일. | 복잡한 추론, 어려운 코딩 문제, 에이전트 작업 |
medium | 적당한 토큰 절약으로 균형 잡힌 접근 방식. | 속도, 비용, 성능의 균형이 필요한 에이전트 작업 |
low | 가장 효율적. 일부 성능 저하와 함께 상당한 토큰 절약. | 서브에이전트와 같이 최고의 속도와 최저 비용이 필요한 더 간단한 작업 |
Effort는 엄격한 토큰 예산이 아닌 동작 신호입니다. 낮은 effort 수준에서도 Claude는 충분히 어려운 문제에 대해 여전히 사고하지만, 동일한 문제에 대해 더 높은 effort 수준보다 덜 사고합니다.
Sonnet 4.6은 기본적으로 high effort를 사용합니다. 예상치 못한 지연을 방지하려면 Sonnet 4.6 사용 시 effort를 명시적으로 설정하세요:
도구를 사용할 때, effort 파라미터는 도구 호출 주변의 설명과 도구 호출 자체 모두에 영향을 미칩니다. 낮은 effort 수준은 다음과 같은 경향이 있습니다:
높은 effort 수준은 다음과 같을 수 있습니다:
effort 파라미터는 확장 사고와 함께 작동합니다. 동작은 모델에 따라 다릅니다:
thinking 구성 불필요). thinking: {type: "disabled"}는 거부됩니다. Effort는 Opus 4.6과 동일한 방식으로 사고 깊이를 제어합니다.thinking: {type: "adaptive"})를 사용하며, effort가 사고 깊이를 제어하는 권장 방법입니다. budget_tokens는 Opus 4.6에서 여전히 허용되지만, 더 이상 사용되지 않으며 향후 릴리스에서 제거될 예정입니다. high 및 max effort에서 Claude는 거의 항상 깊이 사고합니다. 낮은 수준에서는 더 간단한 문제에 대해 사고를 건너뛸 수 있습니다.thinking: {type: "enabled", budget_tokens: N})는 여전히 작동하지만 더 이상 사용되지 않습니다.thinking: {type: "enabled", budget_tokens: N})를 사용하며, effort는 사고 토큰 예산과 함께 작동합니다. 작업에 맞는 effort 수준을 설정한 다음 작업 복잡성에 따라 사고 토큰 예산을 설정하세요.effort 파라미터는 확장 사고 활성화 여부와 관계없이 사용할 수 있습니다. 사고 없이 사용할 경우에도 텍스트 응답 및 도구 호출에 대한 전체 토큰 지출을 제어합니다.
high이지만, 올바른 시작점은 모델과 워크로드에 따라 다릅니다.curl https://api.anthropic.com/v1/messages \
--header "x-api-key: $ANTHROPIC_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--data '{
"model": "claude-opus-4-6",
"max_tokens": 4096,
"messages": [{
"role": "user",
"content": "Analyze the trade-offs between microservices and monolithic architectures"
}],
"output_config": {
"effort": "medium"
}
}'