Loading...
  • Bangun
  • Admin
  • Model & harga
  • Client SDK
  • Referensi API
Search...
⌘K
Log in
Pemikiran adaptif
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Bangun/Kemampuan model

Pemikiran adaptif

Biarkan Claude secara dinamis menentukan kapan dan berapa banyak menggunakan pemikiran yang diperluas dengan mode pemikiran adaptif.

Was this page helpful?

  • Model yang didukung
  • Cara kerja pemikiran adaptif
  • Cara menggunakan pemikiran adaptif
  • Pemikiran adaptif dengan parameter upaya
  • Streaming dengan pemikiran adaptif
  • Pemikiran adaptif vs manual vs dinonaktifkan
  • Pertimbangan penting
  • Perubahan validasi
  • Caching prompt
  • Menyetel perilaku pemikiran
  • Kontrol biaya
  • Bekerja dengan blok pemikiran
  • Pemikiran yang diringkas
  • Mengontrol tampilan pemikiran
  • Enkripsi pemikiran
  • Harga
  • Topik tambahan
  • Langkah berikutnya

This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

Pemikiran adaptif adalah cara yang direkomendasikan untuk menggunakan pemikiran yang diperluas dengan Claude Opus 4.7, Claude Opus 4.6, dan Claude Sonnet 4.6, dan merupakan mode default pada Claude Mythos Preview (di mana ia secara otomatis diterapkan kapan pun thinking tidak diatur). Alih-alih secara manual menetapkan anggaran token pemikiran, pemikiran adaptif memungkinkan Claude secara dinamis menentukan kapan dan berapa banyak menggunakan pemikiran yang diperluas berdasarkan kompleksitas setiap permintaan. Pada Claude Opus 4.7, pemikiran adaptif adalah satu-satunya mode pemikiran yang didukung; manual thinking: {type: "enabled", budget_tokens: N} tidak lagi diterima.

Pemikiran adaptif dapat menghasilkan kinerja yang lebih baik daripada pemikiran yang diperluas dengan budget_tokens tetap untuk banyak beban kerja, terutama tugas bimodal dan alur kerja agentic jangka panjang. Tidak ada header beta yang diperlukan.

Jika beban kerja Anda memerlukan latensi yang dapat diprediksi atau kontrol presisi atas biaya pemikiran, pemikiran yang diperluas dengan budget_tokens masih berfungsi pada Claude Opus 4.6 dan Claude Sonnet 4.6 tetapi sudah usang dan tidak lagi direkomendasikan. Lihat peringatan di bawah.

Model yang didukung

Pemikiran adaptif didukung pada model berikut:

  • Claude Mythos Preview (claude-mythos-preview), pemikiran adaptif adalah default; thinking: {type: "disabled"} tidak didukung
  • Claude Opus 4.7 (claude-opus-4-7), pemikiran adaptif adalah satu-satunya mode pemikiran yang didukung. Pemikiran dimatikan kecuali Anda secara eksplisit menetapkan thinking: {type: "adaptive"} dalam permintaan Anda; manual thinking: {type: "enabled"} ditolak dengan kesalahan 400.
  • Claude Opus 4.6 (claude-opus-4-6)
  • Claude Sonnet 4.6 (claude-sonnet-4-6)

thinking.type: "enabled" dan budget_tokens adalah usang pada Opus 4.6 dan Sonnet 4.6 dan akan dihapus dalam rilis model di masa depan. Gunakan thinking.type: "adaptive" dengan parameter effort sebagai gantinya. Konfigurasi budget_tokens yang ada masih berfungsi tetapi tidak lagi direkomendasikan; rencanakan untuk bermigrasi.

Model yang lebih lama (Sonnet 4.5, Opus 4.5, dll.) tidak mendukung pemikiran adaptif dan memerlukan thinking.type: "enabled" dengan budget_tokens.

Cara kerja pemikiran adaptif

Dalam mode adaptif, pemikiran bersifat opsional untuk model. Claude mengevaluasi kompleksitas setiap permintaan dan menentukan apakah dan berapa banyak menggunakan pemikiran yang diperluas. Pada tingkat upaya default (high), Claude hampir selalu berpikir. Pada tingkat upaya yang lebih rendah, Claude dapat melewati pemikiran untuk masalah yang lebih sederhana.

Pemikiran adaptif juga secara otomatis mengaktifkan pemikiran yang disisipi. Ini berarti Claude dapat berpikir di antara panggilan alat, menjadikannya sangat efektif untuk alur kerja agentic.

Cara menggunakan pemikiran adaptif

Atur thinking.type ke "adaptive" dalam permintaan API Anda:

Pemikiran adaptif dengan parameter upaya

Anda dapat menggabungkan pemikiran adaptif dengan parameter upaya untuk memandu seberapa banyak Claude berpikir. Tingkat upaya bertindak sebagai panduan lembut untuk alokasi pemikiran Claude:

Tingkat upayaPerilaku pemikiran
maxClaude selalu berpikir tanpa batasan pada kedalaman pemikiran. Tersedia pada Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, dan Claude Sonnet 4.6.
xhighClaude selalu berpikir mendalam dengan eksplorasi yang diperluas. Tersedia pada Claude Opus 4.7.
high (default)Claude selalu berpikir. Memberikan penalaran mendalam pada tugas yang kompleks.
mediumClaude menggunakan pemikiran moderat. Mungkin melewati pemikiran untuk pertanyaan yang sangat sederhana.
lowClaude meminimalkan pemikiran. Melewati pemikiran untuk tugas sederhana di mana kecepatan paling penting.

Streaming dengan pemikiran adaptif

Pemikiran adaptif bekerja dengan mulus dengan streaming. Blok pemikiran dialirkan melalui acara thinking_delta seperti mode pemikiran manual:

Pemikiran adaptif vs manual vs dinonaktifkan

ModeKonfigurasiKetersediaanKapan digunakan
Adaptifthinking: {type: "adaptive"}Claude Mythos Preview (default), Opus 4.7 (hanya mode), Opus 4.6, Sonnet 4.6Claude menentukan kapan dan berapa banyak menggunakan pemikiran yang diperluas. Gunakan effort untuk memandu.
Manualthinking: {type: "enabled", budget_tokens: N}Semua model kecuali Claude Opus 4.7 (ditolak). Usang pada Opus 4.6 dan Sonnet 4.6 (pertimbangkan mode adaptif sebagai gantinya).Ketika Anda memerlukan kontrol presisi atas pengeluaran token pemikiran.
DinonaktifkanHilangkan parameter thinking atau lewatkan {type: "disabled"}Semua model kecuali Claude Mythos PreviewKetika Anda tidak memerlukan pemikiran yang diperluas dan menginginkan latensi terendah.

Pemikiran adaptif tersedia pada Claude Mythos Preview, Claude Opus 4.7, Opus 4.6, dan Sonnet 4.6. Pada Mythos Preview, pemikiran adaptif adalah default dan diterapkan secara otomatis kapan pun thinking tidak diatur. Pada Claude Opus 4.7, pemikiran adaptif adalah satu-satunya mode yang didukung dan type: "enabled" dengan budget_tokens ditolak. Model yang lebih lama hanya mendukung type: "enabled" dengan budget_tokens. Pada Opus 4.6 dan Sonnet 4.6, type: "enabled" dengan budget_tokens masih berfungsi tetapi usang.

Ketersediaan pemikiran yang disisipi menurut mode:

  • Mode adaptif: Pemikiran yang disisipi secara otomatis diaktifkan pada Claude Mythos Preview, Claude Opus 4.7, Opus 4.6, dan Sonnet 4.6. Pada Mythos Preview dan Opus 4.7, penalaran antar-alat selalu berada di dalam blok pemikiran.
  • Mode manual pada Sonnet 4.6: Pemikiran yang disisipi bekerja melalui header beta interleaved-thinking-2025-05-14.
  • Mode manual pada Opus 4.6: Pemikiran yang disisipi tidak tersedia. Jika alur kerja agentic Anda memerlukan pemikiran di antara panggilan alat pada Opus 4.6, gunakan mode adaptif.

Pertimbangan penting

Perubahan validasi

Saat menggunakan pemikiran adaptif, giliran asisten sebelumnya tidak perlu dimulai dengan blok pemikiran. Ini lebih fleksibel daripada mode manual, di mana API memberlakukan bahwa giliran yang diaktifkan pemikiran dimulai dengan blok pemikiran.

Caching prompt

Permintaan berturut-turut menggunakan pemikiran adaptive mempertahankan titik henti cache prompt. Namun, beralih antara mode pemikiran adaptive dan enabled/disabled memecah titik henti cache untuk pesan. Prompt sistem dan definisi alat tetap di-cache terlepas dari perubahan mode.

Menyetel perilaku pemikiran

Perilaku pemicu pemikiran adaptif dapat dipromptkan. Jika Claude berpikir lebih atau kurang sering daripada yang Anda inginkan, Anda dapat menambahkan panduan ke prompt sistem Anda:

Extended thinking adds latency and should only be used when it
will meaningfully improve answer quality — typically for problems
that require multi-step reasoning. When in doubt, respond directly.

Mengarahkan Claude untuk berpikir lebih jarang dapat mengurangi kualitas pada tugas yang mendapat manfaat dari penalaran. Ukur dampak pada beban kerja spesifik Anda sebelum menerapkan penyesuaian berbasis prompt ke produksi. Pertimbangkan pengujian dengan tingkat upaya yang lebih rendah terlebih dahulu.

Kontrol biaya

Gunakan max_tokens sebagai batas keras pada total output (pemikiran + teks respons). Parameter effort memberikan panduan lembut tambahan tentang berapa banyak pemikiran yang Claude alokasikan. Bersama-sama, ini memberi Anda kontrol yang efektif atas biaya.

Pada tingkat upaya high dan max, Claude mungkin berpikir lebih ekstensif dan dapat lebih mungkin menghabiskan anggaran max_tokens. Jika Anda mengamati stop_reason: "max_tokens" dalam respons, pertimbangkan untuk meningkatkan max_tokens untuk memberi model lebih banyak ruang, atau menurunkan tingkat upaya.

Bekerja dengan blok pemikiran

Konsep berikut berlaku untuk semua model yang mendukung pemikiran yang diperluas, terlepas dari apakah Anda menggunakan mode adaptif atau manual.

Pemikiran yang diringkas

With extended thinking enabled, the Messages API for Claude 4 models returns a summary of Claude's full thinking process. Summarized thinking provides the full intelligence benefits of extended thinking, while preventing misuse. This is the default behavior on Claude 4 models when the display field on the thinking configuration is unset or set to "summarized". On Claude Opus 4.7 and Claude Mythos Preview, display defaults to "omitted" instead, so you must set display: "summarized" explicitly to receive summarized thinking.

Here are some important considerations for summarized thinking:

  • You're charged for the full thinking tokens generated by the original request, not the summary tokens.
  • The billed output token count will not match the count of tokens you see in the response.
  • On Claude 4 models, the first few lines of thinking output are more verbose, providing detailed reasoning that's particularly helpful for prompt engineering purposes. Claude Mythos Preview summarizes from the first token, so its thinking blocks do not show this verbose preamble.
  • As Anthropic seeks to improve the extended thinking feature, summarization behavior is subject to change.
  • Summarization preserves the key ideas of Claude's thinking process with minimal added latency, enabling a streamable user experience.
  • Summarization is processed by a different model than the one you target in your requests. The thinking model does not see the summarized output.

In rare cases where you need access to full thinking output for Claude 4 models, contact Anthropic sales.

Mengontrol tampilan pemikiran

The display field on the thinking configuration controls how thinking content is returned in API responses. It accepts two values:

  • "summarized": Thinking blocks contain summarized thinking text. See Summarized thinking for details. This is the default on Claude Opus 4.6, Claude Sonnet 4.6, and earlier Claude 4 models.
  • "omitted": Thinking blocks are returned with an empty thinking field. The signature field still carries the encrypted full thinking for multi-turn continuity (see Thinking encryption). This is the default on Claude Opus 4.7 and Claude Mythos Preview.

Setting display: "omitted" is useful when your application doesn't surface thinking content to users. The primary benefit is faster time-to-first-text-token when streaming: The server skips streaming thinking tokens entirely and delivers only the signature, so the final text response begins streaming sooner.

Here are some important considerations for omitted thinking:

  • You're still charged for the full thinking tokens. Omitting reduces latency, not cost.
  • If you pass thinking blocks back in multi-turn conversations, pass them unchanged. The server decrypts the signature to reconstruct the original thinking for prompt construction (see Preserving thinking blocks). Any text you place in the thinking field of a round-tripped omitted block is ignored.
  • display is invalid with thinking.type: "disabled" (there is nothing to display).
  • When using thinking.type: "adaptive" and the model skips thinking for a simple request, no thinking block is produced regardless of display.

The signature field is identical whether display is "summarized" or "omitted". Switching display values between turns in a conversation is supported.

Pada Claude Opus 4.7, thinking.display default ke "omitted". Blok pemikiran masih muncul dalam aliran respons, tetapi bidang thinking mereka kosong kecuali Anda secara eksplisit memilih. Ini adalah perubahan senyap dari Claude Opus 4.6, di mana default adalah "summarized". Untuk mengembalikan teks pemikiran yang diringkas pada Claude Opus 4.7, atur thinking.display ke "summarized" secara eksplisit:

thinking = {
    "type": "adaptive",
    "display": "summarized",
}

Untuk contoh kode dan perilaku streaming dengan display: "omitted", lihat Mengontrol tampilan pemikiran di halaman pemikiran yang diperluas. Contoh di sana menggunakan type: "enabled"; dengan pemikiran adaptif, gunakan:

thinking = {"type": "adaptive", "display": "omitted"}

Enkripsi pemikiran

Full thinking content is encrypted and returned in the signature field. This field is used to verify that thinking blocks were generated by Claude when passed back to the API.

It is only strictly necessary to send back thinking blocks when using tools with extended thinking. Otherwise you can omit thinking blocks from previous turns. If you pass them back, whether the API keeps or strips them depends on the model: Opus 4.5+ and Sonnet 4.6+ keep them in context by default; earlier Opus/Sonnet models and all Haiku models strip them. See context editing to configure this.

If sending back thinking blocks, pass everything back as you received it for consistency and to avoid potential issues.

Here are some important considerations on thinking encryption:

  • When streaming responses, the signature is added via a signature_delta inside a content_block_delta event just before the content_block_stop event.
  • signature values are significantly longer in Claude 4 models than in previous models.
  • The signature field is an opaque field and should not be interpreted or parsed.
  • signature values are compatible across platforms (Claude APIs, Amazon Bedrock, and Vertex AI). Values generated on one platform will be compatible with another.

Harga

For complete pricing information including base rates, cache writes, cache hits, and output tokens, see the pricing page.

The thinking process incurs charges for:

  • Tokens used during thinking (output tokens)
  • Thinking blocks from prior assistant turns kept in context: only the last turn on earlier Opus/Sonnet models and all Haiku models; all turns by default on Opus 4.5+ and Sonnet 4.6+ (input tokens)
  • Standard text output tokens

When extended thinking is enabled, a specialized system prompt is automatically included to support this feature.

When using summarized thinking:

  • Input tokens: Tokens in your original request (excludes thinking tokens from previous turns)
  • Output tokens (billed): The original thinking tokens that Claude generated internally
  • Output tokens (visible): The summarized thinking tokens you see in the response
  • No charge: Tokens used to generate the summary

When using display: "omitted":

  • Input tokens: Tokens in your original request (same as summarized)
  • Output tokens (billed): The original thinking tokens that Claude generated internally (same as summarized)
  • Output tokens (visible): Zero thinking tokens (the thinking field is empty)

The billed output token count will not match the visible token count in the response. You are billed for the full thinking process, not the thinking content visible in the response.

Topik tambahan

Halaman pemikiran yang diperluas mencakup beberapa topik secara lebih detail dengan contoh kode khusus mode:

  • Penggunaan alat dengan pemikiran: Aturan yang sama berlaku untuk pemikiran adaptif: pertahankan blok pemikiran di antara panggilan alat dan waspadai keterbatasan tool_choice ketika pemikiran aktif.
  • Caching prompt: Dengan pemikiran adaptif, permintaan berturut-turut menggunakan mode pemikiran yang sama mempertahankan titik henti cache. Beralih antara mode adaptive dan enabled/disabled memecah titik henti cache untuk pesan (prompt sistem dan definisi alat tetap di-cache).
  • Jendela konteks: Bagaimana token pemikiran berinteraksi dengan batas max_tokens dan jendela konteks.

Langkah berikutnya

Extended thinking
client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    messages=[
        {
            "role": "user",
            "content": "Explain why the sum of two even numbers is always even.",
        }
    ],
)

for block in response.content:
    if block.type == "thinking":
        print(f"\nThinking: {block.thinking}")
    elif block.type == "text":
        print(f"\nResponse: {block.text}")
client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    output_config={"effort": "medium"},
    messages=[{"role": "user", "content": "What is the capital of France?"}],
)

print(response.content[0].text)
client = anthropic.Anthropic()

with client.messages.stream(
    model="claude-opus-4-7",
    max_tokens=16000,
    thinking={"type": "adaptive"},
    messages=[
        {
            "role": "user",
            "content": "What is the greatest common divisor of 1071 and 462?",
        }
    ],
) as stream:
    for event in stream:
        if event.type == "content_block_start":
            print(f"\nStarting {event.content_block.type} block...")
        elif event.type == "content_block_delta":
            if event.delta.type == "thinking_delta":
                print(event.delta.thinking, end="", flush=True)
            elif event.delta.type == "text_delta":
                print(event.delta.text, end="", flush=True)

Pelajari lebih lanjut tentang pemikiran yang diperluas, termasuk mode manual, penggunaan alat, dan caching prompt.

Effort parameter

Kontrol seberapa menyeluruh Claude merespons dengan parameter upaya.