Loading...
    • Guida per sviluppatori
    • Riferimento API
    • MCP
    • Risorse
    • Note sulla versione
    Search...
    ⌘K
    Primi passi
    Introduzione a ClaudeAvvio rapido
    Modelli e prezzi
    Panoramica dei modelliScelta di un modelloNovità in Claude 4.6Guida alla migrazioneDeprecazioni dei modelliPrezzi
    Crea con Claude
    Panoramica delle funzioniUtilizzo dell'API MessagesGestione dei motivi di arrestoBest practice per i prompt
    Capacità del modello
    Extended thinkingAdaptive thinkingEffortFast mode (anteprima di ricerca)Output strutturatiCitazioniStreaming dei messaggiElaborazione batchSupporto PDFRisultati di ricercaSupporto multilingueEmbeddingsVision
    Strumenti
    PanoramicaCome implementare l'uso degli strumentiStrumento di ricerca webStrumento di recupero webStrumento di esecuzione del codiceStrumento di memoriaStrumento BashStrumento Computer useStrumento editor di testo
    Infrastruttura degli strumenti
    Ricerca strumentiChiamata programmatica degli strumentiStreaming granulare degli strumenti
    Gestione del contesto
    Finestre di contestoCompattazioneModifica del contestoPrompt cachingConteggio dei token
    File e risorse
    API Files
    Agent Skills
    PanoramicaAvvio rapidoBest practiceSkills per l'aziendaUtilizzo di Skills con l'API
    Agent SDK
    PanoramicaAvvio rapidoTypeScript SDKTypeScript V2 (anteprima)Python SDKGuida alla migrazione
    MCP nell'API
    Connettore MCPServer MCP remoti
    Claude su piattaforme di terze parti
    Amazon BedrockMicrosoft FoundryVertex AI
    Prompt engineering
    PanoramicaGeneratore di promptUsa modelli di promptMiglioratore di promptSii chiaro e direttoUsa esempi (multishot prompting)Lascia che Claude pensi (CoT)Usa tag XMLDai a Claude un ruolo (prompt di sistema)Concatena prompt complessiSuggerimenti per il contesto lungoSuggerimenti per extended thinking
    Test e valutazione
    Definisci criteri di successoSviluppa casi di testUtilizzo dello strumento di valutazioneRiduzione della latenza
    Rafforza i guardrail
    Riduci le allucinazioniAumenta la coerenza dell'outputMitiga i jailbreakStreaming dei rifiutiRiduci la perdita di promptMantieni Claude nel personaggio
    Amministrazione e monitoraggio
    Panoramica dell'API AdminResidenza dei datiWorkspaceAPI di utilizzo e costiAPI Claude Code AnalyticsZero Data Retention
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Modelli e prezzi

    Novità in Claude 4.6

    Panoramica delle nuove funzionalità e capacità in Claude Opus 4.6.

    Claude 4.6 rappresenta la prossima generazione di modelli Claude, portando significative nuove capacità e miglioramenti API. Questa pagina riassume tutte le nuove funzionalità disponibili al lancio.

    Nuovi modelli

    ModelloID modello APIDescrizione
    Claude Opus 4.6claude-opus-4-6Il nostro modello più intelligente per costruire agenti e codifica

    Claude Opus 4.6 supporta una finestra di contesto di 200K (con finestra di contesto di 1M token disponibile in beta), 128K token di output massimo, extended thinking, e tutte le funzionalità API Claude esistenti.

    Per i prezzi completi e le specifiche, vedi la panoramica dei modelli.

    Nuove funzionalità

    Modalità adaptive thinking

    Adaptive thinking (thinking: {type: "adaptive"}) è la modalità di thinking consigliata per Opus 4.6. Claude decide dinamicamente quando e quanto pensare. Al livello di sforzo predefinito (high), Claude penserà quasi sempre. A livelli di sforzo inferiori, potrebbe saltare il thinking per problemi più semplici.

    thinking: {type: "enabled"} e budget_tokens sono deprecati su Opus 4.6. Rimangono funzionali ma verranno rimossi in una futura versione del modello. Usa adaptive thinking e il parametro effort per controllare la profondità del thinking. Adaptive thinking abilita anche automaticamente il thinking interleaved.

    response = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=16000,
        thinking={"type": "adaptive"},
        messages=[{"role": "user", "content": "Solve this complex problem..."}]
    )

    Parametro effort GA

    Il parametro effort è ora generalmente disponibile (nessun header beta richiesto). Un nuovo livello di sforzo max fornisce la capacità assoluta più alta su Opus 4.6. Combina effort con adaptive thinking per i migliori compromessi costo-qualità.

    Compaction API (beta)

    Compaction fornisce riassunto automatico del contesto lato server, abilitando conversazioni effettivamente infinite. Quando il contesto si avvicina al limite della finestra, l'API riassume automaticamente le parti precedenti della conversazione.

    Fine-grained tool streaming (GA)

    Fine-grained tool streaming è ora generalmente disponibile su tutti i modelli e piattaforme. Nessun header beta è richiesto.

    128K token di output

    Opus 4.6 supporta fino a 128K token di output, raddoppiando il limite precedente di 64K. Questo abilita budget di thinking più lunghi e risposte più complete. Gli SDK richiedono streaming per richieste con valori max_tokens grandi per evitare timeout HTTP. Se non hai bisogno di elaborare gli eventi in modo incrementale, usa .stream() con .get_final_message() per ottenere la risposta completa — vedi Streaming Messages per i dettagli.

    Controlli di residenza dei dati

    Controlli di residenza dei dati ti permettono di specificare dove viene eseguita l'inferenza del modello usando il parametro inference_geo. Puoi scegliere il routing "global" (predefinito) o "us" per richiesta. L'inferenza solo US è prezzata a 1.1x su Claude Opus 4.6 e modelli più recenti.

    Deprecazioni

    type: "enabled" e budget_tokens

    thinking: {type: "enabled", budget_tokens: N} è deprecato su Opus 4.6. Rimane funzionale ma verrà rimosso in una futura versione del modello. Migra a thinking: {type: "adaptive"} con il parametro effort.

    Header beta interleaved-thinking-2025-05-14

    L'header beta interleaved-thinking-2025-05-14 è deprecato su Opus 4.6. Viene ignorato in sicurezza se incluso, ma non è più richiesto. Adaptive thinking abilita automaticamente interleaved thinking. Rimuovi betas=["interleaved-thinking-2025-05-14"] dalle tue richieste quando usi Opus 4.6.

    output_format

    Il parametro output_format per structured outputs è stato spostato a output_config.format. Il vecchio parametro rimane funzionale ma è deprecato e verrà rimosso in una futura versione del modello.

    # Before
    response = client.messages.create(
        output_format={"type": "json_schema", "schema": {...}},
        ...
    )
    
    # After
    response = client.messages.create(
        output_config={"format": {"type": "json_schema", "schema": {...}}},
        ...
    )

    Cambiamenti critici

    Rimozione del prefill

    Il prefilling dei messaggi dell'assistente (prefill dell'ultimo turno dell'assistente) non è supportato su Opus 4.6. Le richieste con messaggi dell'assistente prefilled restituiscono un errore 400.

    Alternative:

    • Structured outputs per controllare il formato della risposta
    • Istruzioni del prompt di sistema per guidare lo stile della risposta
    • output_config.format per output JSON

    Quoting del parametro tool

    Opus 4.6 potrebbe produrre un escaping di stringhe JSON leggermente diverso negli argomenti delle chiamate tool (ad es., diverso handling degli escape Unicode o dell'escaping della barra). I parser JSON standard gestiscono automaticamente queste differenze. Se analizzi l'input della chiamata tool come una stringa grezza piuttosto che usare json.loads() o JSON.parse(), verifica che la tua logica di parsing funzioni ancora.

    Guida alla migrazione

    Per istruzioni di migrazione passo dopo passo, vedi Migrazione a Claude 4.6.

    Passaggi successivi

    Adaptive thinking

    Scopri come usare la modalità adaptive thinking.

    Panoramica dei modelli

    Confronta tutti i modelli Claude.

    Compaction

    Esplora la compattazione del contesto lato server.

    Guida alla migrazione

    Istruzioni di migrazione passo dopo passo.

    Was this page helpful?

    • Nuovi modelli
    • Nuove funzionalità
    • Modalità adaptive thinking
    • Parametro effort GA
    • Compaction API (beta)
    • Fine-grained tool streaming (GA)
    • 128K token di output
    • Controlli di residenza dei dati
    • Deprecazioni
    • type: "enabled" e budget_tokens
    • Header beta interleaved-thinking-2025-05-14
    • output_format
    • Cambiamenti critici
    • Rimozione del prefill
    • Quoting del parametro tool
    • Guida alla migrazione
    • Passaggi successivi