Ferramentas

Streaming de ferramentas de granularidade fina

Streaming de ferramentas de granularidade fina está disponível em todos os modelos e plataformas, permitindo streaming de valores de parâmetros de uso de ferramentas sem buffering ou validação JSON.

Streaming de ferramentas de granularidade fina está geralmente disponível em todos os modelos e todas as plataformas, sem necessidade de cabeçalho beta. Ele permite streaming de valores de parâmetros de uso de ferramentas sem buffering ou validação JSON, reduzindo a latência para começar a receber parâmetros grandes.

Ao usar streaming de ferramentas de granularidade fina, você pode potencialmente receber entradas JSON inválidas ou parciais. Certifique-se de levar em conta esses casos extremos em seu código.

Como usar streaming de ferramentas de granularidade fina

Streaming de ferramentas de granularidade fina está disponível em todos os modelos e todas as plataformas (Claude API, Amazon Bedrock, Google Vertex AI e Microsoft Foundry). Para usá-lo, defina eager_input_streaming como true em qualquer ferramenta onde você deseja que o streaming de granularidade fina seja ativado e ative o streaming em sua solicitação.

Aqui está um exemplo de como usar streaming de ferramentas de granularidade fina com a API:

curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d '{
    "model": "claude-opus-4-6",
    "max_tokens": 65536,
    "tools": [
      {
        "name": "make_file",
        "description": "Write text to a file",
        "eager_input_streaming": true,
        "input_schema": {
          "type": "object",
          "properties": {
            "filename": {
              "type": "string",
              "description": "The filename to write text to"
            },
            "lines_of_text": {
              "type": "array",
              "description": "An array of lines of text to write to the file"
            }
          },
          "required": ["filename", "lines_of_text"]
        }
      }
    ],
    "messages": [
      {
        "role": "user",
        "content": "Can you write a long poem and make a file called poem.txt?"
      }
    ],
    "stream": true
  }' | jq '.usage'

Neste exemplo, streaming de ferramentas de granularidade fina permite que Claude faça streaming das linhas de um poema longo para a chamada de ferramenta make_file sem buffering para validar se o parâmetro lines_of_text é um JSON válido. Isso significa que você pode ver o parâmetro fazer streaming conforme chega, sem ter que esperar que todo o parâmetro seja armazenado em buffer e validado.

Com streaming de ferramentas de granularidade fina, os chunks de uso de ferramentas começam a fazer streaming mais rapidamente e geralmente são mais longos e contêm menos quebras de palavra. Isso ocorre devido a diferenças no comportamento de chunking.

Exemplo:

Sem streaming de granularidade fina (atraso de 15s):

Chunk 1: '{"'
Chunk 2: 'query": "Ty'
Chunk 3: 'peScri'
Chunk 4: 'pt 5.0 5.1 '
Chunk 5: '5.2 5'
Chunk 6: '.3'
Chunk 8: ' new f'
Chunk 9: 'eatur'
...

Com streaming de granularidade fina (atraso de 3s):

Chunk 1: '{"query": "TypeScript 5.0 5.1 5.2 5.3'
Chunk 2: ' new features comparison'

Como streaming de granularidade fina envia parâmetros sem buffering ou validação JSON, não há garantia de que o stream resultante será concluído em uma string JSON válida. Particularmente, se a razão de parada max_tokens for atingida, o stream pode terminar no meio de um parâmetro e pode estar incompleto. Geralmente você terá que escrever suporte específico para lidar com quando max_tokens é atingido.

Tratamento de JSON inválido em respostas de ferramentas

Ao usar streaming de ferramentas de granularidade fina, você pode receber JSON inválido ou incompleto do modelo. Se você precisar passar esse JSON inválido de volta para o modelo em um bloco de resposta de erro, você pode envolvê-lo em um objeto JSON para garantir o tratamento adequado (com uma chave razoável). Por exemplo:

{
  "INVALID_JSON": "<your invalid json string>"
}

Essa abordagem ajuda o modelo a entender que o conteúdo é JSON inválido enquanto preserva os dados malformados originais para fins de depuração.

Ao envolver JSON inválido, certifique-se de escapar adequadamente qualquer aspas ou caracteres especiais na string JSON inválida para manter a estrutura JSON válida no objeto wrapper.

Was this page helpful?

Como usar streaming de ferramentas de granularidade fina

Aqui está um exemplo de como usar streaming de ferramentas de granularidade fina com a API:

curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d '{
    "model": "claude-opus-4-6",
    "max_tokens": 65536,
    "tools": [
      {
        "name": "make_file",
        "description": "Write text to a file",
        "eager_input_streaming": true,
        "input_schema": {
          "type": "object",
          "properties": {
            "filename": {
              "type": "string",
              "description": "The filename to write text to"
            },
            "lines_of_text": {
              "type": "array",
              "description": "An array of lines of text to write to the file"
            }
          },
          "required": ["filename", "lines_of_text"]
        }
      }
    ],
    "messages": [
      {
        "role": "user",
        "content": "Can you write a long poem and make a file called poem.txt?"
      }
    ],
    "stream": true
  }' | jq '.usage'

Exemplo:

Sem streaming de granularidade fina (atraso de 15s):

Chunk 1: '{"'
Chunk 2: 'query": "Ty'
Chunk 3: 'peScri'
Chunk 4: 'pt 5.0 5.1 '
Chunk 5: '5.2 5'
Chunk 6: '.3'
Chunk 8: ' new f'
Chunk 9: 'eatur'
...

Com streaming de granularidade fina (atraso de 3s):

Chunk 1: '{"query": "TypeScript 5.0 5.1 5.2 5.3'
Chunk 2: ' new features comparison'

Tratamento de JSON inválido em respostas de ferramentas

{
  "INVALID_JSON": "<your invalid json string>"
}

Essa abordagem ajuda o modelo a entender que o conteúdo é JSON inválido enquanto preserva os dados malformados originais para fins de depuração.

Ao envolver JSON inválido, certifique-se de escapar adequadamente qualquer aspas ou caracteres especiais na string JSON inválida para manter a estrutura JSON válida no objeto wrapper.

Was this page helpful?