Claude Platform Docs
  • Mensagens
  • Agentes Gerenciados
  • Administração

Search...
⌘K
Primeiros passos
Introdução ao ClaudeInício rápido
Desenvolvendo com o Claude
Visão geral dos recursosUsando a API de MensagensMotivos de parada e fallbackRecusas e fallbackCrédito de fallback
Capacidades do modelo
Pensamento estendidoPensamento adaptativoEsforçoOrçamentos de tarefas (beta)Modo rápido (prévia de pesquisa)Saídas estruturadasCitaçõesStreaming de MensagensProcessamento em loteResultados de pesquisaStreaming de recusasSuporte multilíngueEmbeddings
Ferramentas
Visão geralComo funciona o uso de ferramentasTutorial: Crie um agente que usa ferramentasDefinir ferramentasLidar com chamadas de ferramentasUso de ferramentas em paraleloTool Runner (SDK)Uso de ferramentas estritoFerramentas de servidorFerramenta de pesquisa na webFerramenta de busca na webFerramenta de execução de códigoFerramenta de consultoriaFerramenta de busca de ferramentasFerramenta de memóriaFerramenta BashFerramenta de editor de textoFerramenta de uso de computadorSolução de problemas
Infraestrutura de ferramentas
Referência de ferramentasGerenciar contexto de ferramentasCombinações de ferramentasUso de ferramentas com cache de promptChamada programática de ferramentasStreaming granular de ferramentas
Gerenciamento de contexto
Janelas de contextoCompactaçãoEdição de contextoCache de promptMensagens de sistema no meio da conversaCriar um modo de orquestraçãoDiagnóstico de cache (beta)Contagem de tokens
Trabalhando com arquivos
API de ArquivosSuporte a PDF
Habilidades
Visão geralInício rápidoPráticas recomendadasHabilidades para empresasHabilidades na API
MCP
Servidores MCP remotosConector MCP
Claude em plataformas de nuvem
Amazon BedrockAmazon Bedrock (legado)Claude Platform na AWSGoogle CloudMicrosoft Foundry

Log in
Embeddings
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Claude Platform Docs

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Claude on AWS
  • Claude on Google Cloud

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Mensagens/Capacidades do modelo

Embeddings

Embeddings de texto são representações numéricas de texto que permitem medir similaridade semântica. Este guia apresenta embeddings, suas aplicações e como usar modelos de embedding para tarefas como busca, recomendações e detecção de anomalias.

Antes de implementar embeddings

Ao selecionar um provedor de embeddings, há vários fatores que você pode considerar dependendo de suas necessidades e preferências:

  • Tamanho do conjunto de dados e especificidade de domínio: tamanho do conjunto de dados de treinamento do modelo e sua relevância para o domínio que você deseja incorporar. Dados maiores ou mais específicos de domínio geralmente produzem melhores embeddings dentro do domínio
  • Desempenho de inferência: velocidade de consulta de embedding e "latency" (latência) de ponta a ponta. Esta é uma consideração particularmente importante para implantações de produção em larga escala
  • Personalização: opções para treinamento contínuo em dados privados ou especialização de modelos para domínios muito específicos. Isso pode melhorar o desempenho em vocabulários únicos

Como obter embeddings com a Anthropic

A Anthropic não oferece seu próprio modelo de embedding. Um provedor de embeddings que possui uma ampla variedade de opções e capacidades abrangendo todas as considerações acima é a Voyage AI.

A Voyage AI cria modelos de embedding de última geração e oferece modelos personalizados para domínios específicos da indústria, como finanças e saúde, ou modelos com "fine-tuning" (ajuste fino) sob medida para clientes individuais.

O restante deste guia é para a Voyage AI, mas você deve avaliar uma variedade de fornecedores de embeddings para encontrar o mais adequado ao seu caso de uso específico.

Modelos disponíveis

A Voyage recomenda usar os seguintes modelos de embedding de texto:

Voyage 4 (geração mais recente)

ModeloTamanho do ContextoDimensão do EmbeddingDescrição
voyage-4-large32.0001024 (padrão), 256, 512, 2048A melhor qualidade de recuperação de uso geral e multilíngue. Consulte o post do blog para detalhes.
voyage-432.0001024 (padrão), 256, 512, 2048Otimizado para qualidade de recuperação de uso geral e multilíngue. Equilibra qualidade e eficiência. Consulte o post do blog para detalhes.
voyage-4-lite32.0001024 (padrão), 256, 512, 2048Otimizado para latência e custo. Consulte o post do blog para detalhes.
voyage-4-nano32.0001024 (padrão), 256, 512, 2048Modelo de pesos abertos (licença Apache 2.0) disponível no Hugging Face. Consulte o post do blog para detalhes.

Geração anterior

ModeloTamanho do ContextoDimensão do EmbeddingDescrição
voyage-3-large32.0001024 (padrão), 256, 512, 2048A melhor qualidade de recuperação de uso geral e multilíngue. Consulte o post do blog para detalhes.
voyage-3.532.0001024 (padrão), 256, 512, 2048Otimizado para qualidade de recuperação de uso geral e multilíngue. Consulte o post do blog para detalhes.
voyage-3.5-lite32.0001024 (padrão), 256, 512, 2048Otimizado para latência e custo. Consulte o post do blog para detalhes.
voyage-code-332.0001024 (padrão), 256, 512, 2048Otimizado para recuperação de código. Consulte o post do blog para detalhes.
voyage-finance-232.0001024Otimizado para recuperação e RAG de finanças. Consulte o post do blog para detalhes.
voyage-law-216.0001024Otimizado para recuperação e RAG jurídico e de contexto longo. Também melhorou o desempenho em todos os domínios. Consulte o post do blog para detalhes.

Além disso, os seguintes modelos de embedding multimodal são recomendados:

ModeloTamanho do ContextoDimensão do EmbeddingDescrição
voyage-multimodal-3.532.0001024 (padrão), 256, 512, 2048Modelo de embedding multimodal avançado que pode vetorizar texto, imagens e vídeos intercalados. Inclui suporte a vídeo como o primeiro modelo de embedding de vídeo de nível de produção. Consulte o post do blog para detalhes.
voyage-multimodal-332.0001024Modelo de embedding multimodal avançado que pode vetorizar texto intercalado e imagens ricas em conteúdo, como capturas de tela de PDFs, slides, tabelas, figuras e muito mais. Consulte o post do blog para detalhes.

Precisa de ajuda para decidir qual modelo de embedding de texto usar? Confira o FAQ.

Primeiros passos com a Voyage AI

Para acessar os embeddings da Voyage:

  1. Cadastre-se no site da Voyage AI
  2. Obtenha uma chave de API
  3. Defina a chave de API como uma variável de ambiente para maior conveniência:
export VOYAGE_API_KEY="<your secret key>"

Você pode obter os embeddings usando o pacote Python voyageai oficial ou requisições HTTP, conforme descrito abaixo.

Biblioteca Python da Voyage

O pacote voyageai pode ser instalado usando o seguinte comando:

pip install -U voyageai

Em seguida, você pode criar um objeto cliente e começar a usá-lo para gerar embeddings dos seus textos:

import voyageai

vo = voyageai.Client()
# Isso usará automaticamente a variável de ambiente VOYAGE_API_KEY.
# Como alternativa, você pode usar vo = voyageai.Client(api_key="<sua chave secreta>")

texts = ["Sample text 1", "Sample text 2"]

result = vo.embed(texts, model="voyage-4", input_type="document")
print(result.embeddings[0])
print(result.embeddings[1])

result.embeddings será uma lista de dois vetores de embedding, cada um contendo 1024 números de ponto flutuante. Após executar o código acima, os dois embeddings serão impressos na tela:

[-0.013131560757756233, 0.019828535616397858, ...]   # embedding for "Sample text 1"
[-0.0069352793507277966, 0.020878976210951805, ...]  # embedding for "Sample text 2"

Ao criar os embeddings, você pode especificar alguns outros argumentos para a função embed().

Para mais informações sobre o pacote Python da Voyage, consulte a documentação da Voyage.

API HTTP da Voyage

Você também pode obter embeddings fazendo requisições à API HTTP da Voyage. Por exemplo, você pode enviar uma requisição HTTP através do comando curl em um terminal:

cURL
curl https://api.voyageai.com/v1/embeddings \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $VOYAGE_API_KEY" \
  -d '{
    "input": ["Sample text 1", "Sample text 2"],
    "model": "voyage-4"
  }'

A resposta que você receberá é um objeto JSON contendo os embeddings e o uso de tokens:

{
  "object": "list",
  "data": [
    {
      "embedding": [-0.013131560757756233, 0.019828535616397858 /* ... */],
      "index": 0
    },
    {
      "embedding": [-0.0069352793507277966, 0.020878976210951805 /* ... */],
      "index": 1
    }
  ],
  "model": "voyage-4",
  "usage": {
    "total_tokens": 10
  }
}

Para mais informações sobre a API HTTP da Voyage, consulte a documentação da Voyage.

AWS Marketplace

Os embeddings da Voyage estão disponíveis no AWS Marketplace. Instruções para acessar a Voyage na AWS estão disponíveis na documentação do AWS Marketplace da Voyage.

Exemplo de início rápido

O breve exemplo a seguir mostra como usar embeddings.

Suponha que você tenha um pequeno corpus de seis documentos para recuperar

documents = [
    "The Mediterranean diet emphasizes fish, olive oil, and vegetables, believed to reduce chronic diseases.",
    "Photosynthesis in plants converts light energy into glucose and produces essential oxygen.",
    "20th-century innovations, from radios to smartphones, centered on electronic advancements.",
    "Rivers provide water, irrigation, and habitat for aquatic species, vital for ecosystems.",
    "Apple's conference call to discuss fourth fiscal quarter results and business updates is scheduled for Thursday, November 2, 2023 at 2:00 p.m. PT / 5:00 p.m. ET.",
    "Shakespeare's works, like 'Hamlet' and 'A Midsummer Night's Dream,' endure in literature.",
]

Primeiro, use a Voyage para converter cada documento em um vetor de embedding

import voyageai

vo = voyageai.Client()

# Gere os embeddings dos documentos
doc_embds = vo.embed(documents, model="voyage-4", input_type="document").embeddings

Os embeddings permitem que você faça busca / recuperação semântica no espaço vetorial. Dada uma consulta de exemplo,

query = "When is Apple's conference call scheduled?"

Em seguida, converta-a em um embedding e realize uma busca de vizinho mais próximo para encontrar o documento mais relevante com base na distância no espaço de embedding.

import numpy as np

# Gera o embedding da consulta
query_embd = vo.embed([query], model="voyage-4", input_type="query").embeddings[0]

# Calcula a similaridade
# Os embeddings do Voyage são normalizados para comprimento 1, portanto o produto escalar
# e a similaridade de cosseno são equivalentes.
similarities = np.dot(doc_embds, query_embd)

retrieved_id = np.argmax(similarities)
print(documents[retrieved_id])

Observe que input_type="document" e input_type="query" são usados para gerar o embedding do documento e da consulta, respectivamente. Mais especificações podem ser encontradas em Biblioteca Python da Voyage.

A saída seria o 5º documento, que é de fato o mais relevante para a consulta:

Apple's conference call to discuss fourth fiscal quarter results and business updates is scheduled for Thursday, November 2, 2023 at 2:00 p.m. PT / 5:00 p.m. ET.

Se você está procurando um conjunto detalhado de cookbooks sobre como fazer RAG com embeddings, incluindo bancos de dados vetoriais, confira o cookbook de RAG.

FAQ

Preços

Visite a página de preços da Voyage para obter os detalhes de preços mais atualizados.

Was this page helpful?

  • Antes de implementar embeddings
  • Como obter embeddings com a Anthropic
  • Modelos disponíveis
  • Primeiros passos com a Voyage AI
  • Biblioteca Python da Voyage
  • API HTTP da Voyage
  • AWS Marketplace
  • Exemplo de início rápido
  • FAQ
  • Preços