Loading...
    • Guía para desarrolladores
    • Referencia de API
    • MCP
    • Recursos
    • Notas de la versión
    Search...
    ⌘K
    Primeros pasos
    Introducción a ClaudeInicio rápido
    Modelos y precios
    Descripción general de modelosElegir un modeloNovedades en Claude 4.6Guía de migraciónModelos deprecadosPrecios
    Crear con Claude
    Descripción general de característicasUsar la API de MessagesManejar razones de paradaMejores prácticas de prompting
    Gestión de contexto
    Ventanas de contextoCompactaciónEdición de contexto
    Capacidades
    Almacenamiento en caché de promptsPensamiento extendidoPensamiento adaptativoEsfuerzoStreaming de MessagesProcesamiento por lotesCitasSoporte multilingüeConteo de tokensEmbeddingsVisiónSoporte de PDFAPI de FilesResultados de búsquedaSalidas estructuradas
    Herramientas
    Descripción generalCómo implementar el uso de herramientasStreaming de herramientas de grano finoHerramienta BashHerramienta de ejecución de códigoLlamada de herramientas programáticaHerramienta de uso de computadoraHerramienta de editor de textoHerramienta de búsqueda webHerramienta de búsqueda webHerramienta de memoriaHerramienta de búsqueda de herramientas
    Agent Skills
    Descripción generalInicio rápidoMejores prácticasSkills para empresasUsar Skills con la API
    Agent SDK
    Descripción generalInicio rápidoSDK de TypeScriptTypeScript V2 (vista previa)SDK de PythonGuía de migración
    MCP en la API
    Conector MCPServidores MCP remotos
    Claude en plataformas de terceros
    Amazon BedrockMicrosoft FoundryVertex AI
    Ingeniería de prompts
    Descripción generalGenerador de promptsUsar plantillas de promptsMejorador de promptsSer claro y directoUsar ejemplos (prompting multishot)Dejar que Claude piense (CoT)Usar etiquetas XMLDar a Claude un rol (prompts del sistema)Encadenar prompts complejosConsejos de contexto largoConsejos de pensamiento extendido
    Probar y evaluar
    Definir criterios de éxitoDesarrollar casos de pruebaUsar la herramienta de evaluaciónReducir latencia
    Fortalecer protecciones
    Reducir alucinacionesAumentar consistencia de salidaMitigar ataques de jailbreakRechazos de streamingReducir fuga de promptsMantener a Claude en personaje
    Administración y monitoreo
    Descripción general de Admin APIResidencia de datosEspacios de trabajoAPI de uso y costosAPI de Claude Code AnalyticsRetención de datos cero
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Capacidades

    Incrustaciones

    Las incrustaciones de texto son representaciones numéricas de texto que permiten medir la similitud semántica. Esta guía presenta las incrustaciones, sus aplicaciones y cómo utilizar modelos de incrustación para tareas como búsqueda, recomendaciones y detección de anomalías.

    Antes de implementar incrustaciones

    Al seleccionar un proveedor de incrustaciones, hay varios factores que puede considerar según sus necesidades y preferencias:

    • Tamaño del conjunto de datos y especificidad del dominio: tamaño del conjunto de datos de entrenamiento del modelo y su relevancia para el dominio que desea incrustar. Los datos más grandes o más específicos del dominio generalmente producen mejores incrustaciones dentro del dominio
    • Rendimiento de inferencia: velocidad de búsqueda de incrustaciones y latencia de extremo a extremo. Esta es una consideración particularmente importante para implementaciones de producción a gran escala
    • Personalización: opciones para entrenamiento continuo en datos privados o especialización de modelos para dominios muy específicos. Esto puede mejorar el rendimiento en vocabularios únicos

    Cómo obtener incrustaciones con Anthropic

    Anthropic no ofrece su propio modelo de incrustación. Un proveedor de incrustaciones que tiene una amplia variedad de opciones y capacidades que abarcan todas las consideraciones anteriores es Voyage AI.

    Voyage AI crea modelos de incrustación de última generación y ofrece modelos personalizados para dominios industriales específicos como finanzas y atención médica, o modelos ajustados a medida para clientes individuales.

    El resto de esta guía es para Voyage AI, pero le recomendamos que evalúe una variedad de proveedores de incrustaciones para encontrar la mejor opción para su caso de uso específico.

    Modelos disponibles

    Voyage recomienda utilizar los siguientes modelos de incrustación de texto:

    ModeloLongitud de contextoDimensión de incrustaciónDescripción
    voyage-3-large32,0001024 (predeterminado), 256, 512, 2048La mejor calidad de recuperación general y multilingüe. Consulte entrada de blog para más detalles.
    voyage-3.532,0001024 (predeterminado), 256, 512, 2048Optimizado para calidad de recuperación general y multilingüe. Consulte entrada de blog para más detalles.
    voyage-3.5-lite32,0001024 (predeterminado), 256, 512, 2048Optimizado para latencia y costo. Consulte entrada de blog para más detalles.
    voyage-code-332,0001024 (predeterminado), 256, 512, 2048Optimizado para recuperación de código. Consulte entrada de blog para más detalles.
    voyage-finance-232,0001024Optimizado para recuperación y RAG de finanzas. Consulte entrada de blog para más detalles.
    voyage-law-216,0001024Optimizado para recuperación y RAG legal y de contexto largo. También mejoró el rendimiento en todos los dominios. Consulte entrada de blog para más detalles.

    Además, se recomiendan los siguientes modelos de incrustación multimodal:

    ModeloLongitud de contextoDimensión de incrustaciónDescripción
    voyage-multimodal-3320001024Modelo de incrustación multimodal enriquecido que puede vectorizar texto intercalado y imágenes ricas en contenido, como capturas de pantalla de PDF, diapositivas, tablas, figuras y más. Consulte entrada de blog para más detalles.

    ¿Necesita ayuda para decidir qué modelo de incrustación de texto usar? Consulte las Preguntas frecuentes.

    Comenzar con Voyage AI

    Para acceder a las incrustaciones de Voyage:

    1. Regístrese en el sitio web de Voyage AI
    2. Obtenga una clave API
    3. Establezca la clave API como una variable de entorno para mayor comodidad:
    export VOYAGE_API_KEY="<your secret key>"

    Puede obtener las incrustaciones utilizando el paquete oficial de Python voyageai o solicitudes HTTP, como se describe a continuación.

    Biblioteca de Python de Voyage

    El paquete voyageai se puede instalar usando el siguiente comando:

    pip install -U voyageai

    Luego, puede crear un objeto cliente y comenzar a usarlo para incrustar sus textos:

    import voyageai
    
    vo = voyageai.Client()
    # This will automatically use the environment variable VOYAGE_API_KEY.
    # Alternatively, you can use vo = voyageai.Client(api_key="<your secret key>")
    
    texts = ["Sample text 1", "Sample text 2"]
    
    result = vo.embed(texts, model="voyage-3.5", input_type="document")
    print(result.embeddings[0])
    print(result.embeddings[1])

    result.embeddings será una lista de dos vectores de incrustación, cada uno conteniendo 1024 números de punto flotante. Después de ejecutar el código anterior, las dos incrustaciones se imprimirán en la pantalla:

    [-0.013131560757756233, 0.019828535616397858, ...]   # embedding for "Sample text 1"
    [-0.0069352793507277966, 0.020878976210951805, ...]  # embedding for "Sample text 2"

    Al crear las incrustaciones, puede especificar algunos otros argumentos para la función embed().

    Para más información sobre el paquete de Python de Voyage, consulte la documentación de Voyage.

    API HTTP de Voyage

    También puede obtener incrustaciones solicitando la API HTTP de Voyage. Por ejemplo, puede enviar una solicitud HTTP a través del comando curl en una terminal:

    curl https://api.voyageai.com/v1/embeddings \
      -H "Content-Type: application/json" \
      -H "Authorization: Bearer $VOYAGE_API_KEY" \
      -d '{
        "input": ["Sample text 1", "Sample text 2"],
        "model": "voyage-3.5"
      }'

    La respuesta que obtendría es un objeto JSON que contiene las incrustaciones y el uso de tokens:

    {
      "object": "list",
      "data": [
        {
          "embedding": [-0.013131560757756233, 0.019828535616397858, ...],
          "index": 0
        },
        {
          "embedding": [-0.0069352793507277966, 0.020878976210951805, ...],
          "index": 1
        }
      ],
      "model": "voyage-3.5",
      "usage": {
        "total_tokens": 10
      }
    }
    

    Para más información sobre la API HTTP de Voyage, consulte la documentación de Voyage.

    AWS Marketplace

    Las incrustaciones de Voyage están disponibles en AWS Marketplace. Las instrucciones para acceder a Voyage en AWS están disponibles aquí.

    Ejemplo de inicio rápido

    Ahora que sabemos cómo obtener incrustaciones, veamos un breve ejemplo.

    Supongamos que tenemos un pequeño corpus de seis documentos de los que recuperar

    documents = [
        "The Mediterranean diet emphasizes fish, olive oil, and vegetables, believed to reduce chronic diseases.",
        "Photosynthesis in plants converts light energy into glucose and produces essential oxygen.",
        "20th-century innovations, from radios to smartphones, centered on electronic advancements.",
        "Rivers provide water, irrigation, and habitat for aquatic species, vital for ecosystems.",
        "Apple's conference call to discuss fourth fiscal quarter results and business updates is scheduled for Thursday, November 2, 2023 at 2:00 p.m. PT / 5:00 p.m. ET.",
        "Shakespeare's works, like 'Hamlet' and 'A Midsummer Night's Dream,' endure in literature."
    ]
    

    Primero usaremos Voyage para convertir cada uno de ellos en un vector de incrustación

    import voyageai
    
    vo = voyageai.Client()
    
    # Embed the documents
    doc_embds = vo.embed(
        documents, model="voyage-3.5", input_type="document"
    ).embeddings

    Las incrustaciones nos permitirán hacer búsqueda semántica / recuperación en el espacio vectorial. Dado un ejemplo de consulta,

    query = "When is Apple's conference call scheduled?"

    lo convertimos en una incrustación y realizamos una búsqueda del vecino más cercano para encontrar el documento más relevante basado en la distancia en el espacio de incrustación.

    import numpy as np
    
    # Embed the query
    query_embd = vo.embed(
        [query], model="voyage-3.5", input_type="query"
    ).embeddings[0]
    
    # Compute the similarity
    # Voyage embeddings are normalized to length 1, therefore dot-product
    # and cosine similarity are the same.
    similarities = np.dot(doc_embds, query_embd)
    
    retrieved_id = np.argmax(similarities)
    print(documents[retrieved_id])

    Tenga en cuenta que usamos input_type="document" e input_type="query" para incrustar el documento y la consulta, respectivamente. Se puede encontrar más especificación aquí.

    El resultado sería el 5º documento, que es de hecho el más relevante para la consulta:

    Apple's conference call to discuss fourth fiscal quarter results and business updates is scheduled for Thursday, November 2, 2023 at 2:00 p.m. PT / 5:00 p.m. ET.

    Si está buscando un conjunto detallado de libros de cocina sobre cómo hacer RAG con incrustaciones, incluidas bases de datos vectoriales, consulte nuestro libro de cocina de RAG.

    Preguntas frecuentes

    Precios

    Visite la página de precios de Voyage para obtener los detalles de precios más actualizados.

    Was this page helpful?

    • Antes de implementar incrustaciones
    • Cómo obtener incrustaciones con Anthropic
    • Modelos disponibles
    • Comenzar con Voyage AI
    • Biblioteca de Python de Voyage
    • API HTTP de Voyage
    • AWS Marketplace
    • Ejemplo de inicio rápido
    • Preguntas frecuentes
    • Precios