Loading...
    • Руководство разработчика
    • Справочник API
    • MCP
    • Ресурсы
    • Примечания к выпуску
    Search...
    ⌘K
    Первые шаги
    Введение в ClaudeБыстрый старт
    Модели и цены
    Обзор моделейВыбор моделиЧто нового в Claude 4.5Миграция на Claude 4.5Устаревшие моделиЦены
    Разработка с Claude
    Обзор функцийИспользование Messages APIКонтекстные окнаЛучшие практики промптирования
    Возможности
    Кэширование промптовРедактирование контекстаРасширенное мышлениеУсилиеПотоковая передача сообщенийПакетная обработкаЦитированияМногоязычная поддержкаПодсчет токеновEmbeddingsЗрениеПоддержка PDFFiles APIРезультаты поискаСтруктурированные выходные данные
    Инструменты
    ОбзорКак реализовать использование инструментовПотоковая передача инструментов с детализациейИнструмент BashИнструмент выполнения кодаПрограммное вызывание инструментовИнструмент управления компьютеромИнструмент текстового редактораИнструмент веб-выборкиИнструмент веб-поискаИнструмент памятиИнструмент поиска инструментов
    Agent Skills
    ОбзорБыстрый стартЛучшие практикиИспользование Skills с API
    Agent SDK
    ОбзорБыстрый стартTypeScript SDKTypeScript V2 (preview)Python SDKРуководство по миграции
    MCP в API
    MCP коннекторУдаленные MCP серверы
    Claude на сторонних платформах
    Amazon BedrockMicrosoft FoundryVertex AI
    Инженерия промптов
    ОбзорГенератор промптовИспользование шаблонов промптовУлучшитель промптовБудьте ясны и прямолинейныИспользуйте примеры (многошаговое промптирование)Дайте Claude подумать (CoT)Используйте XML-тегиДайте Claude роль (системные промпты)Предзаполните ответ ClaudeЦепочка сложных промптовСоветы по длинному контекстуСоветы по расширенному мышлению
    Тестирование и оценка
    Определение критериев успехаРазработка тестовых случаевИспользование инструмента оценкиСнижение задержки
    Усиление защиты
    Снижение галлюцинацийПовышение согласованности выходных данныхСмягчение взломовПотоковые отказыСнижение утечки промптовДержите Claude в образе
    Администрирование и мониторинг
    Обзор Admin APIAPI использования и затратClaude Code Analytics API
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Возможности

    Эмбеддинги

    Текстовые эмбеддинги — это числовые представления текста, которые позволяют измерять семантическое сходство. Это руководство знакомит с эмбеддингами, их применением и тем, как использовать модели эмбеддингов для таких задач, как поиск, рекомендации и обнаружение аномалий.

    Перед внедрением эмбеддингов

    При выборе провайдера эмбеддингов есть несколько факторов, которые вы можете учитывать в зависимости от ваших потребностей и предпочтений:

    • Размер набора данных и специфичность домена: размер набора данных для обучения модели и его релевантность для домена, который вы хотите встраивать. Более крупные или более специфичные для домена данные обычно производят лучшие внутридоменные эмбеддинги
    • Производительность вывода: скорость поиска эмбеддингов и сквозная задержка. Это особенно важное соображение для крупномасштабных производственных развертываний
    • Настройка: варианты для продолжения обучения на частных данных или специализации моделей для очень специфических доменов. Это может улучшить производительность на уникальных словарях

    Как получить эмбеддинги с Anthropic

    Anthropic не предлагает собственную модель эмбеддингов. Один из провайдеров эмбеддингов, который имеет широкий спектр опций и возможностей, охватывающих все вышеперечисленные соображения, — это Voyage AI.

    Voyage AI создает современные модели эмбеддингов и предлагает настроенные модели для конкретных отраслевых доменов, таких как финансы и здравоохранение, или индивидуальные тонко настроенные модели для отдельных клиентов.

    Остальная часть этого руководства посвящена Voyage AI, но мы призываем вас оценить различных поставщиков эмбеддингов, чтобы найти наилучшее соответствие для вашего конкретного случая использования.

    Доступные модели

    Voyage рекомендует использовать следующие модели текстовых эмбеддингов:

    МодельДлина контекстаРазмерность эмбеддингаОписание
    voyage-3-large32,0001024 (по умолчанию), 256, 512, 2048Лучшее качество поиска общего назначения и многоязычного поиска. См. блог-пост для подробностей.
    voyage-3.532,0001024 (по умолчанию), 256, 512, 2048Оптимизирована для качества поиска общего назначения и многоязычного поиска. См. блог-пост для подробностей.
    voyage-3.5-lite32,0001024 (по умолчанию), 256, 512, 2048Оптимизирована для задержки и стоимости. См. блог-пост для подробностей.
    voyage-code-332,0001024 (по умолчанию), 256, 512, 2048Оптимизирована для поиска кода. См. блог-пост для подробностей.
    voyage-finance-232,0001024Оптимизирована для поиска и RAG в области финансов. См. блог-пост для подробностей.
    voyage-law-216,0001024Оптимизирована для юридического поиска и поиска с длинным контекстом и RAG. Также улучшенная производительность во всех доменах. См. блог-пост для подробностей.

    Кроме того, рекомендуются следующие мультимодальные модели эмбеддингов:

    МодельДлина контекстаРазмерность эмбеддингаОписание
    voyage-multimodal-3320001024Богатая мультимодальная модель эмбеддингов, которая может векторизовать чередующийся текст и изображения, богатые содержанием, такие как скриншоты PDF-файлов, слайды, таблицы, фигуры и многое другое. См. блог-пост для подробностей.

    Нужна помощь в выборе модели текстовых эмбеддингов? Ознакомьтесь с FAQ.

    Начало работы с Voyage AI

    Для доступа к эмбеддингам Voyage:

    1. Зарегистрируйтесь на веб-сайте Voyage AI
    2. Получите API-ключ
    3. Установите API-ключ как переменную окружения для удобства:
    export VOYAGE_API_KEY="<your secret key>"

    Вы можете получить эмбеддинги, используя либо официальный Python-пакет voyageai, либо HTTP-запросы, как описано ниже.

    Библиотека Voyage Python

    Пакет voyageai можно установить с помощью следующей команды:

    pip install -U voyageai

    Затем вы можете создать объект клиента и начать использовать его для встраивания ваших текстов:

    import voyageai
    
    vo = voyageai.Client()
    # Это автоматически использует переменную окружения VOYAGE_API_KEY.
    # Альтернативно, вы можете использовать vo = voyageai.Client(api_key="<your secret key>")
    
    texts = ["Sample text 1", "Sample text 2"]
    
    result = vo.embed(texts, model="voyage-3.5", input_type="document")
    print(result.embeddings[0])
    print(result.embeddings[1])

    result.embeddings будет списком из двух векторов эмбеддингов, каждый содержащий 1024 числа с плавающей точкой. После выполнения приведенного выше кода два эмбеддинга будут выведены на экран:

    [-0.013131560757756233, 0.019828535616397858, ...]   # эмбеддинг для "Sample text 1"
    [-0.0069352793507277966, 0.020878976210951805, ...]  # эмбеддинг для "Sample text 2"

    При создании эмбеддингов вы можете указать несколько других аргументов для функции embed().

    Для получения дополнительной информации о пакете Voyage python см. документацию Voyage.

    HTTP API Voyage

    Вы также можете получить эмбеддинги, запросив HTTP API Voyage. Например, вы можете отправить HTTP-запрос через команду curl в терминале:

    curl https://api.voyageai.com/v1/embeddings \
      -H "Content-Type: application/json" \
      -H "Authorization: Bearer $VOYAGE_API_KEY" \
      -d '{
        "input": ["Sample text 1", "Sample text 2"],
        "model": "voyage-3.5"
      }'

    Ответ, который вы получите, — это JSON-объект, содержащий эмбеддинги и использование токенов:

    {
      "object": "list",
      "data": [
        {
          "embedding": [-0.013131560757756233, 0.019828535616397858, ...],
          "index": 0
        },
        {
          "embedding": [-0.0069352793507277966, 0.020878976210951805, ...],
          "index": 1
        }
      ],
      "model": "voyage-3.5",
      "usage": {
        "total_tokens": 10
      }
    }
    

    Для получения дополнительной информации о HTTP API Voyage см. документацию Voyage.

    AWS Marketplace

    Эмбеддинги Voyage доступны на AWS Marketplace. Инструкции по доступу к Voyage на AWS доступны здесь.

    Пример быстрого старта

    Теперь, когда мы знаем, как получить эмбеддинги, давайте рассмотрим краткий пример.

    Предположим, у нас есть небольшой корпус из шести документов для поиска

    documents = [
        "The Mediterranean diet emphasizes fish, olive oil, and vegetables, believed to reduce chronic diseases.",
        "Photosynthesis in plants converts light energy into glucose and produces essential oxygen.",
        "20th-century innovations, from radios to smartphones, centered on electronic advancements.",
        "Rivers provide water, irrigation, and habitat for aquatic species, vital for ecosystems.",
        "Apple's conference call to discuss fourth fiscal quarter results and business updates is scheduled for Thursday, November 2, 2023 at 2:00 p.m. PT / 5:00 p.m. ET.",
        "Shakespeare's works, like 'Hamlet' and 'A Midsummer Night's Dream,' endure in literature."
    ]
    

    Сначала мы используем Voyage для преобразования каждого из них в вектор эмбеддинга

    import voyageai
    
    vo = voyageai.Client()
    
    # Встраиваем документы
    doc_embds = vo.embed(
        documents, model="voyage-3.5", input_type="document"
    ).embeddings

    Эмбеддинги позволят нам выполнять семантический поиск / извлечение в векторном пространстве. Учитывая пример запроса,

    query = "When is Apple's conference call scheduled?"

    мы преобразуем его в эмбеддинг и проводим поиск ближайшего соседа, чтобы найти наиболее релевантный документ на основе расстояния в пространстве эмбеддингов.

    import numpy as np
    
    # Встраиваем запрос
    query_embd = vo.embed(
        [query], model="voyage-3.5", input_type="query"
    ).embeddings[0]
    
    # Вычисляем сходство
    # Эмбеддинги Voyage нормализованы до длины 1, поэтому скалярное произведение
    # и косинусное сходство одинаковы.
    similarities = np.dot(doc_embds, query_embd)
    
    retrieved_id = np.argmax(similarities)
    print(documents[retrieved_id])

    Обратите внимание, что мы используем input_type="document" и input_type="query" для встраивания документа и запроса соответственно. Более подробную спецификацию можно найти здесь.

    Результатом будет 5-й документ, который действительно наиболее релевантен запросу:

    Apple's conference call to discuss fourth fiscal quarter results and business updates is scheduled for Thursday, November 2, 2023 at 2:00 p.m. PT / 5:00 p.m. ET.

    Если вы ищете подробный набор кулинарных книг о том, как делать RAG с эмбеддингами, включая векторные базы данных, ознакомьтесь с нашей кулинарной книгой RAG.

    FAQ

    Ценообразование

    Посетите страницу ценообразования Voyage для получения самых актуальных деталей ценообразования.

    • Перед внедрением эмбеддингов
    • Как получить эмбеддинги с Anthropic
    • Доступные модели
    • Начало работы с Voyage AI
    • Библиотека Voyage Python
    • HTTP API Voyage
    • AWS Marketplace
    • Пример быстрого старта
    • FAQ
    • Ценообразование