Loading...
    • Руководство разработчика
    • Справочник API
    • MCP
    • Ресурсы
    • Примечания к выпуску
    Search...
    ⌘K
    Первые шаги
    Введение в ClaudeБыстрый старт
    Модели и цены
    Обзор моделейВыбор моделиЧто нового в Claude 4.6Руководство миграцииУстаревшие моделиЦены
    Разработка с Claude
    Обзор возможностейИспользование Messages APIОбработка причин остановкиЛучшие практики промптирования
    Управление контекстом
    Окна контекстаСжатиеРедактирование контекста
    Возможности
    Кэширование промптовРасширенное мышлениеАдаптивное мышлениеУсилиеПотоковая передача сообщенийПакетная обработкаЦитированияМногоязычная поддержкаПодсчет токеновEmbeddingsЗрениеПоддержка PDFFiles APIРезультаты поискаСтруктурированные выходные данные
    Инструменты
    ОбзорКак реализовать использование инструментовПотоковая передача инструментов с детализациейИнструмент BashИнструмент выполнения кодаПрограммное вызывание инструментовИнструмент компьютерного управленияИнструмент текстового редактораИнструмент веб-выборкиИнструмент веб-поискаИнструмент памятиИнструмент поиска инструментов
    Agent Skills
    ОбзорБыстрый стартЛучшие практикиSkills для предприятийИспользование Skills с API
    Agent SDK
    ОбзорБыстрый стартTypeScript SDKTypeScript V2 (preview)Python SDKРуководство миграции
    MCP в API
    MCP коннекторУдаленные MCP серверы
    Claude на сторонних платформах
    Amazon BedrockMicrosoft FoundryVertex AI
    Инженерия промптов
    ОбзорГенератор промптовИспользование шаблонов промптовУлучшитель промптовБудьте ясны и прямолинейныИспользуйте примеры (многоходовое промптирование)Дайте Claude думать (CoT)Используйте XML тегиДайте Claude роль (системные промпты)Цепочка сложных промптовСоветы по длинному контекстуСоветы по расширенному мышлению
    Тестирование и оценка
    Определение критериев успехаРазработка тестовых случаевИспользование инструмента оценкиСнижение задержки
    Укрепление защиты
    Снижение галлюцинацийУвеличение согласованности выходных данныхСмягчение взломовПотоковая передача отказовСнижение утечки промптаДержите Claude в образе
    Администрирование и мониторинг
    Обзор Admin APIРезидентность данныхРабочие пространстваAPI использования и затратClaude Code Analytics APIНулевое хранение данных
    Console
    Log in
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...
    Loading...

    Solutions

    • AI agents
    • Code modernization
    • Coding
    • Customer support
    • Education
    • Financial services
    • Government
    • Life sciences

    Partners

    • Amazon Bedrock
    • Google Cloud's Vertex AI

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Company

    • Anthropic
    • Careers
    • Economic Futures
    • Research
    • News
    • Responsible Scaling Policy
    • Security and compliance
    • Transparency

    Learn

    • Blog
    • Catalog
    • Courses
    • Use cases
    • Connectors
    • Customer stories
    • Engineering at Anthropic
    • Events
    • Powered by Claude
    • Service partners
    • Startups program

    Help and security

    • Availability
    • Status
    • Support
    • Discord

    Terms and policies

    • Privacy policy
    • Responsible disclosure policy
    • Terms of service: Commercial
    • Terms of service: Consumer
    • Usage policy
    Claude на сторонних платформах

    Claude на Vertex AI

    Модели Claude от Anthropic теперь доступны в общем доступе через Vertex AI.

    API Vertex для доступа к Claude практически идентичен Messages API и поддерживает все те же опции с двумя ключевыми отличиями:

    • В Vertex model не передается в теле запроса. Вместо этого он указывается в URL-адресе конечной точки Google Cloud.
    • В Vertex anthropic_version передается в теле запроса (а не в качестве заголовка) и должен быть установлен на значение vertex-2023-10-16.

    Vertex также поддерживается официальными SDK-клиентами Anthropic. Это руководство проведет вас через процесс создания запроса к Claude на Vertex AI на Python или TypeScript.

    Обратите внимание, что это руководство предполагает, что у вас уже есть проект GCP, который может использовать Vertex AI. Дополнительную информацию о требуемой настройке и полное пошаговое руководство см. в разделе использование моделей Claude 3 от Anthropic.

    Установите SDK для доступа к Vertex AI

    Сначала установите SDK-клиент Anthropic для выбранного вами языка.

    pip install -U google-cloud-aiplatform "anthropic[vertex]"

    Доступ к Vertex AI

    Доступность моделей

    Обратите внимание, что доступность моделей Anthropic варьируется по регионам. Выполните поиск "Claude" в Vertex AI Model Garden или перейдите на страницу Использование Claude 3 для получения последней информации.

    Идентификаторы моделей API

    МодельИдентификатор модели Vertex AI API
    Claude Opus 4.6claude-opus-4-6
    Claude Sonnet 4.5claude-sonnet-4-5@20250929
    Claude Sonnet 4claude-sonnet-4@20250514
    Claude Sonnet 3.7 ⚠️claude-3-7-sonnet@20250219
    Claude Opus 4.5claude-opus-4-5@20251101
    Claude Opus 4.1claude-opus-4-1@20250805
    Claude Opus 4claude-opus-4@20250514
    Claude Haiku 4.5claude-haiku-4-5@20251001
    Claude Haiku 3.5 ⚠️claude-3-5-haiku@20241022
    Claude Haiku 3claude-3-haiku@20240307

    Создание запросов

    Перед выполнением запросов может потребоваться запустить gcloud auth application-default login для аутентификации с помощью GCP.

    Следующие примеры показывают, как генерировать текст из Claude на Vertex AI:

    from anthropic import AnthropicVertex
    
    project_id = "MY_PROJECT_ID"
    region = "global"
    
    client = AnthropicVertex(project_id=project_id, region=region)
    
    message = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=100,
        messages=[
            {
                "role": "user",
                "content": "Hey Claude!",
            }
        ],
    )
    print(message)

    Дополнительные сведения см. в разделе SDK-клиентов и официальной документации Vertex AI.

    Логирование активности

    Vertex предоставляет сервис логирования запросов и ответов, который позволяет клиентам логировать подсказки и завершения, связанные с вашим использованием.

    Anthropic рекомендует логировать вашу активность по крайней мере на основе 30-дневного скользящего окна, чтобы понять вашу активность и исследовать любой потенциальный неправомерный доступ.

    Включение этого сервиса не дает Google или Anthropic никакого доступа к вашему контенту.

    Поддержка функций

    Все функции, которые в настоящее время поддерживаются на Vertex, вы можете найти здесь.

    Глобальные и региональные конечные точки

    Начиная с Claude Sonnet 4.5 и всех будущих моделей, Google Vertex AI предлагает два типа конечных точек:

    • Глобальные конечные точки: Динамическая маршрутизация для максимальной доступности
    • Региональные конечные точки: Гарантированная маршрутизация данных через определенные географические регионы

    Региональные конечные точки включают надбавку в размере 10% к цене по сравнению с глобальными конечными точками.

    Это применяется только к Claude Sonnet 4.5 и будущим моделям. Старые модели (Claude Sonnet 4, Opus 4 и более ранние) сохраняют свои существующие структуры ценообразования.

    Когда использовать каждый вариант

    Глобальные конечные точки (рекомендуется):

    • Обеспечивают максимальную доступность и время безотказной работы
    • Динамически маршрутизируют запросы в регионы с доступной емкостью
    • Без надбавки к цене
    • Лучше всего подходят для приложений, где местоположение данных гибко
    • Поддерживают только трафик с оплатой по мере использования (подготовленная пропускная способность требует региональных конечных точек)

    Региональные конечные точки:

    • Маршрутизируют трафик через определенные географические регионы
    • Требуются для требований к местоположению данных и соответствию нормативным требованиям
    • Поддерживают как оплату по мере использования, так и подготовленную пропускную способность
    • Надбавка в размере 10% к цене отражает затраты на инфраструктуру для выделенной региональной емкости

    Реализация

    Использование глобальных конечных точек (рекомендуется):

    Установите параметр region на "global" при инициализации клиента:

    from anthropic import AnthropicVertex
    
    project_id = "MY_PROJECT_ID"
    region = "global"
    
    client = AnthropicVertex(project_id=project_id, region=region)
    
    message = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=100,
        messages=[
            {
                "role": "user",
                "content": "Hey Claude!",
            }
        ],
    )
    print(message)

    Использование региональных конечных точек:

    Укажите конкретный регион, например "us-east1" или "europe-west1":

    from anthropic import AnthropicVertex
    
    project_id = "MY_PROJECT_ID"
    region = "us-east1"  # Specify a specific region
    
    client = AnthropicVertex(project_id=project_id, region=region)
    
    message = client.messages.create(
        model="claude-opus-4-6",
        max_tokens=100,
        messages=[
            {
                "role": "user",
                "content": "Hey Claude!",
            }
        ],
    )
    print(message)

    Дополнительные ресурсы

    • Ценообразование Google Vertex AI: cloud.google.com/vertex-ai/generative-ai/pricing
    • Документация моделей Claude: Claude на Vertex AI
    • Запись в блоге Google: Глобальная конечная точка для моделей Claude
    • Сведения о ценообразовании Anthropic: Документация по ценообразованию

    Was this page helpful?

    • Установите SDK для доступа к Vertex AI
    • Доступ к Vertex AI
    • Доступность моделей
    • Создание запросов
    • Логирование активности
    • Поддержка функций
    • Глобальные и региональные конечные точки
    • Когда использовать каждый вариант
    • Реализация
    • Дополнительные ресурсы