• Сообщения
  • Управляемые агенты
  • Администрирование

Search...
⌘K
Первые шаги
Знакомство с ClaudeБыстрый старт
Разработка с Claude
Обзор возможностейИспользование Messages APIПричины остановки и резервный вариантОтказы и резервный вариантРезервный кредит
Возможности модели
Расширенное мышлениеАдаптивное мышлениеУсилиеБюджеты задач (бета)Быстрый режим (исследовательская предварительная версия)Структурированные выходные данныеЦитированиеПотоковая передача сообщенийПакетная обработкаРезультаты поискаПотоковая передача отказовМногоязычная поддержкаЭмбеддинги
Инструменты
ОбзорКак работает использование инструментовРуководство: создание агента с использованием инструментовОпределение инструментовОбработка вызовов инструментовПараллельное использование инструментовTool Runner (SDK)Строгое использование инструментовИспользование инструментов с кэшированием подсказокСерверные инструментыУстранение неполадокИнструмент веб-поискаИнструмент загрузки веб-страницИнструмент выполнения кодаИнструмент советникаИнструмент памятиИнструмент BashИнструмент использования компьютераИнструмент текстового редактора
Инфраструктура инструментов
Справочник по инструментамУправление контекстом инструментовКомбинации инструментовПоиск инструментовПрограммный вызов инструментовДетальная потоковая передача инструментов
Управление контекстом
Контекстные окнаСжатиеРедактирование контекстаКэширование подсказокСистемные сообщения в середине разговораСоздание режима оркестрацииДиагностика кэша (бета)Подсчёт токенов
Работа с файлами
Files APIПоддержка PDFИзображения и компьютерное зрение
Навыки
ОбзорБыстрый стартРекомендацииНавыки для предприятийНавыки в API
MCP
Удалённые серверы MCPКоннектор MCP
Claude на облачных платформах
Amazon BedrockAmazon Bedrock (устаревшая версия)Claude Platform на AWSMicrosoft FoundryVertex AI

Log in
Поддержка PDF
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Сообщения/Работа с файлами

Поддержка PDF

Обрабатывайте PDF-файлы с помощью Claude. Извлекайте текст, анализируйте диаграммы и понимайте визуальное содержимое ваших документов.


Эта функция соответствует требованиям Zero Data Retention (ZDR) (нулевого хранения данных). Если у вашей организации действует соглашение ZDR, данные, отправленные через эту функцию, не сохраняются после возврата ответа API.

Вы можете задавать Claude вопросы о любом тексте, изображениях, диаграммах и таблицах в предоставленных вами PDF-файлах. Некоторые примеры сценариев использования:

  • Анализ финансовых отчётов и понимание диаграмм/таблиц
  • Извлечение ключевой информации из юридических документов
  • Помощь в переводе документов
  • Преобразование информации из документов в структурированные форматы

Перед началом работы

Проверьте требования к PDF

Claude работает с любыми стандартными PDF-файлами. Убедитесь, что размер вашего запроса соответствует следующим требованиям:

ТребованиеОграничение
Максимальный размер запроса32 МБ (зависит от платформы)
Максимальное количество страниц на запрос600 (100 для моделей с контекстным окном в 200 тыс. токенов)
ФорматСтандартный PDF (без паролей/шифрования)

Оба ограничения применяются ко всей полезной нагрузке запроса, включая любой другой контент, отправляемый вместе с PDF-файлами. Для больших PDF-файлов рассмотрите возможность загрузки через Files API и ссылки по file_id, чтобы сохранить небольшой размер полезной нагрузки запроса.



Плотные PDF-файлы (много страниц с мелким шрифтом, сложные таблицы или насыщенная графика) могут заполнить контекстное окно до достижения лимита страниц. Запросы с большими PDF-файлами также могут завершиться неудачей до достижения лимита страниц, даже при использовании Files API. Попробуйте разделить документ на части; для больших файлов, поскольку каждая страница обрабатывается как изображение, также может помочь уменьшение разрешения встроенных изображений.

Поскольку поддержка PDF основана на возможностях зрения Claude, на неё распространяются те же ограничения и особенности, что и на другие задачи, связанные со зрением.

Поддерживаемые платформы и модели

Поддержка PDF доступна в Claude API, Claude Platform на AWS, Amazon Bedrock (см. Поддержка PDF в Amazon Bedrock), Vertex AI и Microsoft Foundry. Все активные модели поддерживают обработку PDF.

Поддержка PDF в Amazon Bedrock

При использовании поддержки PDF через Converse API в Bedrock существуют два различных режима обработки документов:



Важно: Чтобы получить доступ к полным возможностям визуального понимания PDF в Claude через Converse API, необходимо включить цитирование. Без включённого цитирования API возвращается только к базовому извлечению текста. Узнайте больше о работе с цитированием.

Режимы обработки документов

  1. Converse Document Chat (исходный режим — только извлечение текста)

    • Обеспечивает базовое извлечение текста из PDF-файлов
    • Не может анализировать изображения, диаграммы или визуальные макеты внутри PDF
    • Использует примерно 1 000 токенов для 3-страничного PDF
    • Автоматически используется, когда цитирование не включено
  2. Claude PDF Chat (новый режим — полное визуальное понимание)

    • Обеспечивает полный визуальный анализ PDF-файлов
    • Может понимать и анализировать диаграммы, графики, изображения и визуальные макеты
    • Обрабатывает каждую страницу как текст и как изображение для всестороннего понимания
    • Использует примерно 7 000 токенов для 3-страничного PDF
    • Требует включения цитирования в Converse API

Ключевые ограничения

  • Converse API: Визуальный анализ PDF требует включения цитирования. В настоящее время нет возможности использовать визуальный анализ без цитирования (в отличие от InvokeModel API).
  • InvokeModel API: Предоставляет полный контроль над обработкой PDF без принудительного цитирования.

Распространённые проблемы

Если Claude не видит изображения или диаграммы в ваших PDF-файлах при использовании Converse API, вероятно, вам нужно включить флаг цитирования. Без него Converse возвращается только к базовому извлечению текста.



Это известное ограничение Converse API. Для приложений, которым требуется визуальный анализ PDF без цитирования, рассмотрите возможность использования InvokeModel API.



Для файлов, отличных от PDF, таких как .csv, .xlsx, .docx, .md или .txt, см. раздел Работа с другими форматами файлов.


Обработка PDF с помощью Claude

Отправьте свой первый запрос с PDF

Начнём с простого примера с использованием Messages API. Вы можете предоставить PDF-файлы Claude тремя способами:

  1. Как ссылку URL на PDF, размещённый в интернете
  2. Как PDF в кодировке base64 в блоках контента document
  3. По file_id из Files API


В Amazon Bedrock и Vertex AI в настоящее время доступны только источники в кодировке base64.

Вариант 1: PDF-документ по URL

Самый простой подход — сослаться на PDF напрямую по URL:

client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "url",
                        "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf",
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Вариант 2: PDF-документ в кодировке base64

Если вам нужно отправить PDF-файлы из локальной системы или когда URL недоступен:

import base64
import httpx

# Сначала загрузите и закодируйте PDF
pdf_url = "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
pdf_data = base64.standard_b64encode(httpx.get(pdf_url).content).decode("utf-8")

# Альтернатива: загрузка из локального файла
# with open("document.pdf", "rb") as f:
#     pdf_data = base64.standard_b64encode(f.read()).decode("utf-8")

# Отправьте в Claude, используя кодировку base64
client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Вариант 3: Files API

Для PDF-файлов, которые вы будете использовать многократно, или когда вы хотите избежать накладных расходов на кодирование, используйте Files API:

client = anthropic.Anthropic()

# Загрузите PDF-файл
with open("document.pdf", "rb") as f:
    file_upload = client.beta.files.upload(file=("document.pdf", f, "application/pdf"))

# Используйте загруженный файл в сообщении
message = client.beta.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    betas=["files-api-2025-04-14"],
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {"type": "file", "file_id": file_upload.id},
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Как работает поддержка PDF

Когда вы отправляете PDF в Claude, происходят следующие шаги:

  1. 1

    Система извлекает содержимое документа.

    • Система преобразует каждую страницу документа в изображение.
    • Текст с каждой страницы извлекается и предоставляется вместе с изображением этой страницы.
  2. 2

    Claude анализирует как текст, так и изображения для лучшего понимания документа.

    • Документы предоставляются как комбинация текста и изображений для анализа.
    • Это позволяет пользователям запрашивать информацию о визуальных элементах PDF, таких как диаграммы, схемы и другой нетекстовый контент.
  3. 3

    Claude отвечает, ссылаясь на содержимое PDF, если это уместно.

    Claude может ссылаться как на текстовое, так и на визуальное содержимое в своих ответах. Вы можете дополнительно улучшить производительность, интегрировав поддержку PDF с:

    • Кэшированием подсказок: для повышения производительности при повторном анализе.
    • Пакетной обработкой: для обработки большого объёма документов.
    • Использованием инструментов: для извлечения конкретной информации из документов для использования в качестве входных данных инструментов.

Оцените свои затраты

Количество токенов в PDF-файле зависит от общего объёма извлечённого из документа текста, а также от количества страниц:

  • Стоимость текстовых токенов: каждая страница обычно использует 1 500–3 000 токенов в зависимости от плотности содержимого. Применяются стандартные цены API без дополнительных сборов за PDF.
  • Стоимость токенов изображений: поскольку каждая страница преобразуется в изображение, применяются те же расчёты стоимости на основе изображений.

Вы можете использовать подсчёт токенов, чтобы оценить затраты для ваших конкретных PDF-файлов.


Оптимизация обработки PDF

Повышение производительности

Следуйте этим рекомендациям для достижения оптимальных результатов:

  • Размещайте PDF-файлы перед текстом в ваших запросах
  • Используйте стандартные шрифты
  • Убедитесь, что текст чёткий и разборчивый
  • Поворачивайте страницы в правильную вертикальную ориентацию
  • Используйте логические номера страниц (из программы просмотра PDF) в подсказках
  • Разбивайте большие PDF-файлы на части при необходимости
  • Включайте кэширование подсказок для повторного анализа

Масштабирование вашей реализации

Для обработки больших объёмов рассмотрите следующие подходы:

Используйте кэширование подсказок

Кэшируйте PDF-файлы для повышения производительности при повторных запросах:

client = anthropic.Anthropic()
# ...
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                    "cache_control": {"type": "ephemeral"},
                },
                {"type": "text", "text": "Analyze this document."},
            ],
        }
    ],
)

Обработка пакетов документов

Используйте Message Batches API для рабочих процессов с большим объёмом:

client = anthropic.Anthropic()
# ...
message_batch = client.messages.batches.create(
    requests=[
        {
            "custom_id": "doc1",
            "params": {
                "model": "claude-opus-4-8",
                "max_tokens": 1024,
                "messages": [
                    {
                        "role": "user",
                        "content": [
                            {
                                "type": "document",
                                "source": {
                                    "type": "base64",
                                    "media_type": "application/pdf",
                                    "data": pdf_data,
                                },
                            },
                            {"type": "text", "text": "Summarize this document."},
                        ],
                    }
                ],
            },
        }
    ]
)

Дальнейшие шаги


Попробуйте примеры с PDF


Изучите практические примеры обработки PDF в рецепте из сборника.


Посмотреть справочник API

См. полную документацию API по поддержке PDF.

Was this page helpful?

  • Перед началом работы
  • Проверьте требования к PDF
  • Поддерживаемые платформы и модели
  • Поддержка PDF в Amazon Bedrock
  • Обработка PDF с помощью Claude
  • Отправьте свой первый запрос с PDF
  • Как работает поддержка PDF
  • Оцените свои затраты
  • Оптимизация обработки PDF
  • Повышение производительности
  • Масштабирование вашей реализации
  • Дальнейшие шаги