СообщенияРабота с файлами

Поддержка PDF

Обрабатывайте PDF-файлы с помощью Claude. Извлекайте текст, анализируйте диаграммы и понимайте визуальное содержимое ваших документов.

Эта функция соответствует требованиям Zero Data Retention (ZDR) (нулевого хранения данных). Если у вашей организации действует соглашение ZDR, данные, отправленные через эту функцию, не сохраняются после возврата ответа API.

Вы можете задавать Claude вопросы о любом тексте, изображениях, диаграммах и таблицах в предоставленных вами PDF-файлах. Некоторые примеры использования:

Анализ финансовых отчётов и понимание диаграмм/таблиц
Извлечение ключевой информации из юридических документов
Помощь в переводе документов
Преобразование информации из документов в структурированные форматы

Прежде чем начать

Проверьте требования к PDF

Claude работает с любыми стандартными PDF-файлами. Убедитесь, что размер вашего запроса соответствует следующим требованиям:

Требование	Ограничение
Максимальный размер запроса	32 МБ (зависит от платформы)
Максимальное количество страниц на запрос	600 (100 для моделей с контекстным окном в 200 тыс. токенов)
Формат	Стандартный PDF (без паролей/шифрования)

Оба ограничения применяются ко всей полезной нагрузке запроса, включая любой другой контент, отправляемый вместе с PDF-файлами. Для больших PDF-файлов рассмотрите возможность загрузки через Files API и ссылки по file_id, чтобы сохранить небольшой размер полезной нагрузки запроса.

Плотные PDF-файлы (много страниц с мелким шрифтом, сложные таблицы или насыщенная графика) могут заполнить контекстное окно до достижения лимита страниц. Запросы с большими PDF-файлами также могут завершиться неудачей до достижения лимита страниц, даже при использовании Files API. Попробуйте разделить документ на части; для больших файлов, поскольку каждая страница обрабатывается как изображение, также может помочь уменьшение разрешения встроенных изображений.

Поскольку поддержка PDF основана на возможностях зрения Claude, она подвержена тем же ограничениям и особенностям, что и другие задачи, связанные со зрением.

Поддерживаемые платформы и модели

Поддержка PDF доступна в Claude API, Claude Platform на AWS, Amazon Bedrock (см. Поддержка PDF в Amazon Bedrock), Google Cloud и Microsoft Foundry. Все активные модели поддерживают обработку PDF.

Поддержка PDF в Amazon Bedrock

При использовании поддержки PDF через Converse API в Bedrock существуют два различных режима обработки документов:

Важно: Чтобы получить доступ к полным возможностям визуального понимания PDF в Converse API, необходимо включить цитирование. Без включённого цитирования API возвращается только к базовому извлечению текста. Узнайте больше о работе с цитированием.

Режимы обработки документов

Converse Document Chat (исходный режим — только извлечение текста)
- Обеспечивает базовое извлечение текста из PDF-файлов
- Не может анализировать изображения, диаграммы или визуальные макеты внутри PDF
- Использует примерно 1 000 токенов для 3-страничного PDF
- Автоматически используется, когда цитирование не включено
Claude PDF Chat (новый режим — полное визуальное понимание)
- Обеспечивает полный визуальный анализ PDF-файлов
- Может понимать и анализировать диаграммы, графики, изображения и визуальные макеты
- Обрабатывает каждую страницу как текст и изображение для всестороннего понимания
- Использует примерно 7 000 токенов для 3-страничного PDF
- Требует включения цитирования в Converse API

Ключевые ограничения

Converse API: Визуальный анализ PDF требует включения цитирования. В настоящее время нет возможности использовать визуальный анализ без цитирования (в отличие от InvokeModel API).
InvokeModel API: Обеспечивает полный контроль над обработкой PDF без принудительного цитирования.

Распространённые проблемы

Если Claude не видит изображения или диаграммы в ваших PDF-файлах при использовании Converse API, вероятно, вам нужно включить флаг цитирования. Без него Converse возвращается только к базовому извлечению текста.

Это известное ограничение Converse API. Для приложений, которым требуется визуальный анализ PDF без цитирования, рассмотрите возможность использования InvokeModel API.

Для файлов, отличных от PDF, таких как .csv, .xlsx, .docx, .md или .txt, см. раздел Работа с другими форматами файлов.

Обработка PDF с помощью Claude

Отправьте свой первый запрос с PDF

Начнём с простого примера с использованием Messages API. Вы можете предоставить PDF-файлы Claude тремя способами:

Как URL-ссылку на PDF, размещённый в интернете
Как PDF в кодировке base64 в блоках контента document
По file_id из Files API

В Amazon Bedrock и Google Cloud в настоящее время доступны только источники в кодировке base64.

Вариант 1: PDF-документ по URL

Самый простой подход — сослаться на PDF напрямую по URL:

client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "url",
                        "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf",
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Вариант 2: PDF-документ в кодировке base64

Если вам нужно отправить PDF-файлы из локальной системы или когда URL недоступен:

import base64
import httpx

# Сначала загрузите и закодируйте PDF
pdf_url = "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
pdf_data = base64.standard_b64encode(
    httpx.get(pdf_url, follow_redirects=True).content
).decode("utf-8")

# Альтернатива: загрузка из локального файла
# with open("document.pdf", "rb") as f:
#     pdf_data = base64.standard_b64encode(f.read()).decode("utf-8")

# Отправьте в Claude, используя кодировку base64
client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Вариант 3: Files API

Для PDF-файлов, которые вы будете использовать многократно, или когда вы хотите избежать накладных расходов на кодирование, используйте Files API:

client = anthropic.Anthropic()

# Загрузите PDF-файл
with open("/path/to/document.pdf", "rb") as f:
    file_upload = client.beta.files.upload(file=("document.pdf", f, "application/pdf"))

# Используйте загруженный файл в сообщении
message = client.beta.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    betas=["files-api-2025-04-14"],
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {"type": "file", "file_id": file_upload.id},
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Как работает поддержка PDF

Когда вы отправляете PDF в Claude, происходят следующие шаги:

Система извлекает содержимое документа.
- Система преобразует каждую страницу документа в изображение.
- Текст с каждой страницы извлекается и предоставляется вместе с изображением каждой страницы.
Claude анализирует как текст, так и изображения для лучшего понимания документа.
- Документы предоставляются как комбинация текста и изображений для анализа.
- Это позволяет пользователям запрашивать информацию о визуальных элементах PDF, таких как диаграммы, схемы и другой нетекстовый контент.
Claude отвечает, ссылаясь на содержимое PDF, если это уместно.
Claude может ссылаться как на текстовое, так и на визуальное содержимое в своих ответах. Вы можете дополнительно улучшить производительность, интегрировав поддержку PDF с:
- Кэшированием подсказок: для повышения производительности при повторном анализе.
- Пакетной обработкой: для обработки большого объёма документов.
- Использованием инструментов: для извлечения конкретной информации из документов для использования в качестве входных данных инструментов.

Оцените свои затраты

Количество токенов в PDF-файле зависит от общего объёма текста, извлечённого из документа, а также от количества страниц:

Стоимость текстовых токенов: каждая страница обычно использует 1 500–3 000 токенов в зависимости от плотности контента. Применяется стандартная цена API без дополнительных сборов за PDF.
Стоимость токенов изображений: поскольку каждая страница преобразуется в изображение, применяются те же расчёты стоимости на основе изображений.

Вы можете использовать подсчёт токенов для оценки затрат на ваши конкретные PDF-файлы.

Оптимизация обработки PDF

Повышение производительности

Следуйте этим рекомендациям для достижения оптимальных результатов:

Размещайте PDF-файлы перед текстом в ваших запросах
Используйте стандартные шрифты
Убедитесь, что текст чёткий и разборчивый
Поворачивайте страницы в правильную вертикальную ориентацию
Используйте логические номера страниц (из программы просмотра PDF) в подсказках
Разделяйте большие PDF-файлы на части при необходимости
Включайте кэширование подсказок для повторного анализа

Масштабирование вашей реализации

Для обработки больших объёмов рассмотрите следующие подходы:

Используйте кэширование подсказок

Кэшируйте PDF-файлы для повышения производительности при повторных запросах:

client = anthropic.Anthropic()
# ...
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                    "cache_control": {"type": "ephemeral"},
                },
                {"type": "text", "text": "Analyze this document."},
            ],
        }
    ],
)

Обработка пакетов документов

Используйте Message Batches API для рабочих процессов с большим объёмом:

client = anthropic.Anthropic()
# ...
message_batch = client.messages.batches.create(
    requests=[
        {
            "custom_id": "doc1",
            "params": {
                "model": "claude-opus-4-8",
                "max_tokens": 1024,
                "messages": [
                    {
                        "role": "user",
                        "content": [
                            {
                                "type": "document",
                                "source": {
                                    "type": "base64",
                                    "media_type": "application/pdf",
                                    "data": pdf_data,
                                },
                            },
                            {"type": "text", "text": "Summarize this document."},
                        ],
                    }
                ],
            },
        }
    ]
)

Следующие шаги

Попробуйте примеры с PDF

Изучите практические примеры обработки PDF в рецепте из кулинарной книги.

Посмотреть справочник API

См. полную документацию API по поддержке PDF.

Was this page helpful?

СообщенияРабота с файлами

Поддержка PDF

Анализ финансовых отчётов и понимание диаграмм/таблиц
Извлечение ключевой информации из юридических документов
Помощь в переводе документов
Преобразование информации из документов в структурированные форматы

Прежде чем начать

Проверьте требования к PDF

Требование	Ограничение
Максимальный размер запроса	32 МБ (зависит от платформы)
Максимальное количество страниц на запрос	600 (100 для моделей с контекстным окном в 200 тыс. токенов)
Формат	Стандартный PDF (без паролей/шифрования)

Поддерживаемые платформы и модели

Поддержка PDF в Amazon Bedrock

При использовании поддержки PDF через Converse API в Bedrock существуют два различных режима обработки документов:

Режимы обработки документов

Converse Document Chat (исходный режим — только извлечение текста)
- Обеспечивает базовое извлечение текста из PDF-файлов
- Не может анализировать изображения, диаграммы или визуальные макеты внутри PDF
- Использует примерно 1 000 токенов для 3-страничного PDF
- Автоматически используется, когда цитирование не включено
Claude PDF Chat (новый режим — полное визуальное понимание)
- Обеспечивает полный визуальный анализ PDF-файлов
- Может понимать и анализировать диаграммы, графики, изображения и визуальные макеты
- Обрабатывает каждую страницу как текст и изображение для всестороннего понимания
- Использует примерно 7 000 токенов для 3-страничного PDF
- Требует включения цитирования в Converse API

Ключевые ограничения

Converse API: Визуальный анализ PDF требует включения цитирования. В настоящее время нет возможности использовать визуальный анализ без цитирования (в отличие от InvokeModel API).
InvokeModel API: Обеспечивает полный контроль над обработкой PDF без принудительного цитирования.

Распространённые проблемы

Для файлов, отличных от PDF, таких как .csv, .xlsx, .docx, .md или .txt, см. раздел Работа с другими форматами файлов.

Обработка PDF с помощью Claude

Отправьте свой первый запрос с PDF

Начнём с простого примера с использованием Messages API. Вы можете предоставить PDF-файлы Claude тремя способами:

Как URL-ссылку на PDF, размещённый в интернете
Как PDF в кодировке base64 в блоках контента document
По file_id из Files API

В Amazon Bedrock и Google Cloud в настоящее время доступны только источники в кодировке base64.

Вариант 1: PDF-документ по URL

Самый простой подход — сослаться на PDF напрямую по URL:

client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "url",
                        "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf",
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Вариант 2: PDF-документ в кодировке base64

Если вам нужно отправить PDF-файлы из локальной системы или когда URL недоступен:

import base64
import httpx

# Сначала загрузите и закодируйте PDF
pdf_url = "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
pdf_data = base64.standard_b64encode(
    httpx.get(pdf_url, follow_redirects=True).content
).decode("utf-8")

# Альтернатива: загрузка из локального файла
# with open("document.pdf", "rb") as f:
#     pdf_data = base64.standard_b64encode(f.read()).decode("utf-8")

# Отправьте в Claude, используя кодировку base64
client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Вариант 3: Files API

client = anthropic.Anthropic()

# Загрузите PDF-файл
with open("/path/to/document.pdf", "rb") as f:
    file_upload = client.beta.files.upload(file=("document.pdf", f, "application/pdf"))

# Используйте загруженный файл в сообщении
message = client.beta.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    betas=["files-api-2025-04-14"],
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {"type": "file", "file_id": file_upload.id},
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Как работает поддержка PDF

Когда вы отправляете PDF в Claude, происходят следующие шаги:

Система извлекает содержимое документа.
- Система преобразует каждую страницу документа в изображение.
- Текст с каждой страницы извлекается и предоставляется вместе с изображением каждой страницы.
Claude анализирует как текст, так и изображения для лучшего понимания документа.
- Документы предоставляются как комбинация текста и изображений для анализа.
- Это позволяет пользователям запрашивать информацию о визуальных элементах PDF, таких как диаграммы, схемы и другой нетекстовый контент.
Claude отвечает, ссылаясь на содержимое PDF, если это уместно.
Claude может ссылаться как на текстовое, так и на визуальное содержимое в своих ответах. Вы можете дополнительно улучшить производительность, интегрировав поддержку PDF с:
- Кэшированием подсказок: для повышения производительности при повторном анализе.
- Пакетной обработкой: для обработки большого объёма документов.
- Использованием инструментов: для извлечения конкретной информации из документов для использования в качестве входных данных инструментов.

Оцените свои затраты

Стоимость текстовых токенов: каждая страница обычно использует 1 500–3 000 токенов в зависимости от плотности контента. Применяется стандартная цена API без дополнительных сборов за PDF.
Стоимость токенов изображений: поскольку каждая страница преобразуется в изображение, применяются те же расчёты стоимости на основе изображений.

Вы можете использовать подсчёт токенов для оценки затрат на ваши конкретные PDF-файлы.

Оптимизация обработки PDF

Повышение производительности

Следуйте этим рекомендациям для достижения оптимальных результатов:

Размещайте PDF-файлы перед текстом в ваших запросах
Используйте стандартные шрифты
Убедитесь, что текст чёткий и разборчивый
Поворачивайте страницы в правильную вертикальную ориентацию
Используйте логические номера страниц (из программы просмотра PDF) в подсказках
Разделяйте большие PDF-файлы на части при необходимости
Включайте кэширование подсказок для повторного анализа

Масштабирование вашей реализации

Для обработки больших объёмов рассмотрите следующие подходы:

Используйте кэширование подсказок

Кэшируйте PDF-файлы для повышения производительности при повторных запросах:

client = anthropic.Anthropic()
# ...
message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                    "cache_control": {"type": "ephemeral"},
                },
                {"type": "text", "text": "Analyze this document."},
            ],
        }
    ],
)

Обработка пакетов документов

Используйте Message Batches API для рабочих процессов с большим объёмом:

client = anthropic.Anthropic()
# ...
message_batch = client.messages.batches.create(
    requests=[
        {
            "custom_id": "doc1",
            "params": {
                "model": "claude-opus-4-8",
                "max_tokens": 1024,
                "messages": [
                    {
                        "role": "user",
                        "content": [
                            {
                                "type": "document",
                                "source": {
                                    "type": "base64",
                                    "media_type": "application/pdf",
                                    "data": pdf_data,
                                },
                            },
                            {"type": "text", "text": "Summarize this document."},
                        ],
                    }
                ],
            },
        }
    ]
)

Следующие шаги

Попробуйте примеры с PDF

Изучите практические примеры обработки PDF в рецепте из кулинарной книги.

Посмотреть справочник API

См. полную документацию API по поддержке PDF.

Was this page helpful?

Прежде чем начать

Проверьте требования к PDF

Поддерживаемые платформы и модели

Поддержка PDF в Amazon Bedrock

Режимы обработки документов

Ключевые ограничения

Распространённые проблемы

Обработка PDF с помощью Claude

Отправьте свой первый запрос с PDF

Вариант 1: PDF-документ по URL

Вариант 2: PDF-документ в кодировке base64

Вариант 3: Files API

Как работает поддержка PDF

Оцените свои затраты

Оптимизация обработки PDF

Повышение производительности

Масштабирование вашей реализации

Используйте кэширование подсказок

Обработка пакетов документов

Следующие шаги

Прежде чем начать

Проверьте требования к PDF

Поддерживаемые платформы и модели

Поддержка PDF в Amazon Bedrock

Режимы обработки документов

Ключевые ограничения

Распространённые проблемы

Обработка PDF с помощью Claude

Отправьте свой первый запрос с PDF

Вариант 1: PDF-документ по URL

Вариант 2: PDF-документ в кодировке base64

Вариант 3: Files API

Как работает поддержка PDF

Оцените свои затраты

Оптимизация обработки PDF

Повышение производительности

Масштабирование вашей реализации

Используйте кэширование подсказок

Обработка пакетов документов

Следующие шаги

Прежде чем начать

Проверьте требования к PDF

Поддерживаемые платформы и модели

Поддержка PDF в Amazon Bedrock

Режимы обработки документов

Ключевые ограничения

Распространённые проблемы

Обработка PDF с помощью Claude

Отправьте свой первый запрос с PDF

Вариант 1: PDF-документ по URL

Вариант 2: PDF-документ в кодировке base64

Вариант 3: Files API

Как работает поддержка PDF

Оцените свои затраты

Оптимизация обработки PDF

Повышение производительности

Масштабирование вашей реализации

Используйте кэширование подсказок

Обработка пакетов документов

Следующие шаги

Прежде чем начать

Проверьте требования к PDF

Поддерживаемые платформы и модели

Поддержка PDF в Amazon Bedrock

Режимы обработки документов

Ключевые ограничения

Распространённые проблемы

Обработка PDF с помощью Claude

Отправьте свой первый запрос с PDF

Вариант 1: PDF-документ по URL

Вариант 2: PDF-документ в кодировке base64

Вариант 3: Files API

Как работает поддержка PDF

Оцените свои затраты

Оптимизация обработки PDF

Повышение производительности

Масштабирование вашей реализации

Используйте кэширование подсказок

Обработка пакетов документов

Следующие шаги