Loading...
  • Разработка
  • Администрирование
  • Модели и цены
  • Клиентские SDK
  • Справочник API
Search...
⌘K
Log in
Поддержка PDF
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Разработка/Работа с файлами

Поддержка PDF

Обработка PDF с помощью Claude. Извлекайте текст, анализируйте диаграммы и понимайте визуальное содержимое ваших документов.

This feature is eligible for Zero Data Retention (ZDR). When your organization has a ZDR arrangement, data sent through this feature is not stored after the API response is returned.

Вы можете задавать Claude вопросы о любом тексте, изображениях, диаграммах и таблицах в предоставленных вами PDF-файлах. Некоторые примеры использования:

  • Анализ финансовых отчетов и понимание диаграмм/таблиц
  • Извлечение ключевой информации из юридических документов
  • Помощь в переводе документов
  • Преобразование информации из документов в структурированные форматы

Перед началом

Проверка требований к PDF

Claude работает с любым стандартным PDF. Убедитесь, что размер вашего запроса соответствует этим требованиям:

ТребованиеЛимит
Максимальный размер запроса32 МБ (варьируется в зависимости от платформы)
Максимальное количество страниц на запрос600 (100 для моделей с контекстным окном 200k токенов)
ФорматСтандартный PDF (без паролей/шифрования)

Оба лимита применяются ко всему полезному грузу запроса, включая любое другое содержимое, отправляемое вместе с PDF. Для больших PDF рассмотрите возможность загрузки с помощью Files API и ссылки по file_id для сохранения небольшого размера полезного груза запроса.

Плотные PDF (много страниц с мелким шрифтом, сложные таблицы или тяжелая графика) могут заполнить контекстное окно до достижения лимита страниц. Запросы с большими PDF также могут завершиться ошибкой до достижения лимита страниц, даже при использовании Files API. Попробуйте разделить документ на разделы; для больших файлов, поскольку каждая страница обрабатывается как изображение, понижение дискретизации встроенных изображений также может помочь.

Поскольку поддержка PDF основана на возможностях зрения Claude, она подлежит тем же ограничениям и соображениям, что и другие задачи зрения.

Поддерживаемые платформы и модели

Поддержка PDF в настоящее время поддерживается через прямой доступ к API и Google Vertex AI. Все активные модели поддерживают обработку PDF.

Поддержка PDF теперь доступна на Amazon Bedrock со следующими соображениями:

Поддержка PDF в Amazon Bedrock

При использовании поддержки PDF через Converse API Amazon Bedrock существует два различных режима обработки документов:

Важно: Для доступа к полным возможностям визуального понимания PDF Claude в Converse API необходимо включить цитирование. Без включенного цитирования API возвращается к базовому извлечению текста только. Узнайте больше о работе с цитированиями.

Режимы обработки документов

  1. Converse Document Chat (Исходный режим - только извлечение текста)

    • Обеспечивает базовое извлечение текста из PDF
    • Не может анализировать изображения, диаграммы или визуальные макеты в PDF
    • Использует примерно 1000 токенов для 3-страничного PDF
    • Автоматически используется, когда цитирование не включено
  2. Claude PDF Chat (Новый режим - полное визуальное понимание)

    • Обеспечивает полный визуальный анализ PDF
    • Может понимать и анализировать диаграммы, графики, изображения и визуальные макеты
    • Обрабатывает каждую страницу как текст и изображение для комплексного понимания
    • Использует примерно 7000 токенов для 3-страничного PDF
    • Требует включения цитирования в Converse API

Ключевые ограничения

  • Converse API: Визуальный анализ PDF требует включения цитирования. В настоящее время нет возможности использовать визуальный анализ без цитирования (в отличие от InvokeModel API).
  • InvokeModel API: Обеспечивает полный контроль над обработкой PDF без принудительного цитирования.

Распространенные проблемы

Если клиенты сообщают, что Claude не видит изображения или диаграммы в их PDF при использовании Converse API, им, вероятно, нужно включить флаг цитирования. Без него Converse возвращается к базовому извлечению текста только.

Это известное ограничение Converse API. Для приложений, требующих визуального анализа PDF без цитирования, рассмотрите использование InvokeModel API вместо этого.

Для файлов, не являющихся PDF, таких как .csv, .xlsx, .docx, .md или .txt файлы, см. Работа с другими форматами файлов.


Обработка PDF с помощью Claude

Отправка первого запроса PDF

Давайте начнем с простого примера, используя Messages API. Вы можете предоставить PDF Claude тремя способами:

  1. Как ссылка на URL на PDF, размещенный в Интернете
  2. Как закодированный в base64 PDF в блоках содержимого document
  3. По file_id из Files API

Вариант 1: PDF-документ на основе URL

Самый простой подход - ссылаться на PDF непосредственно с URL:

client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "url",
                        "url": "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf",
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Вариант 2: PDF-документ, закодированный в base64

Если вам нужно отправить PDF из вашей локальной системы или когда URL недоступен:

import base64
import httpx

# First, load and encode the PDF
pdf_url = "https://assets.anthropic.com/m/1cd9d098ac3e6467/original/Claude-3-Model-Card-October-Addendum.pdf"
pdf_data = base64.standard_b64encode(httpx.get(pdf_url).content).decode("utf-8")

# Alternative: Load from a local file
# with open("document.pdf", "rb") as f:
#     pdf_data = base64.standard_b64encode(f.read()).decode("utf-8")

# Send to Claude using base64 encoding
client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Вариант 3: Files API

Для PDF, которые вы будете использовать повторно, или когда вы хотите избежать затрат на кодирование, используйте Files API:

client = anthropic.Anthropic()

# Upload the PDF file
with open("document.pdf", "rb") as f:
    file_upload = client.beta.files.upload(file=("document.pdf", f, "application/pdf"))

# Use the uploaded file in a message
message = client.beta.messages.create(
    model="claude-opus-4-7",
    max_tokens=1024,
    betas=["files-api-2025-04-14"],
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {"type": "file", "file_id": file_upload.id},
                },
                {"type": "text", "text": "What are the key findings in this document?"},
            ],
        }
    ],
)

print(message.content)

Как работает поддержка PDF

Когда вы отправляете PDF Claude, происходят следующие шаги:

  1. 1

    Система извлекает содержимое документа.

    • Система преобразует каждую страницу документа в изображение.
    • Текст из каждой страницы извлекается и предоставляется вместе с изображением каждой страницы.
  2. 2

    Claude анализирует как текст, так и изображения для лучшего понимания документа.

    • Документы предоставляются как комбинация текста и изображений для анализа.
    • Это позволяет пользователям запрашивать информацию о визуальных элементах PDF, таких как диаграммы, схемы и другое нетекстовое содержимое.
  3. 3

    Claude отвечает, ссылаясь на содержимое PDF, если это уместно.

    Claude может ссылаться как на текстовое, так и на визуальное содержимое при ответе. Вы можете дополнительно улучшить производительность, интегрировав поддержку PDF с:

    • Кэширование подсказок: Для улучшения производительности при повторном анализе.
    • Пакетная обработка: Для обработки документов в больших объемах.
    • Использование инструментов: Для извлечения конкретной информации из документов для использования в качестве входных данных инструментов.

Оценка ваших затрат

Количество токенов в PDF-файле зависит от общего текста, извлеченного из документа, а также от количества страниц:

  • Затраты на текстовые токены: Каждая страница обычно использует 1500-3000 токенов на страницу в зависимости от плотности содержимого. Применяется стандартное ценообразование API без дополнительных сборов за PDF.
  • Затраты на токены изображений: Поскольку каждая страница преобразуется в изображение, применяются те же расчеты стоимости на основе изображений.

Вы можете использовать подсчет токенов для оценки затрат на ваши конкретные PDF.


Оптимизация обработки PDF

Улучшение производительности

Следуйте этим лучшим практикам для оптимальных результатов:

  • Размещайте PDF перед текстом в ваших запросах
  • Используйте стандартные шрифты
  • Убедитесь, что текст четкий и разборчивый
  • Поворачивайте страницы в правильную вертикальную ориентацию
  • Используйте логические номера страниц (из средства просмотра PDF) в подсказках
  • Разделяйте большие PDF на части при необходимости
  • Включите кэширование подсказок для повторного анализа

Масштабируйте вашу реализацию

Для обработки больших объемов данных рассмотрите эти подходы:

Используйте кэширование подсказок

Кэшируйте PDF-файлы для повышения производительности при повторных запросах:

client = anthropic.Anthropic()
# ...
message = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "document",
                    "source": {
                        "type": "base64",
                        "media_type": "application/pdf",
                        "data": pdf_data,
                    },
                    "cache_control": {"type": "ephemeral"},
                },
                {"type": "text", "text": "Analyze this document."},
            ],
        }
    ],
)

Обработка пакетов документов

Используйте API Message Batches для высокопроизводительных рабочих процессов:

client = anthropic.Anthropic()
# ...
message_batch = client.messages.batches.create(
    requests=[
        {
            "custom_id": "doc1",
            "params": {
                "model": "claude-opus-4-7",
                "max_tokens": 1024,
                "messages": [
                    {
                        "role": "user",
                        "content": [
                            {
                                "type": "document",
                                "source": {
                                    "type": "base64",
                                    "media_type": "application/pdf",
                                    "data": pdf_data,
                                },
                            },
                            {"type": "text", "text": "Summarize this document."},
                        ],
                    }
                ],
            },
        }
    ]
)

Следующие шаги

Попробуйте примеры с PDF

Изучите практические примеры обработки PDF в рецепте cookbook.

Просмотрите справку API

Ознакомьтесь с полной документацией API для поддержки PDF.

Was this page helpful?

  • Перед началом
  • Проверка требований к PDF
  • Поддерживаемые платформы и модели
  • Поддержка PDF в Amazon Bedrock
  • Обработка PDF с помощью Claude
  • Отправка первого запроса PDF
  • Как работает поддержка PDF
  • Оценка ваших затрат
  • Оптимизация обработки PDF
  • Улучшение производительности
  • Масштабируйте вашу реализацию
  • Следующие шаги