Это руководство описывает паттерны создания подсказок, специфичные для Claude Opus 4.8. О возможностях модели и изменениях в API см. Что нового в Claude Opus 4.8. О техниках, применимых ко всем текущим моделям Claude, см. Лучшие практики создания подсказок.
Claude Opus 4.8 обладает особыми сильными сторонами в длительной агентной работе, работе со знаниями, задачах компьютерного зрения и задачах, связанных с памятью. Модель хорошо работает «из коробки» с существующими подсказками для Claude Opus 4.7. Приведённые ниже паттерны охватывают те аспекты поведения, которые чаще всего требуют настройки.
Об изменениях параметров API при миграции с Claude Opus 4.7 (параметры сэмплирования, значение effort по умолчанию, контекстное окно 1M по умолчанию (200k на Microsoft Foundry), системные сообщения в середине разговора и детали остановки по причине отказа) см. руководство по миграции.
Claude Opus 4.8 калибрует длину ответа в зависимости от того, насколько сложной модель считает задачу, а не использует фиксированный уровень многословности по умолчанию. Обычно это означает более короткие ответы на простые запросы и значительно более длинные — на открытый анализ.
Если ваш продукт зависит от определённого стиля или многословности вывода, вам может потребоваться настроить подсказки. Например, чтобы уменьшить многословность, можно добавить:
Provide concise, focused responses. Skip non-essential context, and keep examples minimal.Если вы замечаете конкретные примеры определённых видов многословности (например, избыточные объяснения), вы можете добавить дополнительные инструкции в подсказку, чтобы предотвратить их. Положительные примеры, показывающие, как Claude может общаться с нужным уровнем лаконичности, как правило, более эффективны, чем отрицательные примеры или инструкции, указывающие модели, чего не следует делать.
Параметр effort (усилие) позволяет настраивать баланс между интеллектом Claude и расходом токенов, жертвуя возможностями ради более высокой скорости и меньших затрат. Начните с уровня усилий xhigh для сценариев программирования и агентных задач и используйте минимум high для большинства задач, чувствительных к интеллекту. Экспериментируйте с другими уровнями усилий для дальнейшей настройки расхода токенов и интеллекта:
max: Максимальное усилие может дать прирост производительности в некоторых сценариях, но может демонстрировать убывающую отдачу от увеличенного расхода токенов. Эта настройка также иногда склонна к избыточному обдумыванию. Тестируйте максимальное усилие для задач, требующих высокого интеллекта.xhigh: Очень высокое усилие — лучшая настройка для большинства сценариев программирования и агентных задач.high: Эта настройка балансирует расход токенов и интеллект. Для большинства задач, чувствительных к интеллекту, используйте минимум уровень high.medium: Подходит для чувствительных к стоимости сценариев, где нужно сократить расход токенов, жертвуя интеллектом.low: Оставьте для коротких, ограниченных по объёму задач и рабочих нагрузок, чувствительных к задержке, но не чувствительных к интеллекту.Claude Opus 4.8 строго соблюдает уровни усилий, особенно на нижнем конце шкалы. На уровнях low и medium модель ограничивает свою работу тем, что было запрошено, не выходя за рамки. Это хорошо для задержки и стоимости, но на умеренно сложных задачах при уровне low есть некоторый риск недостаточного обдумывания.
Если вы наблюдаете поверхностные рассуждения на сложных задачах, повысьте усилие до high или xhigh вместо того, чтобы обходить проблему через подсказку. Если вам нужно сохранить усилие на уровне low ради задержки, добавьте целевые указания:
This task involves multi-step reasoning. Think carefully through the problem before responding.Усилие, вероятно, будет более важным для этой модели, чем для любой предыдущей версии Opus, поэтому активно экспериментируйте с ним при обновлении.
В Claude Opus 4.8 мышление отключено, если вы явно не установите thinking: {type: "adaptive"}. Поведение срабатывания адаптивного мышления поддаётся управлению. Если вы обнаружите, что модель думает чаще, чем вам хотелось бы, — что может происходить при больших или сложных системных подсказках, — добавьте указания для управления этим. Как всегда, измеряйте влияние любых изменений подсказок на производительность. Пример:
Thinking adds latency and should only be used when it will meaningfully improve answer
quality — typically for problems that require multi-step reasoning. When in doubt,
respond directly.И наоборот, если вы выполняете сложные рабочие нагрузки на уровне medium и наблюдаете недостаточное обдумывание, первый рычаг — повысить усилие. Если вам нужен более тонкий контроль, укажите это напрямую в подсказке.
Если вы запускаете Claude Opus 4.8 с усилием max или xhigh, установите большой бюджет максимального количества выходных токенов, чтобы у модели было пространство для мышления и действий через субагентов и вызовы инструментов. Начните с 64k токенов и настраивайте дальше.
Claude Opus 4.8 склонен отдавать предпочтение рассуждениям перед вызовами инструментов. В большинстве случаев это даёт лучшие результаты. Однако повышение настройки усилия — полезный рычаг для увеличения уровня использования инструментов, особенно в работе со знаниями. Настройки усилия high или xhigh демонстрируют существенно большее использование инструментов в агентном поиске и программировании. Для сценариев, где вам нужно больше использования инструментов, вы также можете скорректировать подсказку, явно указав модели, когда и как правильно использовать её инструменты. Например, если вы обнаружите, что модель не использует ваши инструменты веб-поиска, чётко опишите, почему и как она должна это делать.
Claude Opus 4.8 предоставляет более регулярные и качественные обновления для пользователя на протяжении длинных агентных трасс. Если вы добавляли обвязку для принудительных промежуточных сообщений о статусе («После каждых 3 вызовов инструментов резюмируй прогресс»), попробуйте её убрать. Если вы обнаружите, что длина или содержание обновлений Claude Opus 4.8 для пользователя плохо откалиброваны под ваш сценарий, явно опишите в подсказке, как должны выглядеть эти обновления, и приведите примеры.
Claude Opus 4.8 интерпретирует подсказки буквально и явно, особенно на более низких уровнях усилий. Модель не обобщает молча инструкцию с одного элемента на другой и не додумывает запросы, которых вы не делали. Преимущество такой буквальности — точность и меньше метаний; в целом это лучше работает для сценариев использования API с тщательно настроенными подсказками, структурированным извлечением и конвейерами, где вам нужно предсказуемое поведение. Если вам нужно, чтобы Claude применял инструкцию широко, укажите область применения явно (например, «Применяй это форматирование к каждому разделу, а не только к первому»).
Как и с любой новой моделью, стиль прозы в длинных текстах может измениться. Claude Opus 4.8 тяготеет к прямому, уверенному стилю с минимумом одобрительно-валидирующих формулировок и скупым использованием эмодзи. Если ваш продукт полагается на определённый голос, пересмотрите стилевые подсказки относительно нового базового поведения.
Например, если голос вашего продукта более тёплый или разговорный, добавьте:
Use a warm, collaborative tone. Acknowledge the user's framing before answering.Claude Opus 4.8 по умолчанию склонен порождать меньше субагентов. Однако этим поведением можно управлять через подсказки; дайте Claude Opus 4.8 явные указания о том, когда субагенты желательны. Упрощённый пример для сценария программирования:
Do not spawn a subagent for work you can complete directly in a single response (e.g.
refactoring a function you can already see).
Spawn multiple subagents in the same turn when fanning out across items or reading multiple files.Claude Opus 4.8 обладает сильным дизайнерским чутьём с устойчивым фирменным стилем по умолчанию: тёплые кремовые/молочно-белые фоны (~#F4F1EA), антиквенные заголовочные шрифты (Georgia, Fraunces, Playfair), курсивные акценты на словах и терракотовый/янтарный акцентный цвет. Это хорошо смотрится для редакционных материалов, гостиничного бизнеса и портфолио, но будет выглядеть неуместно для дашбордов, инструментов разработчика, финтеха, здравоохранения или корпоративных приложений. Этот стиль по умолчанию проявляется как в презентациях, так и в веб-интерфейсах.
Этот стиль по умолчанию устойчив. Общие инструкции («не используй кремовый», «сделай чисто и минималистично») обычно сдвигают модель к другой фиксированной палитре, а не дают разнообразие. Надёжно работают два подхода:
1. Укажите конкретную альтернативу. Модель точно следует явным спецификациям:
Design a desktop landing page for a supplement brand called AEFRM.
The visual direction should come from a cold monochrome atmosphere using pale
silver-gray tones that gradually deepen into blue-gray and near-black, similar to a
misted metallic surface.
The page should feel sharp and controlled, with a strong sense of structure and restraint.
Use this tonal system across the full page instead of introducing bright accent colors.
Use the uploaded image on the hero design in black and white.
The layout should be built with clear horizontal sections and a centered max-width
container. Use 4px corner radius consistently across cards, buttons, inputs, and media
frames. Margins should feel generous, with enough empty space around each section so the
page breathes.
Typography should use a square, angular sans-serif with wider letter spacing than usual,
especially in headings and navigation, so the text feels more engineered and less
compressed. Headline text can be large and uppercase, while supporting copy remains
short and sparse. The sub texts should be written with Alumni Sans SC in 4-6px like tiny
little texts on corners bottom centre like that.
For the structure, start with a hero section containing a strong product statement, one
short supporting paragraph, and a clean product placeholder or packshot frame. Below
that, add a benefit grid with three or four blocks, then a formulation or ingredients
section, and finally a cta.
Buttons should be flat and precise, with subtle hover changes using transition: all
160ms ease out where brightness and border contrast shift slightly rather than using
dramatic motion.
Color palette should stay within this range:
#E9ECEC, #C9D2D4, #8C9A9E, #44545B, #11171B.2. Попросите модель предложить варианты перед созданием. Это ломает поведение по умолчанию и даёт пользователям контроль. Если раньше вы полагались на temperature для разнообразия дизайна, используйте этот подход; он даёт значимо различающиеся направления между запусками. Пример подсказки:
Before building, propose 4 distinct visual directions tailored to this brief (each as:
bg hex / accent hex / typeface — one-line rationale). Ask the user to pick one, then
implement only that direction.Кроме того, Claude Opus 4.8 требует меньше подсказок по фронтенд-дизайну, чем предыдущие модели, чтобы избежать шаблонных паттернов, которые пользователи называют эстетикой «AI slop» (ИИ-халтура). Для более ранних моделей Anthropic рекомендовала более длинный фрагмент подсказки в навыке frontend-design. Однако Claude Opus 4.8 генерирует самобытные, креативные фронтенды с более минимальными указаниями в подсказке. Этот фрагмент подсказки хорошо работает вместе с приведёнными выше советами по разнообразию:
<frontend_aesthetics>
NEVER use generic AI-generated aesthetics like overused font families (Inter, Roboto,
Arial, system fonts), cliched color schemes (particularly purple gradients on white or
dark backgrounds), predictable layouts and component patterns, and cookie-cutter design
that lacks context-specific character. Use unique fonts, cohesive colors and themes, and
animations for effects and micro-interactions.
</frontend_aesthetics>Расход токенов и поведение Claude Opus 4.8 могут различаться между автономными асинхронными агентами программирования с одним ходом пользователя и интерактивными синхронными агентами программирования с несколькими ходами пользователя. В частности, модель склонна использовать больше токенов в интерактивных условиях, главным образом потому, что она больше рассуждает после ходов пользователя. Это может улучшить долгосрочную согласованность, следование инструкциям и возможности программирования в длинных интерактивных сессиях, но также сопровождается большим расходом токенов. Чтобы максимизировать и производительность, и эффективность токенов в продуктах для программирования, используйте усилие xhigh или high, добавьте автономные функции вроде автоматического режима и сократите количество человеческих взаимодействий, требуемых от ваших пользователей.
Разумеется, при ограничении количества требуемых взаимодействий с пользователем важно заранее указать задачу, намерение и релевантные ограничения в первом ходе человека. Предоставление хорошо специфицированных, чётких и точных описаний задач заранее помогает максимизировать автономность и интеллект, минимизируя дополнительный расход токенов после ходов пользователя. Поскольку Claude Opus 4.8 более автономен, чем предыдущие модели, такой паттерн использования помогает максимизировать производительность. Напротив, неоднозначные или недостаточно специфицированные подсказки, передаваемые постепенно через несколько ходов пользователя, как правило, относительно снижают эффективность токенов, а иногда и производительность.
Claude Opus 4.8 значительно лучше находит баги, чем предыдущие модели, и имеет как более высокую полноту, так и точность во внутренних оценках. Однако если ваша обвязка для код-ревью была настроена под более раннюю модель, вы можете поначалу увидеть более низкую полноту. Это, скорее всего, эффект обвязки, а не регрессия возможностей. Когда подсказка для ревью содержит фразы вроде «сообщай только о проблемах высокой серьёзности», «будь консервативен» или «не придирайся к мелочам», Claude Opus 4.8 может следовать этой инструкции более добросовестно, чем более ранние модели: модель может исследовать код так же тщательно, выявить баги, а затем не сообщить о находках, которые она считает ниже заявленной вами планки. Это может проявляться так: модель проводит ту же глубину исследования, но конвертирует меньше исследований в сообщённые находки, особенно по багам низкой серьёзности. Точность обычно растёт, но измеренная полнота может падать, даже несмотря на то что базовая способность модели находить баги улучшилась.
Рекомендуемые формулировки для подсказки:
Report every issue you find, including ones you are uncertain about or consider
low-severity. Do not filter for importance or confidence at this stage - a separate
verification step will do that. Your goal here is coverage: it is better to surface a
finding that later gets filtered out than to silently drop a real bug. For each finding,
include your confidence level and an estimated severity so a downstream filter can rank
them.Эту подсказку можно использовать без фактического второго шага, но вынесение фильтрации по уверенности из шага поиска часто помогает. Если в вашей обвязке есть отдельный этап верификации, дедупликации или ранжирования, явно скажите модели, что её задача на этапе поиска — охват, а не фильтрация.
Если вы всё же хотите, чтобы модель самостоятельно фильтровала за один проход, будьте конкретны в том, где находится планка, вместо использования качественных терминов вроде «важный»: например, «сообщай о любых багах, которые могут вызвать некорректное поведение, падение теста или вводящий в заблуждение результат; опускай только мелочи вроде чисто стилистических предпочтений или предпочтений в именовании».
Итерируйте подсказки на подмножестве ваших оценок или тестовых случаев, чтобы подтвердить прирост полноты или F1-меры.
Возможность использования компьютера работает на разных разрешениях, вплоть до максимального разрешения 2576px / 3,75 МП. Внутреннее тестирование использования компьютера показывает, что отправка изображений в 1080p обеспечивает хороший баланс производительности и стоимости.
Для особенно чувствительных к стоимости рабочих нагрузок 720p или 1366×768 — более дешёвые варианты с высокой производительностью. Проведите собственное тестирование, чтобы найти идеальные настройки для вашего сценария; эксперименты с настройками усилия также могут помочь настроить поведение модели.
Was this page helpful?