Вот некоторые ключевые индикаторы того, что вам следует использовать LLM, такой как Claude, вместо традиционных подходов ML для вашей задачи классификации:
Перед тем как погружаться в автоматизацию, важно понять вашу существующую систему тикетирования. Начните с исследования того, как ваша команда поддержки в настоящее время обрабатывает маршрутизацию тикетов.
Рассмотрите вопросы вроде:
Чем больше вы знаете о том, как люди обрабатывают определенные случаи, тем лучше вы сможете работать с Claude для выполнения задачи.
Хорошо определенный список категорий намерения пользователя имеет решающее значение для точной классификации тикетов поддержки с Claude. Способность Claude маршрутизировать тикеты эффективно в вашей системе прямо пропорциональна тому, насколько хорошо определены категории вашей системы.
Вот некоторые примеры категорий и подкатегорий намерения пользователя.
В дополнение к намерению, маршрутизация тикетов и приоритизация также могут быть под влиянием других факторов, таких как срочность, тип клиента, SLA или язык. Обязательно рассмотрите другие критерии маршрутизации при создании вашей автоматизированной системы маршрутизации.
Работайте с вашей командой поддержки, чтобы определить четкие критерии успеха с измеримыми ориентирами, пороговыми значениями и целями.
Вот некоторые стандартные критерии и ориентиры при использовании LLM для маршрутизации тикетов поддержки:
Вот некоторые общие критерии успеха, которые могут быть полезны независимо от того, используется ли LLM:
Выбор модели зависит от компромиссов между стоимостью, точностью и временем ответа.
Многие клиенты обнаружили, что claude-haiku-4-5-20251001 является идеальной моделью для маршрутизации тикетов, так как это самая быстрая и наиболее экономичная модель в семействе Claude 4, при этом все еще обеспечивая отличные результаты. Если ваша задача классификации требует глубокой предметной экспертизы или большого объема категорий намерения с сложным рассуждением, вы можете выбрать большую модель Sonnet.
Маршрутизация тикетов — это тип задачи классификации. Claude анализирует содержание тикета поддержки и классифицирует его в предопределенные категории на основе типа проблемы, срочности, требуемой экспертизы или других релевантных факторов.
Давайте напишем подсказку классификации тикетов. Наша первоначальная подсказка должна содержать содержание запроса пользователя и возвращать как рассуждение, так и намерение.
Попробуйте генератор подсказок на Claude Console, чтобы Claude написал первый черновик для вас.
Вот пример подсказки классификации маршрутизации тикетов:
def classify_support_request(ticket_contents):
# Define the prompt for the classification task
classification_prompt = f"""You will be acting as a customer support ticket classification system. Your task is to analyze customer support requests and output the appropriate classification intent for each request, along with your reasoning.
Here is the customer support request you need to classify:
<request>{ticket_contents}</request>
Please carefully analyze the above request to determine the customer's core intent and needs. Consider what the customer is asking for has concerns about.
First, write out your reasoning and analysis of how to classify this request inside <reasoning> tags.
Then, output the appropriate classification label for the request inside a <intent> tag. The valid intents are:
<intents>
<intent>Support, Feedback, Complaint</intent>
<intent>Order Tracking</intent>
<intent>Refund/Exchange</intent>
</intents>
A request may have ONLY ONE applicable intent. Only include the intent that is most applicable to the request.
As an example, consider the following request:
<request>Hello! I had high-speed fiber internet installed on Saturday and my installer, Kevin, was absolutely fantastic! Where can I send my positive review? Thanks for your help!</request>
Here is an example of how your output should be formatted (for the above example request):
<reasoning>The user seeks information in order to leave positive feedback.</reasoning>
<intent>Support, Feedback, Complaint</intent>
Here are a few more examples:
<examples>
<example 2>
Example 2 Input:
<request>I wanted to write and personally thank you for the compassion you showed towards my family during my father's funeral this past weekend. Your staff was so considerate and helpful throughout this whole process; it really took a load off our shoulders. The visitation brochures were beautiful. We'll never forget the kindness you showed us and we are so appreciative of how smoothly the proceedings went. Thank you, again, Amarantha Hill on behalf of the Hill Family.</request>
Example 2 Output:
<reasoning>User leaves a positive review of their experience.</reasoning>
<intent>Support, Feedback, Complaint</intent>
</example 2>
<example 3>
...
</example 8>
<example 9>
Example 9 Input:
<request>Your website keeps sending ad-popups that block the entire screen. It took me twenty minutes just to finally find the phone number to call and complain. How can I possibly access my account information with all of these popups? Can you access my account for me, since your website is broken? I need to know what the address is on file.</request>
Example 9 Output:
<reasoning>The user requests help accessing their web account information.</reasoning>
<intent>Support, Feedback, Complaint</intent>
</example 9>
Remember to always include your classification reasoning before your actual intent output. The reasoning should be enclosed in <reasoning> tags and the intent in <intent> tags. Return only the reasoning and the intent.
"""Давайте разберем ключевые компоненты этой подсказки:
ticket_contents быть вставленным в теги <request>.<reasoning>, за которыми следует соответствующая метка классификации внутри тегов <intent>.Причина, по которой мы хотим, чтобы Claude разделил свой ответ на различные разделы тегов XML, заключается в том, чтобы мы могли использовать регулярные выражения для отдельного извлечения рассуждения и намерения из вывода. Это позволяет нам создавать целевые следующие шаги в рабочем процессе маршрутизации тикетов, такие как использование только намерения для определения того, кому маршрутизировать тикет.
Сложно узнать, насколько хорошо работает ваша подсказка без развертывания ее в тестовой производственной среде и запуска оценок.
Давайте создадим структуру развертывания. Начните с определения сигнатуры метода для обертывания нашего вызова Claude. Мы возьмем метод, который мы уже начали писать, который имеет ticket_contents в качестве входных данных, и теперь вернем кортеж reasoning и intent в качестве выходных данных. Если у вас есть существующая автоматизация, использующая традиционный ML, вы захотите следовать этой сигнатуре метода вместо этого.
import anthropic
import re
# Create an instance of the Claude API client
client = anthropic.Anthropic()
# Set the default model
DEFAULT_MODEL="claude-haiku-4-5-20251001"
def classify_support_request(ticket_contents):
# Define the prompt for the classification task
classification_prompt = f"""You will be acting as a customer support ticket classification system.
...
... The reasoning should be enclosed in <reasoning> tags and the intent in <intent> tags. Return only the reasoning and the intent.
"""
# Send the prompt to the API to classify the support request.
message = client.messages.create(
model=DEFAULT_MODEL,
max_tokens=500,
temperature=0,
messages=[{"role": "user", "content": classification_prompt}],
stream=False,
)
reasoning_and_intent = message.content[0].text
# Use Python's regular expressions library to extract `reasoning`.
reasoning_match = re.search(
r"<reasoning>(.*?)</reasoning>", reasoning_and_intent, re.DOTALL
)
reasoning = reasoning_match.group(1).strip() if reasoning_match else ""
# Similarly, also extract the `intent`.
intent_match = re.search(r"<intent>(.*?)</intent>", reasoning_and_intent, re.DOTALL)
intent = intent_match.group(1).strip() if intent_match else ""
return reasoning, intentЭтот код:
classify_support_request, которая принимает строку ticket_contents.ticket_contents в Claude для классификации, используя classification_promptreasoning и intent модели, извлеченные из ответа.Поскольку нам нужно дождаться полного создания текста рассуждения и намерения перед анализом, мы устанавливаем stream=False (по умолчанию).
Создание подсказок часто требует тестирования и оптимизации, чтобы быть готовым к производству. Чтобы определить готовность вашего решения, оцените производительность на основе критериев успеха и пороговых значений, которые вы установили ранее.
Для запуска вашей оценки вам потребуются тестовые случаи для запуска. Остальная часть этого руководства предполагает, что вы уже разработали ваши тестовые случаи.
Наш пример оценки для этого руководства измеряет производительность Claude по трем ключевым метрикам:
Вам может потребоваться оценить Claude по другим осям в зависимости от того, какие факторы важны для вас.
Для оценки этого, мы сначала должны изменить скрипт, который мы написали, и добавить функцию для сравнения предсказанного намерения с фактическим намерением и расчета процента правильных предсказаний. Мы также должны добавить функциональность расчета стоимости и измерения времени.
import anthropic
import re
# Create an instance of the Claude API client
client = anthropic.Anthropic()
# Set the default model
DEFAULT_MODEL="claude-haiku-4-5-20251001"
def classify_support_request(request, actual_intent):
# Define the prompt for the classification task
classification_prompt = f"""You will be acting as a customer support ticket classification system.
...
...The reasoning should be enclosed in <reasoning> tags and the intent in <intent> tags. Return only the reasoning and the intent.
"""
message = client.messages.create(
model=DEFAULT_MODEL,
max_tokens=500,
temperature=0,
messages=[{"role": "user", "content": classification_prompt}],
)
usage = message.usage # Get the usage statistics for the API call for how many input and output tokens were used.
reasoning_and_intent = message.content[0].text
# Use Python's regular expressions library to extract `reasoning`.
reasoning_match = re.search(
r"<reasoning>(.*?)</reasoning>", reasoning_and_intent, re.DOTALL
)
reasoning = reasoning_match.group(1).strip() if reasoning_match else ""
# Similarly, also extract the `intent`.
intent_match = re.search(r"<intent>(.*?)</intent>", reasoning_and_intent, re.DOTALL)
intent = intent_match.group(1).strip() if intent_match else ""
# Check if the model's prediction is correct.
correct = actual_intent.strip() == intent.strip()
# Return the reasoning, intent, correct, and usage.
return reasoning, intent, correct, usageДавайте разберем правки, которые мы сделали:
actual_intent из наших тестовых случаев в метод classify_support_request и установили сравнение для оценки того, соответствует ли классификация намерения Claude нашей золотой классификации намерения.Надлежащая оценка требует четких пороговых значений и ориентиров для определения того, что является хорошим результатом. Скрипт выше даст нам значения времени выполнения для точности, времени ответа и стоимости за классификацию, но нам все еще потребуются четко установленные пороговые значения. Например:
Наличие этих пороговых значений позволяет вам быстро и легко определить в масштабе и с беспристрастным эмпиризмом, какой метод лучше всего для вас и какие изменения могут потребоваться для лучшего соответствия вашим требованиям.
В сложных сценариях может быть полезно рассмотреть дополнительные стратегии для улучшения производительности за пределами стандартных методов инженерии подсказок и стратегий реализации guardrail. Вот некоторые распространенные сценарии:
По мере роста количества классов растет и количество требуемых примеров, потенциально делая подсказку громоздкой. В качестве альтернативы, вы можете рассмотреть реализацию иерархической системы классификации, используя смесь классификаторов.
Например, у вас может быть классификатор верхнего уровня, который широко категоризирует тикеты на "Технические проблемы", "Вопросы выставления счетов" и "Общие запросы". Каждая из этих категорий может затем иметь свой собственный подклассификатор для дальнейшего уточнения классификации.

Плюсы - большая нюансированность и точность: Вы можете создавать различные подсказки для каждого пути родителя, позволяя более целевую и контекстно-специфичную классификацию. Это может привести к улучшенной точности и более нюансированной обработке запросов клиентов.
Минусы - увеличенная задержка: Имейте в виду, что несколько классификаторов могут привести к увеличенной задержке, и мы рекомендуем реализовать этот подход с нашей самой быстрой моделью, Haiku.
Несмотря на то, что предоставление примеров является наиболее эффективным способом улучшения производительности, если запросы поддержки высоко вариативны, может быть сложно включить достаточно примеров в одну подсказку.
В этом сценарии вы можете использовать векторную базу данных для выполнения поисков по сходству из набора данных примеров и извлечения наиболее релевантных примеров для данного запроса.
Этот подход, описанный подробно в нашем рецепте классификации, показал улучшение производительности с 71% точности до 93% точности.
Вот некоторые сценарии, где Claude может неправильно классифицировать тикеты (могут быть другие, уникальные для вашей ситуации). В этих сценариях рассмотрите предоставление явных инструкций или примеров в подсказке того, как Claude должен обрабатывать граничный случай:
Надлежащая интеграция требует, чтобы вы приняли некоторые решения относительно того, как ваш скрипт маршрутизации тикетов на основе Claude вписывается в архитектуру вашей большей системы маршрутизации тикетов. Есть два способа, которыми вы можете это сделать:
Для любого из этих подходов вам потребуется обернуть ваш скрипт в сервис. Выбор подхода зависит от того, какие API предоставляет ваша система тикетирования поддержки.
Посетите наш справочник по классификации для получения дополнительного примера кода и подробного руководства по оценке.