Claude Platform Docs
  • Mensajes
  • Agentes gestionados
  • Administración

Search...
⌘K
Casos de uso
Descripción generalEnrutamiento de ticketsAgente de atención al clienteModeración de contenidoResumen legal
Ingeniería de prompts
Descripción generalMejores prácticas de promptsPrompts para Claude Fable 5Prompts para Claude Opus 4.8Prompts para Claude Sonnet 5Herramientas de prompts de la Consola
Probar y evaluar
Definir el éxito y crear evaluacionesUso de la herramienta de evaluación en la ConsolaReducir la latencia
Reforzar las barreras de protección
Reducir alucinacionesAumentar la consistencia de salidaMitigar jailbreaksReducir la filtración de prompts
Referencia
Glosario

Log in
Agente de atención al cliente
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Claude Platform Docs

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Claude on AWS
  • Claude on Google Cloud

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Mejores prácticas/Casos de uso

Agente de atención al cliente

Crea un chatbot de atención al cliente con Claude que responda preguntas sobre productos, se mantenga en el tema y genere cotizaciones mediante el uso de herramientas.

Requisitos previos

Para seguir esta guía, necesitas:

  • Una clave de API de Claude (configurada como la variable de entorno ANTHROPIC_API_KEY)
  • Python 3.9 o posterior

Instala los paquetes requeridos:

pip install anthropic streamlit python-dotenv

Antes de construir con Claude

Decide si usar Claude para el chat de soporte

Estos son algunos indicadores clave de que deberías emplear un LLM como Claude para automatizar partes de tu proceso de atención al cliente:

Algunas consideraciones para elegir Claude sobre otros LLMs:

  • Priorizas conversaciones naturales y matizadas: la sofisticada comprensión del lenguaje de Claude permite conversaciones más naturales y conscientes del contexto que se sienten más humanas que los chats con otros LLMs.
  • Recibes con frecuencia consultas complejas y abiertas: Claude puede manejar una amplia gama de temas y consultas sin generar respuestas predefinidas ni requerir una programación extensa de permutaciones de expresiones del usuario.
  • Necesitas soporte multilingüe escalable: las capacidades multilingües de Claude le permiten entablar conversaciones en más de 200 idiomas sin necesidad de chatbots separados ni procesos de traducción extensos para cada idioma compatible.

Define tu interacción de chat ideal

Esboza una interacción ideal con el cliente para definir cómo y cuándo esperas que el cliente interactúe con Claude. Este esquema ayudará a determinar los requisitos técnicos de tu solución.

Aquí tienes un ejemplo de interacción de chat para atención al cliente de seguros de automóviles:

  • Cliente: Inicia la experiencia de chat de soporte
    • Claude: Saluda cordialmente al cliente e inicia la conversación
  • Cliente: Pregunta sobre el seguro para su nuevo auto eléctrico
    • Claude: Proporciona información relevante sobre la cobertura de vehículos eléctricos
  • Cliente: Hace preguntas relacionadas con necesidades únicas de seguros para vehículos eléctricos
    • Claude: Responde con respuestas precisas e informativas y proporciona enlaces a las fuentes
  • Cliente: Hace preguntas fuera de tema no relacionadas con seguros o autos
    • Claude: Aclara que no discute temas no relacionados y redirige al usuario de vuelta al seguro de automóviles
  • Cliente: Expresa interés en una cotización de seguro
    • Claude: Hace una serie de preguntas para determinar la cotización apropiada, adaptándose a sus respuestas
    • Claude: Envía una solicitud para usar la herramienta de API de generación de cotizaciones junto con la información necesaria recopilada del usuario
    • Claude: Recibe la información de respuesta del uso de herramientas de la API, sintetiza la información en una respuesta natural y presenta la cotización proporcionada al usuario
  • Cliente: Hace preguntas de seguimiento
    • Claude: Responde las preguntas de seguimiento según sea necesario
    • Claude: Guía al cliente hacia los siguientes pasos en el proceso de seguro y cierra la conversación

En el ejemplo real que escribas para tu propio caso de uso, puede resultarte útil escribir las palabras exactas de esta interacción para que también puedas tener una idea del tono ideal, la longitud de respuesta y el nivel de detalle que deseas que tenga Claude.

Divide la interacción en tareas únicas

El chat de atención al cliente es una colección de múltiples tareas diferentes, desde responder preguntas hasta recuperar información y tomar acciones sobre solicitudes, todo envuelto en una sola interacción con el cliente. Antes de comenzar a construir, divide tu interacción ideal con el cliente en cada tarea que deseas que Claude pueda realizar. Esto garantiza que puedas crear prompts y evaluar a Claude para cada tarea, y te da una buena idea del rango de interacciones que debes tener en cuenta al escribir casos de prueba.


A los clientes a veces les resulta útil visualizar esto como un diagrama de flujo de interacción con posibles puntos de inflexión de la conversación según las solicitudes del usuario.

Estas son las tareas clave asociadas con el ejemplo de interacción de seguros:

  1. Saludo y orientación general

    • Saludar cordialmente al cliente e iniciar la conversación
    • Proporcionar información general sobre la empresa y la interacción
  2. Información del producto

    • Proporcionar información sobre la cobertura de vehículos eléctricos
      
      Esto requerirá que Claude tenga la información necesaria en su contexto, y podría implicar que sea necesaria una integración RAG.
    • Responder preguntas relacionadas con necesidades únicas de seguros para vehículos eléctricos
    • Responder preguntas de seguimiento sobre la cotización o los detalles del seguro
    • Ofrecer enlaces a fuentes cuando sea apropiado
  3. Gestión de la conversación

    • Mantenerse en el tema (seguro de automóviles)
    • Redirigir preguntas fuera de tema de vuelta a temas relevantes
  4. Generación de cotizaciones

    • Hacer preguntas apropiadas para determinar la elegibilidad de la cotización
    • Adaptar las preguntas según las respuestas del cliente
    • Enviar la información recopilada a la API de generación de cotizaciones
    • Presentar la cotización proporcionada al cliente

Establece criterios de éxito

Trabaja con tu equipo de soporte para definir criterios de éxito y escribir evaluaciones detalladas con puntos de referencia y objetivos medibles.

Estos son criterios y puntos de referencia que se pueden usar para evaluar qué tan exitosamente Claude realiza las tareas definidas:

Estos son criterios y puntos de referencia que se pueden usar para evaluar el impacto comercial de emplear Claude para soporte:

Cómo implementar Claude como agente de servicio al cliente

Elige el modelo de Claude adecuado

La elección del modelo depende de las compensaciones entre costo, precisión y tiempo de respuesta.

Para el chat de atención al cliente, Claude Opus 4.8 es adecuado para equilibrar inteligencia, latencia y costo. Sin embargo, para casos en los que tienes un flujo de conversación con múltiples prompts que incluyen RAG, uso de herramientas o prompts de contexto largo, Claude Haiku 4.5 puede ser más adecuado para optimizar la latencia.

Construye un prompt sólido

Usar Claude para atención al cliente requiere que Claude tenga suficiente dirección y contexto para responder apropiadamente, mientras tiene suficiente flexibilidad para manejar una amplia gama de consultas de clientes.

Comienza escribiendo los elementos de un prompt sólido, empezando con una indicación del sistema. Crea un archivo llamado config.py y agrega cada uno de los siguientes bloques:

IDENTITY = """You are Eva, a friendly and knowledgeable AI assistant for Acme Insurance
Company. Your role is to warmly welcome customers and provide information on
Acme's insurance offerings, which include car insurance and electric car
insurance. You can also help customers get quotes for their insurance needs."""

Aunque podrías sentirte tentado a poner toda tu información dentro de una indicación del sistema como una forma de separar las instrucciones de la conversación del usuario, Claude en realidad funciona mejor con la mayor parte del contenido de su prompt escrito dentro del primer turno de User (con la única excepción del role prompting). Lee más en Dar a Claude un rol con una indicación del sistema.

Es mejor dividir los prompts complejos en subsecciones y escribir una parte a la vez. Para cada tarea, podrías encontrar mayor éxito siguiendo un proceso paso a paso para definir las partes del prompt que Claude necesitaría para realizar bien la tarea. Para este ejemplo de atención al cliente de seguros de automóviles, escribirás por partes todos los elementos de un prompt comenzando con la tarea de "Saludo y orientación general". Esto también facilita la depuración de tu prompt, ya que puedes ajustar más rápidamente partes individuales del prompt general.

STATIC_GREETINGS_AND_GENERAL = """
<static_context>
Acme Auto Insurance: Your Trusted Companion on the Road

About:
At Acme Insurance, we understand that your vehicle is more than just a mode of transportation—it's your ticket to life's adventures.
Since 1985, we've been crafting auto insurance policies that give drivers the confidence to explore, commute, and travel with peace of mind.
Whether you're navigating city streets or embarking on cross-country road trips, Acme is there to protect you and your vehicle.
Our innovative auto insurance policies are designed to adapt to your unique needs, covering everything from fender benders to major collisions.
With Acme's award-winning customer service and swift claim resolution, you can focus on the joy of driving while we handle the rest.
We're not just an insurance provider—we're your co-pilot in life's journeys.
Choose Acme Auto Insurance and experience the assurance that comes with superior coverage and genuine care. Because at Acme, we don't just
insure your car—we fuel your adventures on the open road.

Note: We also offer specialized coverage for electric vehicles, ensuring that drivers of all car types can benefit from our protection.

Acme Insurance offers the following products:
- Car insurance
- Electric car insurance
- Two-wheeler insurance

Business hours: Monday-Friday, 9 AM - 5 PM EST
Customer service number: 1-800-123-4567
</static_context>
"""

Luego haz lo mismo para tu información de seguros de automóviles y seguros de autos eléctricos.

STATIC_CAR_INSURANCE = """
<static_context>
Car Insurance Coverage:
Acme's car insurance policies typically cover:
1. Liability coverage: Pays for bodily injury and property damage you cause to others.
2. Collision coverage: Pays for damage to your car in an accident.
3. Comprehensive coverage: Pays for damage to your car from non-collision incidents.
4. Medical payments coverage: Pays for medical expenses after an accident.
5. Uninsured/underinsured motorist coverage: Protects you if you're hit by a driver with insufficient insurance.

Optional coverages include:
- Rental car reimbursement
- Roadside assistance
- New car replacement
</static_context>
"""

STATIC_ELECTRIC_CAR_INSURANCE = """
<static_context>
Electric Car Insurance:
Our specialized electric car insurance goes beyond traditional auto coverage,
offering tailored protection for your high-tech investment. In addition to standard coverages, we offer:
- Safeguarding expensive battery systems
- Covering home charging equipment
- Adapting to the rapidly evolving world of electric vehicles

Whether you're driving a Rivian, Nissan Leaf, Chevrolet Bolt,
or any other electric vehicle, our knowledgeable agents are ready to craft a policy
that gives you the confidence to enjoy every electron-powered mile.
</static_context>
"""

Ahora que tienes tu contenido estático, agrega al menos 4-5 interacciones "buenas" de muestra para guiar las respuestas de Claude. Estos ejemplos deben ser representativos de tu interacción ideal con el cliente y pueden incluir barreras de protección, llamadas a herramientas, etc.

EXAMPLES = """
Here are a few examples of how you can interact with customers:

<example 1>
H: Hi, do you offer commercial insurance for small businesses?

A: Ah! Unfortunately, we don't offer commercial insurance at this time.
However, we do provide a range of personal insurance products including car insurance and electric car insurance.
Would you like to know more about these offerings?
</example 1>

<example 2>
H: Hi, what are your business hours?

A: Our business hours are Monday to Friday, 9 AM to 5 PM EST.
If you have any questions or need assistance, feel free to reach out during those times.
How else can I assist you today?
</example 2>

<example 3>
H: I'm shopping for car insurance. What does Acme offer?

A: Great choice! Acme's car insurance policies typically include:
- Liability coverage: Protects you if you're at fault in an accident
- Collision coverage: Pays for damage to your car in an accident
- Comprehensive coverage: Covers non-collision incidents like theft or vandalism
- Medical payments coverage: Pays for medical expenses after an accident
- Uninsured/underinsured motorist coverage: Protects you from drivers with insufficient insurance

We also offer optional coverages like rental car reimbursement, roadside assistance, and new car replacement.
Would you like more details on any of these coverages, or do you have specific questions about insuring your vehicle?
</example 3>

<example 4>
H: I'd like to hear about your electric car insurance.

A: Certainly! Our electric car insurance is specially designed to meet the unique needs of electric vehicle owners.
In addition to all the standard coverages we offer for regular cars, our electric car policies include:

- Battery coverage: Protection against damage or degradation of your vehicle's expensive battery system
- Tech package: Covers repairs or replacement of advanced electronics and onboard computer systems
- Charging station coverage: Protects both home and portable charging equipment
- Cybersecurity protection: Coverage against hacking or digital threats
- Specialized roadside assistance: Includes flatbed towing to protect the vehicle's undercarriage

We cover a wide range of electric vehicles, including popular models from Tesla, Rivian, Nissan, Chevrolet, and more.
Is there a specific electric vehicle you're looking to insure, or would you like more details on any of these coverages?
</example 4>

<example 5>
H: I'd like to get a quote for my car insurance.

A: Certainly! I'd be happy to help you get a quote for your car insurance.
To provide you with an accurate quote, I'll need to collect some information about your vehicle and the primary driver.
Let's start with the basics:

1. What is the make and model of your vehicle?
2. What year was it manufactured?
3. Approximately how many miles have you driven?
4. What is the age of the primary driver?

Once you provide this information, I'll use our quoting tool to generate a personalized insurance quote for you.
</example 5>
"""

También querrás incluir cualquier instrucción importante que describa lo que se debe y no se debe hacer respecto a cómo Claude debe interactuar con el cliente. Esto puede basarse en las barreras de protección de la marca o las políticas de soporte.

ADDITIONAL_GUARDRAILS = """Please adhere to the following guardrails:
1. Only provide information about insurance types listed in our offerings.
2. If asked about an insurance type we don't offer, politely state
that we don't provide that service.
3. Do not speculate about future product offerings or company plans.
4. Don't make promises or enter into agreements it's not authorized to make.
You only provide information and guidance.
5. Do not mention any competitor's products or services.
"""

Ahora combina todas estas secciones en una sola cadena para usar como tu prompt.

TASK_SPECIFIC_INSTRUCTIONS = " ".join(
    [
        STATIC_GREETINGS_AND_GENERAL,
        STATIC_CAR_INSURANCE,
        STATIC_ELECTRIC_CAR_INSURANCE,
        EXAMPLES,
        ADDITIONAL_GUARDRAILS,
    ]
)

Agrega capacidades dinámicas y agénticas con el uso de herramientas

Claude es capaz de tomar acciones y recuperar información dinámicamente usando la funcionalidad de uso de herramientas del lado del cliente. Comienza enumerando cualquier herramienta externa o API que el prompt deba usar.

Para este ejemplo, comienza con una herramienta para calcular la cotización.


Como recordatorio, esta herramienta no realizará el cálculo real, solo indicará a la aplicación que se debe usar una herramienta con los argumentos especificados.

Agrega el nombre del modelo, la definición de la herramienta y una implementación provisional a config.py:

import time

MODEL = "claude-opus-4-8"

TOOLS = [
    {
        "name": "get_quote",
        "description": "Calculate the insurance quote based on user input. Returned value is per month premium.",
        "input_schema": {
            "type": "object",
            "properties": {
                "make": {"type": "string", "description": "The make of the vehicle."},
                "model": {"type": "string", "description": "The model of the vehicle."},
                "year": {
                    "type": "integer",
                    "description": "The year the vehicle was manufactured.",
                },
                "mileage": {
                    "type": "integer",
                    "description": "The mileage on the vehicle.",
                },
                "driver_age": {
                    "type": "integer",
                    "description": "The age of the primary driver.",
                },
            },
            "required": ["make", "model", "year", "mileage", "driver_age"],
        },
    }
]


def get_quote(make, model, year, mileage, driver_age):
    """Returns the premium per month in USD"""
    # Puedes llamar a un endpoint http o a una base de datos para obtener la cotización.
    # Aquí, simulamos un retraso de 1 segundo y devolvemos una cotización fija de 100.
    time.sleep(1)
    return 100

Despliega tus prompts

Es difícil saber qué tan bien funciona tu prompt sin desplegarlo en un entorno de producción de prueba y ejecutar evaluaciones. Construye una pequeña aplicación usando el prompt, el SDK de Anthropic y Streamlit para una interfaz de usuario.

En un archivo llamado chatbot.py, comienza configurando la clase ChatBot, que encapsulará las interacciones con el SDK de Anthropic.

La clase debe tener dos métodos principales: generate_message y process_user_input.

from anthropic import Anthropic
from config import IDENTITY, TOOLS, MODEL, get_quote
from dotenv import load_dotenv

load_dotenv()


class ChatBot:
    def __init__(self, session_state):
        self.anthropic = Anthropic()
        self.session_state = session_state

    def generate_message(
        self,
        messages,
        max_tokens,
    ):
        try:
            response = self.anthropic.messages.create(
                model=MODEL,
                system=IDENTITY,
                max_tokens=max_tokens,
                messages=messages,
                tools=TOOLS,
            )
            return response
        except Exception as e:
            return {"error": str(e)}

    def process_user_input(self, user_input):
        self.session_state.messages.append({"role": "user", "content": user_input})

        response_message = self.generate_message(
            messages=self.session_state.messages,
            max_tokens=2048,
        )

        if "error" in response_message:
            return f"An error occurred: {response_message['error']}"

        if response_message.content[-1].type == "tool_use":
            tool_use = response_message.content[-1]
            func_name = tool_use.name
            func_params = tool_use.input
            tool_use_id = tool_use.id

            result = self.handle_tool_use(func_name, func_params)
            self.session_state.messages.append(
                {"role": "assistant", "content": response_message.content}
            )
            self.session_state.messages.append(
                {
                    "role": "user",
                    "content": [
                        {
                            "type": "tool_result",
                            "tool_use_id": tool_use_id,
                            "content": f"{result}",
                        }
                    ],
                }
            )

            follow_up_response = self.generate_message(
                messages=self.session_state.messages,
                max_tokens=2048,
            )

            if "error" in follow_up_response:
                return f"An error occurred: {follow_up_response['error']}"

            response_text = follow_up_response.content[0].text
            self.session_state.messages.append(
                {"role": "assistant", "content": response_text}
            )
            return response_text

        elif response_message.content[0].type == "text":
            response_text = response_message.content[0].text
            self.session_state.messages.append(
                {"role": "assistant", "content": response_text}
            )
            return response_text

        else:
            raise Exception("An error occurred: Unexpected response type")

    def handle_tool_use(self, func_name, func_params):
        if func_name == "get_quote":
            premium = get_quote(**func_params)
            return f"Quote generated: ${premium:.2f} per month"

        raise Exception("An unexpected tool was used")

Construye tu interfaz de usuario

Prueba el despliegue de este código con Streamlit usando un método main. Esta función main() configura una interfaz de chat basada en Streamlit.

Haz esto en un archivo llamado app.py

import streamlit as st
from chatbot import ChatBot
from config import TASK_SPECIFIC_INSTRUCTIONS


def main():
    st.title("Chat with Eva, Acme Insurance Company's Assistant🤖")

    if "messages" not in st.session_state:
        st.session_state.messages = [
            {"role": "user", "content": TASK_SPECIFIC_INSTRUCTIONS},
            {"role": "assistant", "content": "Understood"},
        ]

    chatbot = ChatBot(st.session_state)

    # Muestra los mensajes de usuario y asistente omitiendo los dos primeros
    for message in st.session_state.messages[2:]:
        # ignora los bloques de uso de herramientas
        if isinstance(message["content"], str):
            with st.chat_message(message["role"]):
                st.markdown(message["content"])

    if user_msg := st.chat_input("Type your message here..."):
        st.chat_message("user").markdown(user_msg)

        with st.chat_message("assistant"):
            with st.spinner("Eva is thinking..."):
                response_placeholder = st.empty()
                full_response = chatbot.process_user_input(user_msg)
                response_placeholder.markdown(full_response)


if __name__ == "__main__":
    main()

Ejecuta el programa con:

streamlit run app.py

Evalúa tus prompts

La creación de prompts a menudo requiere pruebas y optimización para que esté lista para producción. Para determinar la preparación de tu solución, evalúa el rendimiento del chatbot usando un proceso sistemático que combine métodos cuantitativos y cualitativos. Crear una evaluación empírica sólida basada en tus criterios de éxito definidos te permitirá optimizar tus prompts.


El Claude Console ahora cuenta con una herramienta de Evaluación que te permite probar tus prompts en varios escenarios.

Mejora el rendimiento

En escenarios complejos, puede ser útil considerar estrategias adicionales para mejorar el rendimiento más allá de las técnicas estándar de ingeniería de prompts y las estrategias de implementación de barreras de protección. Estos son algunos escenarios comunes:

Reduce la latencia de contexto largo con RAG

Cuando se trabaja con grandes cantidades de contexto estático y dinámico, incluir toda la información en el prompt puede generar altos costos, tiempos de respuesta más lentos y alcanzar los límites de la ventana de contexto. En este escenario, implementar técnicas de "Retrieval Augmented Generation" (generación aumentada por recuperación), o RAG, puede mejorar el rendimiento y la eficiencia.

Al usar modelos de embeddings como Voyage para convertir información en representaciones vectoriales, puedes crear un sistema más escalable y receptivo. Este enfoque permite la recuperación dinámica de información relevante basada en la consulta actual, en lugar de incluir todo el contexto posible en cada prompt.

Se ha demostrado que implementar RAG para casos de uso de soporte aumenta la precisión, reduce los tiempos de respuesta y reduce los costos de API en sistemas con requisitos de contexto extensos. Consulta la receta de RAG para ver un ejemplo práctico.

Integra datos en tiempo real con el uso de herramientas

Cuando se trata de consultas que requieren información en tiempo real, como saldos de cuentas o detalles de pólizas, los enfoques RAG basados en embeddings no son suficientes. En su lugar, el uso de herramientas puede mejorar la capacidad de tu chatbot para proporcionar respuestas precisas y en tiempo real. Por ejemplo, puedes usar el uso de herramientas para buscar información del cliente, recuperar detalles de pedidos y cancelar pedidos en nombre del cliente.

Este enfoque, descrito en la receta de uso de herramientas: agente de servicio al cliente, te permite integrar datos en vivo en las respuestas de Claude y proporcionar una experiencia de cliente más personalizada y eficiente.

Fortalece las barreras de protección de entrada y salida

Al desplegar un chatbot, especialmente en escenarios de servicio al cliente, es importante prevenir riesgos asociados con el mal uso, consultas fuera de alcance y respuestas inapropiadas. Si bien Claude es inherentemente resistente a tales escenarios, aquí hay pasos adicionales para fortalecer las barreras de protección de tu chatbot:

  • Reducir alucinaciones: Implementa mecanismos de verificación de hechos y citas para fundamentar las respuestas en la información proporcionada.
  • Verificar información cruzada: Verifica que las respuestas del agente se alineen con las políticas de tu empresa y los hechos conocidos.
  • Evitar compromisos contractuales: Asegúrate de que el agente no haga promesas ni celebre acuerdos que no esté autorizado a hacer.
  • Mitigar jailbreaks: Usa métodos como filtros de inocuidad y validación de entrada para evitar que los usuarios exploten vulnerabilidades del modelo con el objetivo de generar contenido inapropiado.
  • Evitar mencionar competidores: Implementa un filtro de mención de competidores para mantener el enfoque de marca y no mencionar productos o servicios de ningún competidor.
  • Aumentar la consistencia de salida: Evita que Claude cambie de estilo o salga de su personaje, incluso durante interacciones largas y complejas.
  • Eliminar información de identificación personal (PII): A menos que se requiera y autorice explícitamente, elimina cualquier PII de las respuestas.

Reduce el tiempo de respuesta percibido con streaming

Cuando se trata de respuestas potencialmente largas, implementar streaming puede mejorar la participación y satisfacción del usuario. En este escenario, los usuarios reciben la respuesta progresivamente en lugar de esperar a que se genere toda la respuesta.

Así es como implementar streaming:

  1. Usa la API de Streaming de Anthropic para admitir respuestas en streaming.
  2. Configura tu frontend para manejar fragmentos de texto entrantes.
  3. Muestra cada fragmento a medida que llega, simulando escritura en tiempo real.
  4. Implementa un mecanismo para guardar la respuesta completa, permitiendo a los usuarios verla si navegan fuera y regresan.

En algunos casos, el streaming permite el uso de modelos más avanzados con latencias base más altas, ya que la visualización progresiva mitiga el impacto de tiempos de procesamiento más largos.

Escala tu chatbot

A medida que crece la complejidad de tu chatbot, la arquitectura de tu aplicación puede evolucionar para adaptarse. Antes de agregar más capas a tu arquitectura, considera las siguientes opciones menos exhaustivas:

  • Asegúrate de aprovechar al máximo tus prompts y optimizar mediante ingeniería de prompts. Usa las guías de ingeniería de prompts para escribir los prompts más efectivos.
  • Agrega herramientas adicionales al prompt (que pueden incluir cadenas de prompts) y ve si puedes lograr la funcionalidad requerida.

Si tu chatbot maneja tareas increíblemente variadas, es posible que desees considerar agregar un clasificador de intención separado para enrutar la consulta inicial del cliente. Para la aplicación existente, esto implicaría crear un árbol de decisiones que enrutaría las consultas de los clientes a través del clasificador y luego a conversaciones especializadas (con su propio conjunto de herramientas e indicaciones del sistema). Ten en cuenta que este método requiere una llamada adicional a Claude que puede aumentar la latencia.

Integra Claude en tu flujo de trabajo de soporte

Si bien estos ejemplos se han centrado en funciones de Python invocables dentro de un entorno de Streamlit, desplegar Claude para un chatbot de soporte en tiempo real requiere un servicio de API.

Así es como puedes abordar esto:

  1. Crea un wrapper de API: Desarrolla un wrapper de API simple alrededor de tu función de clasificación. Por ejemplo, puedes usar Flask API o Fast API para envolver tu código en un servicio HTTP. Tu servicio HTTP podría aceptar la entrada del usuario y devolver la respuesta del Asistente en su totalidad. Así, tu servicio podría tener las siguientes características:

    • Server-Sent Events (SSE): SSE permite el streaming en tiempo real de respuestas desde el servidor al cliente. Esto proporciona una experiencia fluida e interactiva al trabajar con LLMs.
    • Almacenamiento en caché: Implementar almacenamiento en caché puede mejorar los tiempos de respuesta y reducir llamadas innecesarias a la API.
    • Retención de contexto: Mantener el contexto cuando un usuario navega fuera y regresa es importante para la continuidad en las conversaciones.
  2. Construye una interfaz web: Implementa una interfaz web fácil de usar para interactuar con el agente impulsado por Claude.

Próximos pasos


Uso de herramientas

Dale a Claude acceso a tus APIs para que pueda tomar acciones en nombre de los clientes.


Desarrollar pruebas

Construye evaluaciones para medir tu agente de soporte frente a los criterios de éxito que definiste.


Streaming

Transmite respuestas para que los clientes vean las respuestas a medida que se generan.

Ingeniería de prompts

Refina tu indicación del sistema y ejemplos para un mejor rendimiento de las tareas.

Was this page helpful?

  • Requisitos previos
  • Antes de construir con Claude
  • Decide si usar Claude para el chat de soporte
  • Define tu interacción de chat ideal
  • Divide la interacción en tareas únicas
  • Establece criterios de éxito
  • Cómo implementar Claude como agente de servicio al cliente
  • Elige el modelo de Claude adecuado
  • Construye un prompt sólido
  • Agrega capacidades dinámicas y agénticas con el uso de herramientas
  • Despliega tus prompts
  • Construye tu interfaz de usuario
  • Evalúa tus prompts
  • Mejora el rendimiento
  • Integra Claude en tu flujo de trabajo de soporte
  • Próximos pasos