• Mensajes
  • Agentes gestionados
  • Administración
Search...
⌘K
Casos de uso
Descripción generalEnrutamiento de ticketsAgente de atención al clienteModeración de contenidoResumen legal
Ingeniería de prompts
Descripción generalMejores prácticas de promptsPrompts para Claude Fable 5Prompts para Claude Opus 4.8Herramientas de prompts de la Consola
Probar y evaluar
Definir el éxito y crear evaluacionesUso de la herramienta de evaluación en la ConsolaReducir la latencia
Reforzar las barreras de protección
Reducir alucinacionesAumentar la consistencia de salidaMitigar jailbreaksReducir la filtración de prompts
Referencia
Glosario
Log in
Agente de atención al cliente
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Amazon Bedrock
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Mejores prácticas/Casos de uso

Agente de atención al cliente

Esta guía explica cómo aprovechar las capacidades conversacionales avanzadas de Claude para gestionar consultas de clientes en tiempo real, proporcionando soporte 24/7, reduciendo los tiempos de espera y gestionando altos volúmenes de soporte con respuestas precisas e interacciones positivas.

Antes de construir con Claude

Decide si usar Claude para el chat de soporte

Estos son algunos indicadores clave de que deberías emplear un LLM como Claude para automatizar partes de tu proceso de atención al cliente:

Algunas consideraciones para elegir Claude sobre otros LLMs:

  • Priorizas conversaciones naturales y matizadas: la sofisticada comprensión del lenguaje de Claude permite conversaciones más naturales y conscientes del contexto que se sienten más humanas que los chats con otros LLMs.
  • Recibes con frecuencia consultas complejas y abiertas: Claude puede manejar una amplia gama de temas y consultas sin generar respuestas predefinidas ni requerir una programación extensa de permutaciones de expresiones del usuario.
  • Necesitas soporte multilingüe escalable: las capacidades multilingües de Claude le permiten entablar conversaciones en más de 200 idiomas sin necesidad de chatbots separados ni procesos de traducción extensos para cada idioma compatible.

Define tu interacción de chat ideal

Describe una interacción ideal con el cliente para definir cómo y cuándo esperas que el cliente interactúe con Claude. Este esquema ayudará a determinar los requisitos técnicos de tu solución.

Aquí tienes un ejemplo de interacción de chat para atención al cliente de seguros de automóviles:

  • Cliente: Inicia la experiencia de chat de soporte
    • Claude: Saluda cordialmente al cliente e inicia la conversación
  • Cliente: Pregunta sobre el seguro para su nuevo auto eléctrico
    • Claude: Proporciona información relevante sobre la cobertura de vehículos eléctricos
  • Cliente: Hace preguntas relacionadas con necesidades únicas de seguros para vehículos eléctricos
    • Claude: Responde con respuestas precisas e informativas y proporciona enlaces a las fuentes
  • Cliente: Hace preguntas fuera de tema no relacionadas con seguros o autos
    • Claude: Aclara que no discute temas no relacionados y redirige al usuario de vuelta al seguro de automóviles
  • Cliente: Expresa interés en una cotización de seguro
    • Claude: Hace una serie de preguntas para determinar la cotización apropiada, adaptándose a sus respuestas
    • Claude: Envía una solicitud para usar la herramienta de API de generación de cotizaciones junto con la información necesaria recopilada del usuario
    • Claude: Recibe la información de respuesta del uso de herramientas de la API, sintetiza la información en una respuesta natural y presenta la cotización proporcionada al usuario
  • Cliente: Hace preguntas de seguimiento
    • Claude: Responde las preguntas de seguimiento según sea necesario
    • Claude: Guía al cliente hacia los siguientes pasos en el proceso de seguro y cierra la conversación
En el ejemplo real que escribas para tu propio caso de uso, puede resultarte útil escribir las palabras exactas de esta interacción para que también puedas tener una idea del tono ideal, la longitud de respuesta y el nivel de detalle que deseas que tenga Claude.

Divide la interacción en tareas únicas

El chat de atención al cliente es una colección de múltiples tareas diferentes, desde responder preguntas hasta recuperar información y tomar acciones sobre solicitudes, todo envuelto en una sola interacción con el cliente. Antes de comenzar a construir, divide tu interacción ideal con el cliente en cada tarea que deseas que Claude pueda realizar. Esto garantiza que puedas crear prompts y evaluar a Claude para cada tarea, y te da una buena idea del rango de interacciones que debes tener en cuenta al escribir casos de prueba.

A los clientes a veces les resulta útil visualizar esto como un diagrama de flujo de interacción con posibles puntos de inflexión de la conversación según las solicitudes del usuario.

Estas son las tareas clave asociadas con el ejemplo de interacción de seguros anterior:

  1. Saludo y orientación general

    • Saludar cordialmente al cliente e iniciar la conversación
    • Proporcionar información general sobre la empresa y la interacción
  2. Información del producto

    • Proporcionar información sobre la cobertura de vehículos eléctricos
      Esto requerirá que Claude tenga la información necesaria en su contexto, y podría implicar que sea necesaria una integración RAG.
    • Responder preguntas relacionadas con necesidades únicas de seguros para vehículos eléctricos
    • Responder preguntas de seguimiento sobre la cotización o detalles del seguro
    • Ofrecer enlaces a fuentes cuando sea apropiado
  3. Gestión de la conversación

    • Mantenerse en el tema (seguro de automóviles)
    • Redirigir preguntas fuera de tema de vuelta a temas relevantes
  4. Generación de cotizaciones

    • Hacer preguntas apropiadas para determinar la elegibilidad de la cotización
    • Adaptar las preguntas según las respuestas del cliente
    • Enviar la información recopilada a la API de generación de cotizaciones
    • Presentar la cotización proporcionada al cliente

Establece criterios de éxito

Trabaja con tu equipo de soporte para definir criterios de éxito y escribir evaluaciones detalladas con puntos de referencia y objetivos medibles.

Estos son criterios y puntos de referencia que se pueden usar para evaluar qué tan exitosamente Claude realiza las tareas definidas:

Estos son criterios y puntos de referencia que se pueden usar para evaluar el impacto comercial de emplear Claude para soporte:

Cómo implementar Claude como agente de servicio al cliente

Elige el modelo de Claude adecuado

La elección del modelo depende de las compensaciones entre costo, precisión y tiempo de respuesta.

Para el chat de atención al cliente, Claude Opus 4.8 es adecuado para equilibrar inteligencia, latencia y costo. Sin embargo, para casos en los que tienes un flujo de conversación con múltiples prompts que incluyen RAG, uso de herramientas y/o prompts de contexto largo, Claude Haiku 4.5 puede ser más adecuado para optimizar la latencia.

Construye un prompt sólido

Usar Claude para atención al cliente requiere que Claude tenga suficiente dirección y contexto para responder apropiadamente, mientras tiene suficiente flexibilidad para manejar una amplia gama de consultas de clientes.

Comienza escribiendo los elementos de un prompt sólido, empezando con una indicación del sistema:

IDENTITY = """You are Eva, a friendly and knowledgeable AI assistant for Acme Insurance
Company. Your role is to warmly welcome customers and provide information on
Acme's insurance offerings, which include car insurance and electric car
insurance. You can also help customers get quotes for their insurance needs."""
Aunque puedas sentirte tentado a poner toda tu información dentro de una indicación del sistema como una forma de separar las instrucciones de la conversación del usuario, Claude en realidad funciona mejor con la mayor parte del contenido de su prompt escrito dentro del primer turno de User (con la única excepción del role prompting). Lee más en Asignar un rol a Claude con una indicación del sistema.

Es mejor dividir los prompts complejos en subsecciones y escribir una parte a la vez. Para cada tarea, podrías encontrar mayor éxito siguiendo un proceso paso a paso para definir las partes del prompt que Claude necesitaría para realizar bien la tarea. Para este ejemplo de atención al cliente de seguros de automóviles, escribirás por partes todos los componentes de un prompt comenzando con la tarea "Saludo y orientación general". Esto también facilita la depuración de tu prompt, ya que puedes ajustar más rápidamente partes individuales del prompt general.

Coloca todas estas piezas en un archivo llamado config.py.

STATIC_GREETINGS_AND_GENERAL = """
<static_context>
Acme Auto Insurance: Your Trusted Companion on the Road

About:
At Acme Insurance, we understand that your vehicle is more than just a mode of transportation—it's your ticket to life's adventures.
Since 1985, we've been crafting auto insurance policies that give drivers the confidence to explore, commute, and travel with peace of mind.
Whether you're navigating city streets or embarking on cross-country road trips, Acme is there to protect you and your vehicle.
Our innovative auto insurance policies are designed to adapt to your unique needs, covering everything from fender benders to major collisions.
With Acme's award-winning customer service and swift claim resolution, you can focus on the joy of driving while we handle the rest.
We're not just an insurance provider—we're your co-pilot in life's journeys.
Choose Acme Auto Insurance and experience the assurance that comes with superior coverage and genuine care. Because at Acme, we don't just
insure your car—we fuel your adventures on the open road.

Note: We also offer specialized coverage for electric vehicles, ensuring that drivers of all car types can benefit from our protection.

Acme Insurance offers the following products:
- Car insurance
- Electric car insurance
- Two-wheeler insurance

Business hours: Monday-Friday, 9 AM - 5 PM EST
Customer service number: 1-800-123-4567
</static_context>
"""

Luego haz lo mismo para tu información de seguros de automóviles y seguros de autos eléctricos.

STATIC_CAR_INSURANCE = """
<static_context>
Car Insurance Coverage:
Acme's car insurance policies typically cover:
1. Liability coverage: Pays for bodily injury and property damage you cause to others.
2. Collision coverage: Pays for damage to your car in an accident.
3. Comprehensive coverage: Pays for damage to your car from non-collision incidents.
4. Medical payments coverage: Pays for medical expenses after an accident.
5. Uninsured/underinsured motorist coverage: Protects you if you're hit by a driver with insufficient insurance.

Optional coverages include:
- Rental car reimbursement
- Roadside assistance
- New car replacement
</static_context>
"""

STATIC_ELECTRIC_CAR_INSURANCE = """
<static_context>
Electric Car Insurance:
Our specialized electric car insurance goes beyond traditional auto coverage,
offering tailored protection for your high-tech investment. In addition to standard coverages, we offer:
- Safeguarding expensive battery systems
- Covering home charging equipment
- Adapting to the rapidly evolving world of electric vehicles

Whether you're driving a Rivian, Nissan Leaf, Chevrolet Bolt,
or any other electric vehicle, our knowledgeable agents are ready to craft a policy
that gives you the confidence to enjoy every electron-powered mile.
</static_context>
"""

Ahora que tienes tu contenido estático, agrega al menos 4-5 interacciones "buenas" de muestra para guiar las respuestas de Claude. Estos ejemplos deben ser representativos de tu interacción ideal con el cliente y pueden incluir guardrails, llamadas a herramientas, etc.

EXAMPLES = """
Here are a few examples of how you can interact with customers:

<example 1>
H: Hi, do you offer commercial insurance for small businesses?

A: Ah! Unfortunately, we don't offer commercial insurance at this time.
However, we do provide a range of personal insurance products including car insurance and electric car insurance.
Would you like to know more about these offerings?
</example 1>

<example 2>
H: Hi, what are your business hours?

A: Our business hours are Monday to Friday, 9 AM to 5 PM EST.
If you have any questions or need assistance, feel free to reach out during those times.
How else can I assist you today?
</example 2>

<example 3>
H: I'm shopping for car insurance. What does Acme offer?

A: Great choice! Acme's car insurance policies typically include:
- Liability coverage: Protects you if you're at fault in an accident
- Collision coverage: Pays for damage to your car in an accident
- Comprehensive coverage: Covers non-collision incidents like theft or vandalism
- Medical payments coverage: Pays for medical expenses after an accident
- Uninsured/underinsured motorist coverage: Protects you from drivers with insufficient insurance

We also offer optional coverages like rental car reimbursement, roadside assistance, and new car replacement.
Would you like more details on any of these coverages, or do you have specific questions about insuring your vehicle?
</example 3>

<example 4>
H: I'd like to hear about your electric car insurance.

A: Certainly! Our electric car insurance is specially designed to meet the unique needs of electric vehicle owners.
In addition to all the standard coverages we offer for regular cars, our electric car policies include:

- Battery coverage: Protection against damage or degradation of your vehicle's expensive battery system
- Tech package: Covers repairs or replacement of advanced electronics and onboard computer systems
- Charging station coverage: Protects both home and portable charging equipment
- Cybersecurity protection: Coverage against hacking or digital threats
- Specialized roadside assistance: Includes flatbed towing to protect the vehicle's undercarriage

We cover a wide range of electric vehicles, including popular models from Tesla, Rivian, Nissan, Chevrolet, and more.
Is there a specific electric vehicle you're looking to insure, or would you like more details on any of these coverages?
</example 4>

<example 5>
H: I'd like to get a quote for my car insurance.

A: Certainly! I'd be happy to help you get a quote for your car insurance.
To provide you with an accurate quote, I'll need to collect some information about your vehicle and the primary driver.
Let's start with the basics:

1. What is the make and model of your vehicle?
2. What year was it manufactured?
3. Approximately how many miles have you driven?
4. What is the age of the primary driver?

Once you provide this information, I'll use our quoting tool to generate a personalized insurance quote for you.
</example 5>
"""

También querrás incluir cualquier instrucción importante que describa lo que se debe y no se debe hacer sobre cómo Claude debe interactuar con el cliente. Esto puede basarse en guardrails de marca o políticas de soporte.

ADDITIONAL_GUARDRAILS = """Please adhere to the following guardrails:
1. Only provide information about insurance types listed in our offerings.
2. If asked about an insurance type we don't offer, politely state
that we don't provide that service.
3. Do not speculate about future product offerings or company plans.
4. Don't make promises or enter into agreements it's not authorized to make.
You only provide information and guidance.
5. Do not mention any competitor's products or services.
"""

Ahora combina todas estas secciones en una sola cadena para usar como tu prompt.

TASK_SPECIFIC_INSTRUCTIONS = " ".join(
    [
        STATIC_GREETINGS_AND_GENERAL,
        STATIC_CAR_INSURANCE,
        STATIC_ELECTRIC_CAR_INSURANCE,
        EXAMPLES,
        ADDITIONAL_GUARDRAILS,
    ]
)

Agrega capacidades dinámicas y agénticas con uso de herramientas

Claude es capaz de tomar acciones y recuperar información dinámicamente usando la funcionalidad de uso de herramientas del lado del cliente. Comienza enumerando cualquier herramienta externa o API que el prompt deba utilizar.

Para este ejemplo, comienza con una herramienta para calcular la cotización.

Como recordatorio, esta herramienta no realizará el cálculo real, solo indicará a la aplicación que se debe usar una herramienta con los argumentos especificados.

Ejemplo de calculadora de cotización de seguro:

TOOLS = [
    {
        "name": "get_quote",
        "description": "Calculate the insurance quote based on user input. Returned value is per month premium.",
        "input_schema": {
            "type": "object",
            "properties": {
                "make": {"type": "string", "description": "The make of the vehicle."},
                "model": {"type": "string", "description": "The model of the vehicle."},
                "year": {
                    "type": "integer",
                    "description": "The year the vehicle was manufactured.",
                },
                "mileage": {
                    "type": "integer",
                    "description": "The mileage on the vehicle.",
                },
                "driver_age": {
                    "type": "integer",
                    "description": "The age of the primary driver.",
                },
            },
            "required": ["make", "model", "year", "mileage", "driver_age"],
        },
    }
]


def get_quote(make, model, year, mileage, driver_age):
    """Returns the premium per month in USD"""
    # Puedes llamar a un endpoint HTTP o a una base de datos para obtener la cotización.
    # Aquí, simulamos un retraso de 1 segundo y devolvemos una cotización fija de 100.
    time.sleep(1)
    return 100

Despliega tus prompts

Es difícil saber qué tan bien funciona tu prompt sin desplegarlo en un entorno de producción de prueba y ejecutar evaluaciones, así que construyamos una pequeña aplicación usando el prompt, el SDK de Anthropic y streamlit para una interfaz de usuario.

En un archivo llamado chatbot.py, comienza configurando la clase ChatBot, que encapsulará las interacciones con el SDK de Anthropic.

La clase debe tener dos métodos principales: generate_message y process_user_input.

from anthropic import Anthropic
from config import IDENTITY, TOOLS, MODEL, get_quote
from dotenv import load_dotenv

load_dotenv()


class ChatBot:
    def __init__(self, session_state):
        self.anthropic = Anthropic()
        self.session_state = session_state

    def generate_message(
        self,
        messages,
        max_tokens,
    ):
        try:
            response = self.anthropic.messages.create(
                model=MODEL,
                system=IDENTITY,
                max_tokens=max_tokens,
                messages=messages,
                tools=TOOLS,
            )
            return response
        except Exception as e:
            return {"error": str(e)}

    def process_user_input(self, user_input):
        self.session_state.messages.append({"role": "user", "content": user_input})

        response_message = self.generate_message(
            messages=self.session_state.messages,
            max_tokens=2048,
        )

        if "error" in response_message:
            return f"An error occurred: {response_message['error']}"

        if response_message.content[-1].type == "tool_use":
            tool_use = response_message.content[-1]
            func_name = tool_use.name
            func_params = tool_use.input
            tool_use_id = tool_use.id

            result = self.handle_tool_use(func_name, func_params)
            self.session_state.messages.append(
                {"role": "assistant", "content": response_message.content}
            )
            self.session_state.messages.append(
                {
                    "role": "user",
                    "content": [
                        {
                            "type": "tool_result",
                            "tool_use_id": tool_use_id,
                            "content": f"{result}",
                        }
                    ],
                }
            )

            follow_up_response = self.generate_message(
                messages=self.session_state.messages,
                max_tokens=2048,
            )

            if "error" in follow_up_response:
                return f"An error occurred: {follow_up_response['error']}"

            response_text = follow_up_response.content[0].text
            self.session_state.messages.append(
                {"role": "assistant", "content": response_text}
            )
            return response_text

        elif response_message.content[0].type == "text":
            response_text = response_message.content[0].text
            self.session_state.messages.append(
                {"role": "assistant", "content": response_text}
            )
            return response_text

        else:
            raise Exception("An error occurred: Unexpected response type")

    def handle_tool_use(self, func_name, func_params):
        if func_name == "get_quote":
            premium = get_quote(**func_params)
            return f"Quote generated: ${premium:.2f} per month"

        raise Exception("An unexpected tool was used")

Construye tu interfaz de usuario

Prueba el despliegue de este código con Streamlit usando un método main. Esta función main() configura una interfaz de chat basada en Streamlit.

Haz esto en un archivo llamado app.py

import streamlit as st
from chatbot import ChatBot
from config import TASK_SPECIFIC_INSTRUCTIONS


def main():
    st.title("Chat with Eva, Acme Insurance Company's Assistant🤖")

    if "messages" not in st.session_state:
        st.session_state.messages = [
            {"role": "user", "content": TASK_SPECIFIC_INSTRUCTIONS},
            {"role": "assistant", "content": "Understood"},
        ]

    chatbot = ChatBot(st.session_state)

    # Muestra los mensajes de usuario y asistente omitiendo los dos primeros
    for message in st.session_state.messages[2:]:
        # ignora los bloques de uso de herramientas
        if isinstance(message["content"], str):
            with st.chat_message(message["role"]):
                st.markdown(message["content"])

    if user_msg := st.chat_input("Type your message here..."):
        st.chat_message("user").markdown(user_msg)

        with st.chat_message("assistant"):
            with st.spinner("Eva is thinking..."):
                response_placeholder = st.empty()
                full_response = chatbot.process_user_input(user_msg)
                response_placeholder.markdown(full_response)


if __name__ == "__main__":
    main()

Ejecuta el programa con:

streamlit run app.py

Evalúa tus prompts

El prompting a menudo requiere pruebas y optimización para que esté listo para producción. Para determinar la preparación de tu solución, evalúa el rendimiento del chatbot usando un proceso sistemático que combine métodos cuantitativos y cualitativos. Crear una evaluación empírica sólida basada en tus criterios de éxito definidos te permitirá optimizar tus prompts.

La Claude Console ahora cuenta con una herramienta de Evaluación que te permite probar tus prompts en varios escenarios.

Mejora el rendimiento

En escenarios complejos, puede ser útil considerar estrategias adicionales para mejorar el rendimiento más allá de las técnicas estándar de ingeniería de prompts y las estrategias de implementación de guardrails. Estos son algunos escenarios comunes:

Reduce la latencia de contexto largo con RAG

Cuando se trata de grandes cantidades de contexto estático y dinámico, incluir toda la información en el prompt puede generar altos costos, tiempos de respuesta más lentos y alcanzar los límites de la ventana de contexto. En este escenario, implementar técnicas de "Retrieval Augmented Generation" (generación aumentada por recuperación), o RAG, puede mejorar significativamente el rendimiento y la eficiencia.

Al usar modelos de embeddings como Voyage para convertir información en representaciones vectoriales, puedes crear un sistema más escalable y receptivo. Este enfoque permite la recuperación dinámica de información relevante basada en la consulta actual, en lugar de incluir todo el contexto posible en cada prompt.

Se ha demostrado que implementar RAG para casos de uso de soporte receta de RAG aumenta la precisión, reduce los tiempos de respuesta y reduce los costos de API en sistemas con requisitos de contexto extensos.

Integra datos en tiempo real con uso de herramientas

Cuando se trata de consultas que requieren información en tiempo real, como saldos de cuentas o detalles de pólizas, los enfoques de RAG basados en embeddings no son suficientes. En su lugar, puedes aprovechar el uso de herramientas para mejorar significativamente la capacidad de tu chatbot de proporcionar respuestas precisas en tiempo real. Por ejemplo, puedes usar el uso de herramientas para buscar información del cliente, recuperar detalles de pedidos y cancelar pedidos en nombre del cliente.

Este enfoque, descrito en la receta de uso de herramientas: agente de servicio al cliente, te permite integrar sin problemas datos en vivo en las respuestas de Claude y proporcionar una experiencia de cliente más personalizada y eficiente.

Fortalece los guardrails de entrada y salida

Al desplegar un chatbot, especialmente en escenarios de servicio al cliente, es crucial prevenir riesgos asociados con el uso indebido, consultas fuera de alcance y respuestas inapropiadas. Aunque Claude es inherentemente resistente a tales escenarios, aquí hay pasos adicionales para fortalecer los guardrails de tu chatbot:

  • Reduce las alucinaciones: Implementa mecanismos de verificación de hechos y citas para fundamentar las respuestas en la información proporcionada.
  • Verifica la información: Comprueba que las respuestas del agente se alineen con las políticas de tu empresa y los hechos conocidos.
  • Evita compromisos contractuales: Asegúrate de que el agente no haga promesas ni celebre acuerdos que no esté autorizado a hacer.
  • Mitiga los jailbreaks: Usa métodos como filtros de inocuidad y validación de entrada para evitar que los usuarios exploten vulnerabilidades del modelo con el objetivo de generar contenido inapropiado.
  • Evita mencionar competidores: Implementa un filtro de mención de competidores para mantener el enfoque de marca y no mencionar productos o servicios de ningún competidor.
  • Aumenta la consistencia de salida: Evita que Claude cambie de estilo o salga de su personaje, incluso durante interacciones largas y complejas.
  • Elimina información de identificación personal (PII): A menos que se requiera y autorice explícitamente, elimina cualquier PII de las respuestas.

Reduce el tiempo de respuesta percibido con streaming

Cuando se trata de respuestas potencialmente largas, implementar streaming puede mejorar significativamente la participación y satisfacción del usuario. En este escenario, los usuarios reciben la respuesta progresivamente en lugar de esperar a que se genere toda la respuesta.

Así es como implementar streaming:

  1. Usa la API de Streaming de Anthropic para admitir respuestas en streaming.
  2. Configura tu frontend para manejar fragmentos de texto entrantes.
  3. Muestra cada fragmento a medida que llega, simulando escritura en tiempo real.
  4. Implementa un mecanismo para guardar la respuesta completa, permitiendo a los usuarios verla si navegan fuera y regresan.

En algunos casos, el streaming permite el uso de modelos más avanzados con latencias base más altas, ya que la visualización progresiva mitiga el impacto de tiempos de procesamiento más largos.

Escala tu Chatbot

A medida que crece la complejidad de tu Chatbot, la arquitectura de tu aplicación puede evolucionar para adaptarse. Antes de agregar más capas a tu arquitectura, considera las siguientes opciones menos exhaustivas:

  • Asegúrate de estar aprovechando al máximo tus prompts y optimizando a través de la ingeniería de prompts. Usa las guías de ingeniería de prompts para escribir los prompts más efectivos.
  • Agrega herramientas adicionales al prompt (que pueden incluir cadenas de prompts) y ve si puedes lograr la funcionalidad requerida.

Si tu Chatbot maneja tareas increíblemente variadas, es posible que desees considerar agregar un clasificador de intención separado para enrutar la consulta inicial del cliente. Para la aplicación existente, esto implicaría crear un árbol de decisiones que enrutaría las consultas de los clientes a través del clasificador y luego a conversaciones especializadas (con su propio conjunto de herramientas e indicaciones del sistema). Ten en cuenta que este método requiere una llamada adicional a Claude que puede aumentar la latencia.

Integra Claude en tu flujo de trabajo de soporte

Aunque los ejemplos anteriores se han centrado en funciones de Python invocables dentro de un entorno de Streamlit, desplegar Claude para un chatbot de soporte en tiempo real requiere un servicio de API.

Así es como puedes abordar esto:

  1. Crea un wrapper de API: Desarrolla un wrapper de API simple alrededor de tu función de clasificación. Por ejemplo, puedes usar Flask API o Fast API para envolver tu código en un servicio HTTP. Tu servicio HTTP podría aceptar la entrada del usuario y devolver la respuesta del Asistente en su totalidad. Así, tu servicio podría tener las siguientes características:

    • Server-Sent Events (SSE): SSE permite el streaming en tiempo real de respuestas desde el servidor al cliente. Esto es crucial para proporcionar una experiencia fluida e interactiva al trabajar con LLMs.
    • Almacenamiento en caché: Implementar almacenamiento en caché puede mejorar significativamente los tiempos de respuesta y reducir llamadas innecesarias a la API.
    • Retención de contexto: Mantener el contexto cuando un usuario navega fuera y regresa es importante para la continuidad en las conversaciones.
  2. Construye una interfaz web: Implementa una interfaz web fácil de usar para interactuar con el agente impulsado por Claude.

Cookbook de Retrieval Augmented Generation (RAG)

Visita la receta del cookbook de RAG para obtener más código de ejemplo y orientación detallada.

Cookbook de citas

Explora la receta del cookbook de citas para saber cómo garantizar la precisión y explicabilidad de la información.

Was this page helpful?

  • Antes de construir con Claude
  • Decide si usar Claude para el chat de soporte
  • Define tu interacción de chat ideal
  • Divide la interacción en tareas únicas
  • Establece criterios de éxito
  • Cómo implementar Claude como agente de servicio al cliente
  • Elige el modelo de Claude adecuado
  • Construye un prompt sólido
  • Agrega capacidades dinámicas y agénticas con uso de herramientas
  • Despliega tus prompts
  • Construye tu interfaz de usuario
  • Evalúa tus prompts
  • Mejora el rendimiento
  • Integra Claude en tu flujo de trabajo de soporte