• Mensajes
  • Agentes gestionados
  • Administración

Search...
⌘K
Casos de uso
Descripción generalEnrutamiento de ticketsAgente de atención al clienteModeración de contenidoResumen legal
Ingeniería de prompts
Descripción generalMejores prácticas de promptsPrompts para Claude Fable 5Prompts para Claude Opus 4.8Herramientas de prompts de la Consola
Probar y evaluar
Definir el éxito y crear evaluacionesUso de la herramienta de evaluación en la ConsolaReducir la latencia
Reforzar las barreras de protección
Reducir alucinacionesAumentar la consistencia de salidaMitigar jailbreaksReducir la filtración de prompts
Referencia
Glosario

Log in
Uso de la herramienta de evaluación en la Consola
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Solutions

  • AI agents
  • Code modernization
  • Coding
  • Customer support
  • Education
  • Financial services
  • Government
  • Life sciences

Partners

  • Claude on AWS
  • Google Cloud's Vertex AI

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Company

  • Anthropic
  • Careers
  • Economic Futures
  • Research
  • News
  • Responsible Scaling Policy
  • Security and compliance
  • Transparency

Learn

  • Blog
  • Courses
  • Use cases
  • Connectors
  • Customer stories
  • Engineering at Anthropic
  • Events
  • Powered by Claude
  • Service partners
  • Startups program

Help and security

  • Availability
  • Status
  • Support
  • Discord

Terms and policies

  • Privacy policy
  • Responsible disclosure policy
  • Terms of service: Commercial
  • Terms of service: Consumer
  • Usage policy
Mejores prácticas/Probar y evaluar

Uso de la herramienta de evaluación

La Claude Console incluye una herramienta de evaluación que te permite probar tus prompts en diversos escenarios.

Acceder a la función de evaluación

Para comenzar a usar la herramienta de evaluación:

  1. Abre la Claude Console y navega al editor de prompts.
  2. Después de redactar tu prompt, busca la pestaña 'Evaluate' en la parte superior de la pantalla.

Acceder a la función de evaluación



Asegúrate de que tu prompt incluya al menos 1 o 2 variables dinámicas usando la sintaxis de llaves dobles: {{variable}}. Esto es necesario para crear conjuntos de pruebas de evaluación.

Generar prompts

La Consola ofrece un generador de prompts integrado, impulsado por Claude Sonnet 4.5:

  1. 1

    Haz clic en 'Generate Prompt'

    Al hacer clic en la herramienta auxiliar 'Generate Prompt' se abrirá una ventana modal que te permite ingresar la información de tu tarea.

  2. 2

    Describe tu tarea

    Describe la tarea que deseas (por ejemplo, "Clasificar solicitudes entrantes de soporte al cliente") con tanto o tan poco detalle como quieras. Cuanto más contexto incluyas, más podrá Claude adaptar el prompt generado a tus necesidades específicas.

  3. 3

    Genera tu prompt

    Al hacer clic en el botón naranja 'Generate Prompt' en la parte inferior, Claude generará un prompt de alta calidad para ti. Luego puedes mejorar aún más esos prompts usando la pantalla de evaluación en la Consola.

Esta función facilita la creación de prompts con la sintaxis de variables adecuada para la evaluación.

Generador de prompts

Crear casos de prueba

Cuando accedes a la pantalla de evaluación, tienes varias opciones para crear casos de prueba:

  1. Haz clic en el botón '+ Add Row' en la parte inferior izquierda para agregar un caso manualmente.
  2. Usa la función 'Generate Test Case' para que Claude genere automáticamente casos de prueba por ti.
  3. Importa casos de prueba desde un archivo CSV.

Para usar la función 'Generate Test Case':

  1. 1

    Haz clic en 'Generate Test Case'

    Claude generará casos de prueba por ti, una fila a la vez cada vez que hagas clic en el botón.

  2. 2

    Edita la lógica de generación (opcional)

    También puedes editar la lógica de generación de casos de prueba haciendo clic en la flecha desplegable a la derecha del botón 'Generate Test Case', y luego en 'Show generation logic' en la parte superior de la ventana de Variables que aparece. Es posible que tengas que hacer clic en `Generate' en la parte superior derecha de esta ventana para completar la lógica de generación inicial.

    Editar esto te permite personalizar y ajustar los casos de prueba que Claude genera con mayor precisión y especificidad.

Aquí tienes un ejemplo de una pantalla de evaluación completada con varios casos de prueba:

Pantalla de evaluación completada



Si actualizas el texto de tu prompt original, puedes volver a ejecutar todo el conjunto de evaluación con el nuevo prompt para ver cómo los cambios afectan el rendimiento en todos los casos de prueba.

Consejos para una evaluación efectiva



Usa la herramienta auxiliar 'Generate a prompt' en la Consola para crear rápidamente prompts con la sintaxis de variables adecuada para la evaluación.

Comprender y comparar resultados

La herramienta de evaluación ofrece varias funciones para ayudarte a refinar tus prompts:

  1. Comparación lado a lado: Compara las salidas de dos o más prompts para ver rápidamente el impacto de tus cambios.
  2. Calificación de calidad: Califica la calidad de las respuestas en una escala de 5 puntos para hacer seguimiento de las mejoras en la calidad de las respuestas por prompt.
  3. Versionado de prompts: Crea nuevas versiones de tu prompt y vuelve a ejecutar el conjunto de pruebas para iterar rápidamente y mejorar los resultados.

Al revisar los resultados en todos los casos de prueba y comparar diferentes versiones del prompt, puedes detectar patrones y hacer ajustes informados a tu prompt de manera más eficiente.

¡Comienza a evaluar tus prompts hoy mismo para crear aplicaciones de IA más robustas con Claude!

Was this page helpful?

  • Acceder a la función de evaluación
  • Generar prompts
  • Crear casos de prueba
  • Consejos para una evaluación efectiva
  • Comprender y comparar resultados