Contacta con nosotros

Temario del curso

Fundamentos de la depuración y evaluación de Mastra

  • Comprensión de los modelos de comportamiento de los agentes y sus modos de fallo
  • Principios centrales de depuración dentro de Mastra
  • Evaluación de acciones deterministas y no deterministas del agente

Configuración de entornos para la prueba de agentes

  • Configuración de entornos aislados (sandboxes) y espacios de evaluación independientes
  • Captura de registros, trazas y telemetría para un análisis detallado
  • Preparación de conjuntos de datos y solicitudes (prompts) para pruebas estructuradas

Depuración del comportamiento de los agentes de IA

  • Trazado de las rutas de decisión y señales de razonamiento interno
  • Identificación de alucinaciones, errores y comportamientos no deseados
  • Uso de paneles de observabilidad para la investigación de la causa raíz

Métricas de evaluación y marcos de puntos de referencia (benchmarking)

  • Definición de métricas cuantitativas y cualitativas de evaluación
  • Medición de la precisión, coherencia y cumplimiento contextual
  • Aplicación de conjuntos de datos de referencia para evaluaciones repetibles

Ingeniería de confiabilidad para agentes de IA

  • Diseño de pruebas de confiabilidad para agentes que operan durante períodos prolongados
  • Detección de deriva y degradación en el rendimiento del agente
  • Implementación de salvaguardas para flujos de trabajo críticos

Procesos y automatización de la garantía de calidad

  • Construcción de tuberías (pipelines) de QA para evaluación continua
  • Automatización de pruebas de regresión para actualizaciones del agente
  • Integración de la garantía de calidad con CI/CD y flujos de trabajo empresariales

Técnicas avanzadas para la reducción de alucinaciones

  • Estrategias de solicitud (prompting) para reducir salidas no deseadas
  • Bucles de validación y mecanismos de autoverificación
  • Experimentación con combinaciones de modelos para mejorar la confiabilidad

Informes, monitoreo y mejora continua

  • Desarrollo de informes de QA y cuadros de puntuación (scorecards) de los agentes
  • Monitoreo del comportamiento a largo plazo y de los patrones de error
  • Iteración sobre los marcos de evaluación para sistemas en evolución

Resumen y próximos pasos

Requerimientos

  • Comprensión del comportamiento de los agentes de IA y las interacciones con los modelos
  • Experiencia en la depuración o prueba de sistemas de software complejos
  • Familiaridad con herramientas de observabilidad o registro de eventos (logging)

Público objetivo

  • Ingenieros de garantía de calidad (QA)
  • Ingenieros de confiabilidad de IA
  • Desarrolladores responsables de la calidad y el rendimiento de los agentes
 21 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas