Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Temario del curso
Fundamentos de la depuración y evaluación de Mastra
- Comprensión de los modelos de comportamiento de los agentes y sus modos de fallo
- Principios centrales de depuración dentro de Mastra
- Evaluación de acciones deterministas y no deterministas del agente
Configuración de entornos para la prueba de agentes
- Configuración de entornos aislados (sandboxes) y espacios de evaluación independientes
- Captura de registros, trazas y telemetría para un análisis detallado
- Preparación de conjuntos de datos y solicitudes (prompts) para pruebas estructuradas
Depuración del comportamiento de los agentes de IA
- Trazado de las rutas de decisión y señales de razonamiento interno
- Identificación de alucinaciones, errores y comportamientos no deseados
- Uso de paneles de observabilidad para la investigación de la causa raíz
Métricas de evaluación y marcos de puntos de referencia (benchmarking)
- Definición de métricas cuantitativas y cualitativas de evaluación
- Medición de la precisión, coherencia y cumplimiento contextual
- Aplicación de conjuntos de datos de referencia para evaluaciones repetibles
Ingeniería de confiabilidad para agentes de IA
- Diseño de pruebas de confiabilidad para agentes que operan durante períodos prolongados
- Detección de deriva y degradación en el rendimiento del agente
- Implementación de salvaguardas para flujos de trabajo críticos
Procesos y automatización de la garantía de calidad
- Construcción de tuberías (pipelines) de QA para evaluación continua
- Automatización de pruebas de regresión para actualizaciones del agente
- Integración de la garantía de calidad con CI/CD y flujos de trabajo empresariales
Técnicas avanzadas para la reducción de alucinaciones
- Estrategias de solicitud (prompting) para reducir salidas no deseadas
- Bucles de validación y mecanismos de autoverificación
- Experimentación con combinaciones de modelos para mejorar la confiabilidad
Informes, monitoreo y mejora continua
- Desarrollo de informes de QA y cuadros de puntuación (scorecards) de los agentes
- Monitoreo del comportamiento a largo plazo y de los patrones de error
- Iteración sobre los marcos de evaluación para sistemas en evolución
Resumen y próximos pasos
Requerimientos
- Comprensión del comportamiento de los agentes de IA y las interacciones con los modelos
- Experiencia en la depuración o prueba de sistemas de software complejos
- Familiaridad con herramientas de observabilidad o registro de eventos (logging)
Público objetivo
- Ingenieros de garantía de calidad (QA)
- Ingenieros de confiabilidad de IA
- Desarrolladores responsables de la calidad y el rendimiento de los agentes
21 Horas