Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Temario del curso
Fundamentos de la clasificación de audio
- Tipos de eventos sonoros: ambientales, mecánicos, generados por humanos.
- Resumen de casos de uso: vigilancia, monitoreo, automatización.
- Diferencias entre clasificación de audio, detección y segmentación.
Datos de audio y extracción de características
- Tipos de archivos de audio y formatos.
- Tasa de muestreo, ventanas y consideraciones sobre el tamaño de los cuadros (frames).
- Extracción de MFCC, características cromáticas y mel-spectrogramas.
Preparación de datos y anotación
- Conjuntos de datos UrbanSound8K, ESC-50 y personalizados.
- Anotación de eventos sonoros y límites temporales.
- Equilibrio de conjuntos de datos y aumento (augmenting) de audio.
Construcción de modelos de clasificación de audio
- Uso de redes neuronales convolucionales (CNN) para audio.
- Entrada del modelo: onda de sonido en bruto frente a características extraídas.
- Funciones de pérdida, métricas de evaluación y prevención del sobreajuste.
Detección de eventos y localización temporal
- Estrategias de detección basadas en cuadros (frames) y segmentos.
- Postprocesamiento de detecciones mediante umbrales y suavizado.
- Visualización de predicciones sobre líneas de tiempo de audio.
Tópicos avanzados y procesamiento en tiempo real
- Aprendizaje por transferencia para escenarios con pocos datos.
- Implementación en producción de modelos con TensorFlow Lite o ONNX.
- Procesamiento de audio en streaming y consideraciones sobre la latencia.
Desarrollo del proyecto y casos de uso
- Diseño de un pipeline completo: desde la ingestión hasta la clasificación.
- Desarrollo de un prototipo para vigilancia, control de calidad o monitoreo.
- Registro (logging), alertas e integración con paneles de control (dashboards) o API.
Resumen y próximos pasos
Requerimientos
- Comprensión de los conceptos fundamentales de aprendizaje automático y entrenamiento de modelos.
- Experiencia con la programación en Python y el preprocesamiento de datos.
- Conocimiento de los fundamentos del audio digital.
Público objetivo
- Científicos de datos.
- Ingenieros de aprendizaje automático.
- Investigadores y desarrolladores en procesamiento de señales de audio.
21 Horas