Contacta con nosotros

Temario del curso

Introducción a la síntesis de voz y la clonación de voz

  • Descripción general de la síntesis de texto a habla (TTS) y la síntesis de voz neuronal
  • Clonación de voz frente a generación de habla: casos de uso y límites
  • Modelos clave: Tacotron, WaveNet, FastSpeech, VITS

Trabajo con plataformas comerciales

  • Uso de ElevenLabs y Resemble AI
  • Creación, clonación y edición de voces
  • Acceso a APIs y flujos de trabajo de texto a habla

Desarrollo con herramientas de código abierto

s
  • Instalación y configuración de Coqui TTS
  • Entrenamiento de voces personalizadas y gestión de conjuntos de datos
  • Generación de habla con control fino (tono, velocidad, emoción)

Preparación de datos y gestión de conjuntos de datos de voz

  • Recopilación y limpieza de muestras de voz
  • Segmentación, etiquetado y alineación de transcripciones
  • Fuentes éticas y consentimiento para el uso de voz

Integración de aplicaciones

s
  • Incorporación de TTS en sitios web y aplicaciones
  • Creación de sistemas IVR y bots interactivos
  • Generación de diálogos sintéticos para videos y juegos

Evaluación de calidad y realismo

s
  • Puntaje medio de opinión (MOS) y pruebas de inteligibilidad
  • Control de la expresividad y la prosodia
  • Comparación de latencia, fidelidad y realismo

Consideraciones éticas, legales y de gobernanza

s
  • Riesgos de deepfakes y uso responsable
  • Consentimiento, atribución e implicaciones sobre derechos de autor
  • Regulaciones y políticas organizacionales

Resumen y próximos pasos

Requerimientos

  • Conocimiento de los fundamentos del aprendizaje automático
  • Familiaridad con formatos de archivos de audio y herramientas de edición
  • Habilidades básicas de programación en Python

Público objetivo

  • Desarrolladores e ingenieros de IA interesados en la síntesis de voz
  • Creadores de contenido y tecnólogos de medios que exploran la generación de voz
  • Equipos de I+D que construyen sistemas de audio personalizados o dinámicos
 14 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas