El término técnico de esta tarea es Diarización. La diarización de hablantes combina la segmentación de hablante con el agrupamiento de hablantes. El primer objetivo es encontrar el tiempo en que cambian los hablantes en un “stream” de audio. El otro objetivo es agrupar los segmentos de habla. Las aplicaciones incluyen indizado de hablantes, responder ¿Qué dijo quién?, diarización de juntas, clases, videos de youtube.
Tipo de Proyecto:
Investigación
Palabras Clave:
Tecnologías del habla, Redes Neuronales Convolucionales
Colaboración
Tec de Monterrey y John Hopkings University