Pasar al contenido principal
Tecnológico de Monterrey Tecnológico de Monterrey
  • Inicio
  • Oferta Educativa
    • Programas Académicos
    • Educación Contínua
  • Investigación y Desarrollo
  • Socios
  • Afiliados
  • Noticias y Eventos
    • Eventos
    • Noticias
  • Nosotros
  • Contacto
Indexado de Hablantes en audio de Videos

Indexado de Hablantes en audio de Videos

2022-11-30
Juan A. Nolazco Flores
Trabajo decente y crecimiento económico
Industria, innovación e infraestructura
Investigación y Desarrollo

El término técnico de esta tarea es Diarización. La diarización de hablantes combina la segmentación de hablante con el agrupamiento de hablantes. El primer objetivo es encontrar el tiempo en que cambian los hablantes en un “stream” de audio. El otro objetivo es agrupar los segmentos de habla. Las aplicaciones incluyen indizado de hablantes, responder ¿Qué dijo quién?, diarización de juntas, clases, videos de youtube.

 

Tipo de Proyecto:
Investigación

Palabras Clave:
Tecnologías del habla, Redes Neuronales Convolucionales

Colaboración
Tec de Monterrey y John Hopkings University

Logo Footer Logo Footer
  • Inicio
  • Oferta Educativa
    • Programas Académicos
    • Educación Contínua
  • Investigación y Desarrollo
  • Socios
  • Afiliados
  • Noticias y Eventos
    • Eventos
    • Noticias
  • Nosotros
  • Contacto

Av. Eugenio Garza Sada 2501 Sur Col. Tecnológico C.P. 64849 | Monterrey, Nuevo León, México | Tel. +52 (81) 8358-2000 D.R.© Instituto Tecnológico y de Estudios Superiores de Monterrey, México.

Aviso legal | Políticas de privacidad | Aviso de privacidad

© 2022 Data Science Hub