YouTube ya genera subtítulos automáticos para los efectos de sonido

YouTube ya genera subtítulos automáticos para los efectos de sonido

YouTube es uno de los servicios más importantes para Google, así que no nos extraña que reciba mejoras continuamente, incluso en los detalles más pequeños. Ahora YouTube ya es capaz de generar subtítulos automáticos para los efectos de sonido de los vídeos, una muestra de que los sistemas de aprendizaje de los ordenadores pueden mejorar nuestro día a día.

En realidad, hace muchos años que YouTube soporta subtítulos, pero no todos los creadores de contenidos se toman el trabajo de añadirlos. Así posteriormente se diseñó un sistema que transcribe las conversaciones de forma automática. No es perfecto, desde luego, pero ha mejorado mucho, sobre todo con las voces en inglés.

YouTube, que últimamente realiza experimentos como su app para ver vídeos con amigos en plan "fiesta", ha decidido añadir subtítulos automáticos a los efectos de sonido. Calcula que hay 360 millones de personas sordas en el mundo, y muchas veces no son capaces de entender correctamente un vídeo solo leyendo las conversaciones, porque los sonidos no verbales también resultan importantes.

Este sistema, por ahora, funciona de forma muy sencilla. YouTube ha empezado reconociendo los 3 efectos de sonido más habituales en los vídeos, que son bastante básicos:

  1. Risas.
  2. Aplausos.
  3. Música.

Una vez creado el sistema para reconocer los sonidos y trasladarlos a texto, se seguirá trabajando para subtitular de forma automática más efectos. Por ejemplo, YouTube quiere que el programa aprenda a reconocer cuando se llama a una puerta, un perro ladra o suena un timbre. Cada una de esas opciones requerirá trabajo, por ejemplo, el timbre: resulta complicado distinguir si es el timbre de una puerta, de un teléfono que suena o incluso de un despertador.

YouTube nunca deja de realizar cambios, como su decisión de eliminar los anuncios más agresivos. Los subtítulos automáticos de efectos de sonido ya funcionan para los aplausos, risas y música, con una precisión aceptable, pero YouTube es consciente de que solo se trata del primer paso.

¿Qué opinas de esta característica de YouTube? ¿Los subtítulos automáticos de efectos de sonido te parecen importantes para las personas sordas, o crees que se les acabará sacando más partido en el futuro?

  • Ver Comentarios