La Inteligencia Artificial ya recrea la voz humana
La inteligencia artificial (IA) tiene cada vez más usos en más campos, y aunque en los últimos meses está siendo muy popular su utilización para la generación de imágenes a partir de descripciones de texto natural ahora ha llegado el momento de cambiar de la imagen al sonido, en concreto a la voz humana.
La IA de AudioLM es capaz de reproducir tono, timbre, articulación y hasta las pausas para la respiración de un hablante
Una de las últimas presentaciones de la división de investigación de Google ha sido AudioLM, una IA capaz de generar audio de alta calidad a partir de una grabación de voz humana de unos pocos segundos. Una de sus características distintivas es que no requiere de un proceso previo de entrenamiento a base de transcripciones previas, manteniendo la naturaleza sintáctica y semántica del orador sobre el que desarrolla su nuevo “discurso”.
Más allá de ser capaz de reproducir con fidelidad el tono, el timbre, la intensidad o la articulación de la voz de partida también puede añadir los sonidos del hablante al respirar y, por supuesto, formar frases con sentido. AudioLM lo consigue a partir del análisis de marcadores semánticos y acústicos, actuando los primeros como condicionantes para los terceros.
A partir de estas capacidades AudioLM también es capaz de traducir a voz textos o permitir que los sistemas informáticos o los asistentes inteligentes puedan generar voz sintética. Por el momento Google no ha abierto al público el uso de AudioLM, pero no es esta la única IA especializada en esta labor.
Uno de los casos más populares en que se ha utilizado esta tecnología ha sido la serie “Obi Wan Kenoby”, de la plataforma de streaming Disney+. En la misma la voz del personaje Darth Vader no ha estado doblada por el actor que tradicionalmente se encarga de ponerle voz en la pantalla cinematográfica, James Earl Jones sino que se ha recreado y “clonado” su voz por parte de la empresa ucraniana Respeecher.
Jones firmó un contrato por el que permitía el tratamiento del archivo de grabaciones con su voz mediante IA de manera que el estudio pudo contar con nuevas líneas de diálogo con la voz del Señor Oscuro del Sith sin que el actor, de 91 años, tuviera que pasar por el estudio de doblaje.
Precisamente otro producto de la factoría Disney, división Lucasfilm, también contó con el uso de esta tecnología para recrear la voz de Luke Skywalker en la serie “El libro de Boba Fett” de manera sintética.
Antonio Rentero
Comunicador especializado en tecnología y cine. Jurista especializado en protección de datos. Curioso especializado en prácticamente todo
Fuente:https://www.trecebits.com/