15 meneos
212 clics
La voz generada por la IA de Google ya es indistinguible de la humana [ENG]
Un artículo de investigación publicado por Google este mes detalla un sistema de texto a voz llamado Tacotron 2, que consigue una precisión casi humana al imitar el audio de una persona que habla a partir de un texto. El sistema es la segunda generación oficial de Google de la tecnología, que consiste en dos redes neuronales profundas. La primera red traduce el texto en un espectrograma con el que se alimenta WaveNet, un sistema de DeepMind que lee la carta y genera los elementos de audio. [el artículo incluye varios ejemplos comparativos].
|
Click para ver los comentarios