martes, mayo 7, 2024
InicioCiencia y ComputaciónLa Inteligencia Artificial de Microsoft será capaz de imitar tu voz...

La Inteligencia Artificial de Microsoft será capaz de imitar tu voz con solo 3 segundos de un audio

VALL-E es un modelo de texto a voz creado por Microsoft capaz de imitar cualquier voz con tan solo 3 segundos del audio de la persona.
La IA o Inteligencia Artificial cada vez está posibilitando nuevas soluciones en la sociedad actual con distintas alternativas.
La IA en la voz humana con VALL-E
Que la Inteligencia Artificial sea capaz de imitar la voz de cualquier persona con un audio de 3 segundos casi que da un poco de miedo. Sobre todo por el mal uso que se le puede dar con todo tipo de objetivos.
Si ya en el arte está logrando que no se sepa si una obra ha sido hecha por la mano de un artista (incluso consiguiendo que alguno que logra ilustraciones similares a las que genera la IA sea bloqueado en redes como reddit), el futuro que nos espera es totalmente incierto. Desde github se explica el funcionamiento de este modelo de voz neural al que se ha llamado VALL-E y que usa códigos discretos derivados de un modelo de códec de audio neuronal.
Se han usado 60.000 horas de datos de voz en inglés para el entrenamiento de este modelo de voz, que es casi cientos de veces mayor que los actuales sistemas existentes.
VALL-E se vale de esas capacidades del aprendizaje del contexto y así usa la voz personalizada sintetizada a alta calidad con solamente la grabación de 3 segundos de la voz de una persona.
Este modelo de voz no solamente se queda en imitar la voz, sino que también mantiene la emoción de la persona cuando habla e incluso el entorno acústico que la rodea; es decir que es casi un copia y pega de la voz de alguien.

ARTÍCULOS RELACIONADOS
- Advertisment -

MÁS POPULARES