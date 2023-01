Así funciona VALL-E, la nueva IA que ‘clona’ cualquier voz

Al parecer el futuro nos alcanzó y es que el gigante de la tecnología Microsoft ha anunciado el lanzamiento de una nueva herramienta de inteligencia artificial llamada VALL-E.

Esta Inteligencia Artificial (IA) es tan avanzada que con solo escuchar tres segundos de audio, puede literalmente “clonar” una voz. Pero, ¿qué lo hace diferente de los generadores de voz (TTS) anteriores?, la respuesta es sencilla, VALL-E suena naturalmente humano.

Este nuevo modelo de lenguaje para la síntesis de texto a voz es capaz de replicar la voz de cualquier hablante basado en EnCodec, el códec de audio de Meta, la IA analiza la voz de una persona e interpreta cómo sonaría esa voz con diferentes frases.

Además, cuida la entonación y la emoción del hablante, según lo confirmado por la compañía fundada por Bill Gates.

VALL-E ya tiene voces precargadas

Microsoft entrenó las funcionalidades de síntesis de voz de VALL-E.

Y esto no es todo ya que Microsoft entrenó las funcionalidades de síntesis de voz de VALL-E utilizando la biblioteca de audio LibriLight de Meta. Incluye 60.000 horas de habla en inglés de más de 7.000 hablantes, provenientes principalmente de audiolibros de dominio público de LibriVox.

De modo que ya que ha aprendido una voz específica, VALL-E puede sintetizar el audio de esa persona y decir cualquier cosa intentando retener el tono emocional del hablante.

Cuando se combina con otros modelos IA como GPT-3, sus creadores creen que se puede usar para aplicaciones de texto a voz de alta calidad, edición de voz en la que se puede editar y modificar una grabación de una persona a partir de una transcripción de texto y creación de contenido de audio.

Aunque todo lo anunciado por Microsoft irremediablemente hace temer en las posibles consecuencias negativas de su uso: la tecnología también podría usarse para engañar a otro ser humano haciendo una llamada de socorro o accediendo a información confidencial que está bloqueada detrás de contraseñas habilitadas para voz.

Pero por el momento, no deberíamos preocuparnos ya que VALL-E no está disponible para el público, al menos no por ahora.

