Bill Gates: La inteligencia artificial me tiene ”bastante impresionado”
A través de su cuenta de Reddit, el exdirector de Microsoft, respondió que no le llama tanto la atención el Metaverso o la realidad aumentada, sino que bajo su punto de vista el avance más importante que está realizando el mundo tecnológico es la inteligencia artificial (A.I).
“La IA es la más grande”, dijo y agregó: “No creo que Web3 fuera tan grande o que las funciones del metaverso por sí solas sean revolucionarias, pero la IA es bastante revolucionaria”. En ese sentido, Gates señaló que está “bastante impresionado con el ritmo de mejora” de las IA generativas. “Tendrán un impacto enorme”, remarcó.
Por otro lado, dio las predicciones económicas para el 2023 desde su blog: Gates Notes: “Se avecinan cinco años complicados porque tenemos las deudas de la pandemia y el ciclo económico está cambiando”, escribió en su sitio web y añadió: “Vamos a tener unas elecciones difíciles y una guerra civil. No tengo experiencia en esos temas, no voy a desviar mi dinero en eso porque no sabría cómo gestionarlo. La polarización política puede acabar con todo”.
Microsoft presenta VALL-E
Microsoft ha presentado para ello su nuevo modelo de lenguaje: VALL-E.
Este modelo es de naturaleza TTS, es decir, síntesis de voz a texto. En esencia, es capaz de imitar cualquier voz humana prácticamente a la perfección con escasos segundos de exposición a la voz original. Es decir, que sobre el papel y según Microsoft, VALL-E puede imitar estas voces escuchando tan solo 3 segundos de la voz a imitar.
Ver más: Microsoft quiere destronar a Google con esta herramienta
La compañía tecnológica estadounidense está apostando por la implementación de las IA en sus productos y servicios. En este sentido, está trabajando en proyectos para agregar el chat desarrollado por OpenAI ChatGPT en sus buscadores y en la suite de Office.
Tal y como explica Microsoft en documento compartido en GitHub, VALL-E puede sintetizar voces personalizadas de “alta calidad” con una grabación registrada de tres segundos de un hablante. Sus desarrolladores también señalan que las muestras tomadas sugieren que VALL-E podría “preservar la emoción del hablante y el entorno acústico del mensaje”.
Por otro lado, en las etapas previas de entrenamiento, los responsables de VALL-E escalaron los datos de entrenamiento de síntesis de voz a texto a 60.000 horas de habla en inglés, superando en palabras de Microsoft a los otros sistemas TTS zero-shot ya existentes en el mercado.
Microsoft deja claro en su web que VALL-E no solo se constituye por sí solo como un modelo de síntesis de voz a texto, sino que engloba aplicaciones de síntesis de voz que se pueden combinar con otros modelos ya conocidos en el mercado, como el ya famoso GPT-3.