Radio + Inteligencia Artificial: Victoria, la voz del fútbol

Los podcast son la punta del iceberg de la revolución sonora que se está dando en la Web. La interacción con la información ya no sólo será táctil y visual (móviles y PC´s), sino que crecerán los formatos conversacionales y el sonido como gran emergente.

Esta nueva era impone grandes desafíos y oportunidades para el periodismo, sintetizadores, nuevas tecnologías y la creciente experimentación con Inteligencia Artificial nos obliga a pensar la perspectiva editorial de estos productos digitales.

Se destaca como ejemplo en este nuevo ecosistema el desarrollo de Cadena Ser (España), bautizado como “Victoria: la voz del fútbol”, una voz sintética creada a partir de inteligencia artificial que será parte de los programas de la radio. En este video, podés ver la presentación al aire que han hecho.

La iniciativa, producto de la colaboración entre PRISA Media y Amazon, permite además incorporar la información de los equipos españoles de fútbol en dispositivos Alexa, escuchar en directo los partidos de liga de cualquier club de Primera o Segunda División narrados por Carrusel Deportivo y también la información de última hora, al minuto, con As.

Ver más: Lanzan herramienta para monitorear las emociones de los clientes en tiempo real

En la propia web del nuevo producto, dan algunos detalles sobre el proceso de producción que vale la pena conocer ya que pueden aportar información importante para futuros desarrollos similares.

Definición del perfil

  • 1 — Caso de uso y personalidad sonora ¿Cómo debe ser nuestra voz? ¿Qué características debe tener nuestra locutora? ¿Qué nombre tendrá? Con los equipos de Carrusel Deportivo y As comenzamos a dibujar el perfil que debería encarnar nuestra voz sintética.
  • Selección de frases y grabación
  • 2 — Elaboración de frases y grabación de muestras: Partiendo de la experiencia sonora que habíamos diseñado y de la personalidad definida, Monoceros Labs preparó la selección de frases a grabar. Aunque se trata de la creación de una voz original, los modelos de inteligencia artificial utilizan grabaciones de voces existentes, un conjunto de datos que se utiliza para “entrenar” el modelo que dará forma a la nueva voz.

Entrenamiento neuronal

  • 3 — Preparación de datos y entrenamiento: Tras revisar los textos y audios grabados, Monoceros delimitó una nueva selección para ingestarla en los modelos de redes neuronales para su entrenamiento. Al tiempo, se trabajaba en un diccionario específico para términos relacionados con el fútbol. Un proceso iterativo y delicado que resultó en un conjunto amplio de muestras de voces con distintas características.

Validación

  • 4 — Selección de muestras y validación: Fuimos perfeccionando el modelo progresivamente, y validando muestras hasta obtener una voz que encajaba con la definición de personalidad de Victoria.

Integración

  • 5 — Integración y subida a producción Victoria ya es una realidad: una voz única, original y creada específicamente para este proyecto. Solo quedaba integrarla en la experiencia en Amazon Alexa y ver cómo respondía en la vida real. Voilá: Bienvenida, Victoria.