El secreto detrás del asistente virtual de Facebook

Alexa de Amazon puede contratar un viaje en Uber. Siri puede controlar un termostato conectado a Internet. Cada uno sirve a millones de usuarios cada día. Pero un grupo afortunado de alrededor de 10.000 personas, sobre todo en California, sabe que M, el asistente de Facebook, es el más inteligente del grupo.

¿Recomendar y reservar un hotel romántico en Marruecos que también es adecuado para niños pequeños? No hay problema. ¿Obtener cotizaciones de los contratistas locales para el paisajismo de su patio delantero? Considérelo hecho. El asistente experimental de Facebook, ofrecido dentro de la aplicación Messenger, muestra el valor de tener un verdadero mayordomo digital en su bolsillo. En lugar de recuperar información simple de bases de datos, M puede entender órdenes complejas y tomar acciones como reservar entradas para el teatro o contactar a las compañías para obtener información.

M es tan inteligente porque engaña. Funciona como Siri cuando se le da un mensaje a M: los algoritmos tratan de averiguar lo que quiere. Cuando no pueden, sin embargo, M no vuelve a buscar en la Web o decir “lo siento, no entiendo la pregunta”. En su lugar, un ser humano toma el control invisible, respondiendo a su petición como si los algoritmos estuvieran al mando. (Facebook se negó a decir cuántos trabajadores tiene disponibles para las pruebas de M).

Sin embargo, el diseño es demasiado caro para escalar a los 1.200 millones de personas que usan Facebook Messenger, por lo que Facebook ofrece M a unos pocos miles de usuarios desde 2015 como una especie de proyecto semi-público de I+D. Trabajadores humanos y algoritmos entrelazados tienen la intención de revelar cómo las personas reaccionarían ante un asistente virtual omnisciente y de proporcionar datos que permitirían a los algoritmos aprender a asumir el trabajo de sus “entrenadores” humanos.

En dos años por ese camino, el proyecto de investigación de Facebook puede llamarse exitoso. Los usuarios de M y la teoría de que el software puede aprender a hacerse cargo de algún trabajo de los entrenadores humanos se ha confirmado. Sin embargo, M aún está lejos del punto en que podría ofrecerse al otro 99,9% de los usuarios de Messenger, y el progreso ha sido más difícil de lo esperado.

Complejidades

El software de hoy es pobre en entender el lenguaje y el mundo, así que los asistentes virtuales, tales como Siri o Alexa, se deben programar explícitamente para manejar cualquier tarea dada. Es por eso que los bots en el mercado tienen repertorios restringidos. Y probablemente explica por qué las sugerencias del año pasado de que los chatbots estuvieran configurados para transformar la forma en que usamos las computadoras como lo hicieron las aplicaciones móviles, alimentadas por Microsoft, Facebook y algunos inversores tecnológicos, no parecen haber crecido mucho.

M fue inicialmente ofrecido sólo a los empleados de Facebook, y luego a algunos usuarios de Messenger en California. Y no tomó mucho tiempo demostrar que los algoritmos realmente podrían aprender a hacer algo del trabajo que están haciendo los seres humanos que impulsan al ayudante virtual.

El grupo de investigación de inteligencia artificial de Facebook utilizó M para probar un nuevo tipo de software de aprendizaje denominado red de memoria, que había mostrado aptitud en responder a preguntas sobre historias simples. El software utiliza un tipo de memoria de trabajo para tomar la información importante para su uso posterior, un diseño que Google también prueba para mejorar las habilidades de razonamiento del software.

Por ejemplo, si alguien le pide a M que entregue las flores, usando automáticamente información clave de la solicitud, como presupuesto o dirección, genera sugerencias de floristas en línea. El entrenador humano entonces elige qué ofrecer al usuario.

Los entrenadores humanos hacen su mejor esfuerzo cuando reciben preguntas difíciles, pero a veces se niegan a ayudar en conjunto. Incluso si M fuera a rechazar automáticamente la más compleja de las consultas de los usuarios, la gran variedad de sus solicitudes hace que alcanzar la meta de que los algoritmos tomen el control sea difícil. Una técnica llamada aprendizaje profundo ha hecho recientemente que el aprendizaje de máquina sea más potente (las redes de memoria son un ejemplo). Pero aprender a manejar una amplia variedad de escenarios complejos, con pocos datos sobre cada uno, porque no surgen a menudo, no es el tipo de problema que donde sobresale el aprendizaje profundo sobresale. Para funcionar correctamente, este tipo de sistemas requiere de muchos datos para aprender tareas complejas.

A largo plazo

Un progreso más lento de lo esperado ha llevado a Facebook a reimaginar su proyecto. La semana pasada apareció una función llamada M Suggestions en Messenger, similar a los tipos de bots limitados que M pretende desplazar.

Por lo pronto, el original M, humano dependiente, solo ayuda a sus pocos afortunados usuarios. Facebook dice que está comprometido con el proyecto, y el momento actual en inteligencia artificial es bueno para las apuestas a largo plazo. En los últimos años, el aprendizaje profundo ha alterado las técnicas y expectativas establecidas para el software procese el lenguaje. De hecho, la traducción de Google es cada vez más exacta.

Eso no significa que es una conclusión inevitable que el software puede aprender a jugar al mayordomo con solo observar a los humanos Sin embargo, los investigadores de Facebook dicen que tienen muchas ideas para explorar.

Una es conseguir que el lado automatizado de M aprenda de la retroalimentación positiva o negativa en los mensajes que envían los usuarios, utilizando una técnica inspirada en el proceso de entrenar a los animales con recompensas. M podría avanzar más rápido si no dependiera únicamente de lo que sus contratistas humanos hacen. Para generar ideas en la comunidad de investigación más amplia, el equipo de Facebook ha lanzado herramientas para ayudar a otros a probar y comparar bots asistenciales sin guión. Y nuevas técnicas prometedoras ahora también pueden ser probadas a mayor escala, en M Suggestions.

 

El presente artículo es una adaptación y traducción de un original publicado en Technology Review del MIT.