Eno, el increíble asistente virtual de Capital One

Por Margaret Mayer, VP, Software Engineering

Por eso, al crear Eno, el asistente inteligente de Capital One, decidimos desarrollar nuestra propia tecnología de procesamiento de lenguaje natural (PNL). Era importante poder construir Eno en una plataforma que comprenda profundamente los términos de los servicios financieros, lo que nos permite ofrecer la mejor experiencia posible a nuestros usuarios. Capital One se compromete a brindar una experiencia centrada en el ser humano cada vez que interactuamos con un cliente, por lo que la única forma de garantizarlo fue crear nuestro propio sistema de PNL para Eno. Gracias a los avances en las redes neuronales convolucionales (CNN) y las redes de memoria a largo plazo (LSTM), nuestro equipo pudo construir la PNL de Eno desde el concepto hasta el lanzamiento en menos de tres meses.

Eno usa un procesador de lenguaje natural para comprender las diferentes formas en que los clientes envían mensajes de texto sobre su dinero. ¿Quieres consultar tu saldo? Puede enviar un mensaje de texto “¿cuál es mi saldo” o “qué cantidad debo” o incluso simplemente enviar un emoji de bolsa de dinero? Eno entiende más de 2,200 términos y emojis que la gente usa para preguntar sobre los saldos de sus cuentas. Ya que Eno pretende tratar las interacciones con los clientes como conversaciones, no comandos, no necesita responder “sí” o “no” a las preguntas de Eno, tampoco. Puede decir “sí”, “yah”, “nah”, “ok”, enviar un pulgar hacia arriba o pulgar hacia abajo emoji, o escribir algo así como “um, espera, en realidad no”. Comete un error de ortografía y escribe “yed” en lugar de “sí”? Está bien, Eno sabe que tus pulgares son falibles.

Enviar mensajes de texto con Eno es simple, pero, por supuesto, las tecnologías más fáciles de usar son las más difíciles de construir. La creación de la sofisticada arquitectura de la PNL para garantizar que Eno pudiera entender los matices en la comunicación humana requirió una gran cantidad de trabajo duro, creatividad y colaboración. Construimos Eno usando conversaciones reales de clientes a partir de registros de chat. Nuestros líderes de algoritmos y plataformas trabajaron en estrecha colaboración con los equipos de atención al cliente para analizar cientos de miles de chats web entre representantes de servicio al cliente y clientes reales. Nuestros ingenieros de aprendizaje automático capacitaron a Eno en estas conversaciones, creando un modelo de lenguaje rico y en capas.

La creación de la sofisticada arquitectura de la PNL para garantizar que Eno pudiera entender los matices en la comunicación humana requirió una gran cantidad de trabajo duro, creatividad y colaboración.

Desde una perspectiva técnica, nuestros ingenieros utilizaron un proceso de capacitación de tres pasos para crear Eno. Primero, utilizaron una técnica de aprendizaje automático sin supervisión para entrenar previamente a Eno para comprender el significado y las similitudes de las palabras utilizando los datos de registro de chat existentes. En segundo lugar, utilizaron un modelo de aprendizaje automático supervisado para capacitar a Eno para comprender decenas de miles de declaraciones que los clientes habían hecho en el pasado, como “activar”, “activar tarjeta” o “hacer que mi tarjeta funcione, usando solo los datos etiquetados. Tercero, el aprendizaje supervisado adicional se aplica a las nuevas expresiones para que Eno pueda entender los términos que los clientes nunca antes habían usado.

Eno no solo aprendió a reconocer docenas de sinónimos, como tarjeta, tarjeta de crédito y cuenta, o pago, factura y saldo, sino también a reconocer faltas de ortografía y abreviaturas, como pymt, acct #, blnc, etc. Por supuesto, tuvimos que asegurarnos de que Eno entendiera cientos de emojis porque esa es la forma en que las personas envían mensajes de texto hoy. La mitad de las personas que usan Eno para pagar sus facturas responden con un emoji de aprobación para confirmar.

A menudo envían preguntas personales a Eno o preguntan sobre el significado de la vida. Algunos incluso han enviado propuestas de matrimonio a Eno. Si un cliente le pregunta a Eno si es un niño o una niña, Eno responde: “Soy binario. No quiero decir que soy ambas cosas, en realidad soy solo unos y ceros “. Eno hace bromas y responde preguntas con mensajes reales de tipo humano. De hecho, el 14% de los mensajes de texto de los clientes a Eno no tienen ninguna relación con la banca, como pedirle a Eno que tome en cuenta el significado de la vida.

Por supuesto, dado que Eno utiliza el aprendizaje automático, siempre mejora y se vuelve más inteligente con el tiempo. Cada interacción con el cliente se agrega a la base de datos de idiomas de Eno y estamos continuamente aprendiendo cosas nuevas sobre cómo interactúan los clientes con Eno. Por ejemplo, encontramos que algunas personas no respondieron de inmediato cuando Eno les hizo una pregunta. Tal vez se distrajeron con un bebé que lloraba o una llamada telefónica, así que construimos un contexto de conversación en Eno donde las interacciones pueden continuar donde se quedaron durante una ventana de varias horas.

La gente no habla como lo hacen las máquinas. El lenguaje humano es increíblemente rico, complejo y variado. Es probable que las computadoras nunca reemplacen la forma matizada en que los humanos reales se hablan entre sí, pero nuestros algoritmos de aprendizaje profundo nos han ayudado a hacer grandes avances en la reducción de la división hombre-máquina. Con Eno, hemos trabajado arduamente para crear un bot de chat que va más allá de la realización de operaciones bancarias simples.

Enviar mensajes de texto con Eno es como enviar mensajes de texto con un amigo. Los clientes pueden comunicarse de manera natural y conversacional, y no tienen que adaptarse a la forma en que una máquina habla en código binario.

Habiendo liderado el equipo que ayudó a crear la tecnología detrás de Eno, estoy muy consciente de la capacitación que se necesita para crear un asistente inteligente. Es un sistema de software increíblemente complejo creado por ingenieros talentosos que utilizan los últimos métodos de aprendizaje automático. Pero el sistema de PNL de Eno tiene un sonido tan natural que a veces me olvido de que es solo un montón de código binario. Más recientemente, mientras estaba de vacaciones en Argentina, me registré en un hotel junto a las Cataratas del Iguazú y Eno me envió una alerta para asegurarse de que el cargo era legítimo. Rápidamente le envié un mensaje de texto a Eno diciendo que el cargo estaba okey, que la transacción se realizó y pude volver a visitar las cataratas, sabiendo que Eno cuidaba mis espaldas. En última instancia, eso es lo que mi equipo y yo queremos hacer: crear soluciones tecnológicas para facilitar la vida de las personas.