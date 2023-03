Introducción a ChatGPT, grandes modelos de lenguaje e IA generativa

01/03/2023

¿Qué significa esta palabra sopa para el centro de contacto?

ChatGPT ha aparecido en la prensa como una bola de confeti explosiva. Las empresas tecnológicas hablan sobre cómo va a transformar el software. Las compañías de juegos predicen que agregará una capacidad de habla dinámica y humana a sus personajes. Los maestros están tratando de reinventar la educación ahora que el plagio se ha vuelto indetectable de la noche a la mañana. Bing de Microsoft de repente parece un competidor de Google con su funcionalidad ChatGPT integrada. Y los agentes virtuales de atención al cliente y análisis conversacional están a punto de dar un gran paso adelante.

El ciclo de noticias ha sido tan rápido que ha sido difícil mantenerse al día con toda la terminología. Según el artículo que lea, es posible que vea los términos ChatGPT, GPT, GPT-3, GPT-4, modelos de lenguaje extenso (LMM) o IA generativa, todos usados indistintamente. Y no se le culparía por sentirse confundido acerca de qué significa qué o qué hace qué. En esta publicación, explicaré los términos teniendo en cuenta el impacto en el centro de contacto.

ChatGPT



ChatGPT es el término que verás más usado y mal usado. ChatGPT es una aplicación de chat que puede mantener una conversación similar a la humana sobre casi cualquier tema. Fue construido por una startup con fines de lucro llamada OpenAI, que recibió una inversión significativa de Microsoft. Es esta aplicación la que ha generado la avalancha de prensa y entusiasmo, por dos razones:

Parece magia



Es accesible para todos.

Parece magia porque parece humano. Haces una pregunta sobre el espresso y obtienes una respuesta conversacional como si fuera un barista. Haces una pregunta sobre la epilepsia y obtienes una respuesta conversacional como si fuera de un investigador médico. Y cuando se compara con las experiencias de muchas personas con chatbots que parecen decir en su mayoría: “Lo siento, no entendí eso”, esta experiencia parece una alquimia.

En segundo lugar, es accesible para la gente común. Si bien este tipo de capacidad puede haber estado disponible para investigadores y científicos de datos, ChatGPT es la primera aplicación disponible y comprensible para el público en general. Si eres un niño de 10 años que hace la tarea (¡pero no haces trampa!) o un ingeniero que busca consejos de codificación, ChatGPT es accesible y fácil de usar.

A partir de febrero de 2023, ChatGPT no está disponible para su uso en el centro de contacto (ni en ninguna otra industria). No tiene una API, aunque hay una lista de espera en la que OpenAI está recopilando interés, y no se puede usar fuera de la interfaz de chat. Por cierto, también está bajo una gran carga y, a menudo, no está disponible (OpenAI ha lanzado una versión paga que promete velocidades más rápidas y mayor disponibilidad). Pero la suma de esto es que ChatGPT no es algo que un centro de contacto pueda usar fácilmente.

Grandes modelos de lenguaje



Entonces, ¿de qué habla la gente cuando dice que ChatGPT transformará la industria de los centros de contacto (o cualquier otra)? Están hablando del tipo de modelo de IA que sustenta a ChatGPT. Este tipo de modelo se denomina modelo de lenguaje grande o LLM. Es grande porque está haciendo una gran cantidad de cálculos debajo del capó para cada predicción que hace. Los modelos también están entrenados en una cantidad igualmente masiva de datos, como casi toda la palabra escrita digitalizada, como todo Internet. Es un modelo de lenguaje porque su enfoque es predecir secuencias de palabras.

Lo que esto significa es que cuando se le da una indicación, el modelo puede predecir lo que sigue. Por lo tanto, si le diera al mensaje “Rema fila fila su __“, el modelo puede predecir que la siguiente palabra es “barco”. Sin embargo, esta última cosecha de grandes modelos de lenguaje puede predecir mucho más de una palabra. Cuando se le presenta un mensaje como “El impacto de los IVR en la calidad del servicio al cliente ha sido…”, un LLM puede predecir o completar algunos párrafos de un texto muy razonable que describe el impacto histórico de los IVR en el servicio al cliente. Por esta razón, estos modelos también se denominan modelos de finalización de texto. Dados todos los datos que el modelo ha “leído” previamente, puede completar la siguiente oración, párrafo o ensayo lógico con una calidad humana.

Los LLM no trabajan con imágenes, no hacen análisis estadísticos, no hacen cálculos y no verifican hechos. Simplemente operan en el dominio del lenguaje: la palabra escrita. Para cualquier industria que se ocupe principalmente del lenguaje, como el centro de contacto, ¡centrarse en el lenguaje es mucho! El centro de contacto ayuda a las personas a resolver problemas a través del lenguaje hablado o escrito. El idioma es el núcleo de lo que hace el centro de contacto y es por eso que el impacto de los LLM en el servicio al cliente es tan profundo.

GPT



Todos sabemos lo que significa chatear. Pero, ¿qué es GPT? GPT significa Transformador preentrenado generativo. Describe una familia de LLM que se han construido de una manera particular (los LLM se pueden construir de varias maneras).

Por el momento, ChatGPT utiliza una versión no revelada de GPT creada por OpenAI, que se ha ajustado aún más para funcionar bien en conversaciones tipo chat. Hay muchos otros tipos de LLM. Y sí, hay un GPT-1, un GPT-2 y pronto habrá un GPT-4. Cada generación de estos modelos tiene un número creciente de “parámetros”, que se pueden considerar como neuronas en el cerebro. GPT-1 tiene 117 millones de parámetros, GPT-3 tiene 175 mil millones de parámetros y GPT-4 tendrá muchos más parámetros.

Hasta la fecha, agregar más parámetros ha dado como resultado modelos más capaces. Si ha jugado con ChatGPT, usando GPT-3 debajo del capó, sabe que las terminaciones de texto son muy buenas. En particular, fue la última versión de los modelos GPT, denominada GPT 3.5 DaVinci, la que cruzó el abismo de lo interesante a lo sorprendente; sin embargo, si jugaras con GPT-1, no estarías tan impresionado.

Si bien ChatGPT no está disponible fuera de la interfaz de chat en el sitio web de OpenAI, muchos de estos modelos GPT están disponibles en OpenAI a través de API pagas. Debido a su estrecha relación con Microsoft, estas API también están disponibles para uso pago a través de Microsoft Azure. Este hecho es significativo para los centros de contacto, porque Azure agrega los tipos de factores de seguridad, confiabilidad, cumplimiento y privacidad de datos que requieren los centros de contacto.

Sin embargo, hay muchos otros modelos GPT y LLM disponibles de otros proveedores, también de código abierto. Google, por ejemplo, presentó su LLM, llamado Bard, y anunció una inversión de $ 300 millones en Anthropic, una empresa emergente que crea LLM. Otro LLM popular de código abierto se llama Bloom. En resumen, existe una amplia variedad de opciones para construir software con LLM. OpenAI no es el único juego en la ciudad.

IA generativa



Eso nos lleva a nuestro término final, IA generativa. La IA generativa es un término genérico que se refiere a cualquiera de los modelos de IA que generan una salida novedosa basada en una entrada, a menudo denominada aviso. Este término más amplio abarca modelos que producen lenguaje, imágenes visuales y audio.

Es posible que haya oído hablar de Dall-e, otro producto de OpenAI, que puede producir bellas imágenes cuando se le solicita. O Jukebox que genera música como audio en bruto. Estos modelos generativos de IA no necesariamente usan LLM, pero algunos los incorporan en un esfuerzo por comprender el significado de un mensaje. Para el centro de contacto, los modelos de audio y visuales son menos interesantes en este momento. Aunque, los modelos que producen salidas de audio seguramente alcanzarán su punto máximo en los próximos años, lo que tendrá un impacto transformador en la conversación de voz. Los modelos de generación de voz toman una pequeña muestra de una conversación de voz grabada y crean una voz simulada que los sistemas de software pueden usar mediante programación.

Si bien ChatGPT es el término que ha dominado las noticias, se ha utilizado junto con estos otros términos en una sopa de palabras confusa. Con suerte, todo tiene más sentido. La conclusión importante para cualquiera que trabaje en el centro de contacto es que los LLM se han vuelto muy buenos para predecir palabras, oraciones y párrafos. Y dado que gran parte de lo que hacemos en el centro de contacto es dar respuestas razonables basadas en el idioma a los clientes, el impacto es profundo. Significa que los sistemas automatizados han alcanzado una calidad comparable a la de un ser humano en muchos casos.