¿En qué se diferencia el aprendizaje automático en las finanzas de otros campos?

Por Igor Halperin, profesor de investigación de Aprendizaje de machine learning financiero en NYU, Quora

En mi opinión, las principales diferencias se derivan de las diferencias en los datos. En finanzas, los datos son (muy) ruidosos y, a menudo, no estacionarios. Las “señales” no se pueden separar del “ruido” de una manera única, como cuestión de principio. Esto es muy diferente del procesamiento de imágenes, por ejemplo, donde el nivel de ruido se puede controlar, al menos en principio. Además, la noción de datos no estacionarios no existe para el procesamiento de imágenes. Debido a la pronunciada función del ruido, algunos modelos de LD, por ejemplo los modelos no probabilísticos, no son muy útiles en finanzas.

La otra diferencia es la cantidad de datos. Muchos problemas interesantes de finanzas son problemas con conjuntos de datos de tamaño pequeño a mediano, lo que hace que las aplicaciones de métodos hambrientos de datos como el aprendizaje profundo sean problemáticas. Por lo tanto, en las finanzas, a menudo es necesario hacer cumplir algunos conocimientos previos, a través de (según el método utilizado) las opciones de regularización, los antecedentes bayesianos u otros principios generales como el análisis de simetrías.

Una diferencia más importante es que el “verdadero” espacio estatal en finanzas no está bien definido. Existen los llamados eventos del cisne negro: cosas que están fuera de los modelos financieros, por ejemplo, el riesgo político, que sin embargo podrían tener un impacto severo en los precios de seguridad. Existe una diferencia entre incertidumbre y probabilidad (riesgo). La mayoría de los modelos ML (así como la mayoría de los modelos financieros clásicos) tratan con sistemas probabilísticos con un espacio de estado bien definido, no admiten cisnes negros. Son modelos de riesgo pero no modelos de incertidumbre.