Lo que aprendí de "Financial Machine Learning" (aprendizaje automático financiero) de Bryan Kelly and Dacheng
El aprendizaje automático financiero (Financial Machine Learning o FML) es un campo emergente que aplica herramientas de aprendizaje automático al estudio de los mercados financieros. Este enfoque se distingue de la econometría tradicional por varias características clave.
¿Qué es el Aprendizaje Automático Financiero?
Según las fuentes, el aprendizaje automático se describe como:
Una colección diversa de modelos de alta dimensión para la predicción estadística.
Métodos de "regularización" para la selección del modelo y la mitigación del sobreajuste (overfit).
Algoritmos eficientes para buscar entre una vasta cantidad de posibles especificaciones de modelos.
En esencia, el FML es un conjunto de procedimientos para estimar un modelo estadístico y usarlo para tomar decisiones. Se caracteriza por una mentalidad abierta hacia representaciones funcionales altamente parametrizadas y a menudo no lineales. El objetivo central del aprendizaje automático es maximizar la precisión de la predicción frente a un modelo de datos desconocido, lo que lo diferencia del objetivo estadístico tradicional de estimar un modelo de generación de datos conocido y realizar pruebas de hipótesis.
Argumentos a Favor del Aprendizaje Automático Financiero
Las fuentes destacan tres condiciones de la investigación financiera que hacen que el campo sea particularmente fértil para los métodos de aprendizaje automático:
Los precios son predicciones: Los precios de los activos son esencialmente predicciones de los flujos de pagos futuros esperados por los inversores. Esto significa que las herramientas estadísticas para estudiar los precios son, fundamentalmente, modelos de pronóstico.
Los conjuntos de información son amplios: Los estudios de precios de activos están inextricablemente ligados a la información. Los participantes del mercado utilizan una vasta cantidad de datos, incluyendo noticias, datos macroeconómicos, características a nivel de activo y más, para formar sus expectativas. El aprendizaje automático puede ayudar a asimilar estos conjuntos de información más grandes, cerrando la brecha entre la información accesible para los investigadores y la disponible para los participantes del mercado.
Las formas funcionales son ambiguas: A diferencia del enfoque econométrico tradicional que impone una forma funcional preespecificada (a menudo lineal) basada en un modelo económico teórico, el aprendizaje automático permite explorar la relación entre la información y los precios de manera más flexible. Esto se debe a que los inversores pueden usar la información de maneras complejas y no lineales que los investigadores no pueden especificar exhaustiva ni concisamente en un modelo estadístico paramétrico. Herramientas como los métodos de kernel, los estimadores de verosimilitud penalizados, los árboles de decisión y las redes neuronales están diseñadas para aproximar funciones de generación de datos desconocidas.
Desafíos en la Aplicación del Aprendizaje Automático en Finanzas
A pesar de sus ventajas, la aplicación del aprendizaje automático en finanzas presenta desafíos importantes:
Datos escasos (series temporales): A menudo, las preguntas fundamentales en finanzas se ven frustradas por la realidad de los "datos pequeños" en las series temporales económicas. Por ejemplo, los conjuntos de datos en macrofinanzas pueden limitarse a unos pocos cientos de observaciones mensuales.
Bajas relaciones señal-ruido: Los mercados financieros, especialmente en la predicción de retornos, presentan una relación señal-ruido débil. La eficiencia del mercado tiende a eliminar la previsibilidad de los movimientos de precios, lo que significa que gran parte de la variación de los precios se debe a noticias imprevistas (ruido).
Mercados en evolución y aprendizaje de los inversores: Los inversores aprenden y los mercados evolucionan, creando un objetivo en constante movimiento para los modelos de predicción de aprendizaje automático. Los patrones predictivos que antes eran fiables pueden desaparecer debido al arbitraje, y los cambios regulatorios o tecnológicos pueden alterar la estructura de la economía, lo que complica el aprendizaje.
Sin embargo, estos desafíos también ofrecen una oportunidad para beneficiarse de la estructura económica y la teoría. Al imponer más estructura en el modelo, se necesitan estimar menos parámetros, lo que permite un uso más eficiente de los datos disponibles para filtrar el ruido.
Las "Dos Culturas" de la Economía Financiera
Las fuentes hacen referencia al ensayo de Breiman (2001) sobre las "dos culturas" de la estadística, que tienen un análogo en la economía financiera:
La cultura del "modelo estructural/prueba de hipótesis": Favorece la imposición de supuestos estructurales específicos y la investigación de mecanismos económicos a través de pruebas de hipótesis.
La cultura del "modelo de predicción": Valora por encima de todo el poder explicativo estadístico y está dispuesta a adoptar especificaciones de modelos que puedan carecer de una asociación explícita con la teoría económica, siempre que produzcan mejoras significativas y robustas en el ajuste de los datos. La investigación de aprendizaje automático financiero se encuadra firmemente en esta segunda cultura.
Aunque a veces se critica a la investigación de modelos de predicción por "no tener economía", las fuentes argumentan que esta crítica es a menudo errónea. Los modelos de predicción, incluso los más estadísticos, desempeñan un papel económico crucial al mapear nuevos hechos empíricos sobre los cuales se pueden desarrollar teorías e investigar mecanismos futuros. En última instancia, la economía de la cultura del modelo de predicción reside precisamente en su capacidad para mejorar las predicciones, lo que permite a los agentes económicos tomar mejores decisiones de asignación de recursos y, en última instancia, mejora el bienestar.
La Virtud de los Modelos Complejos
Contrariamente al "principio de parsimonia" tradicional en econometría, que aboga por el menor número posible de parámetros para una representación adecuada, el aprendizaje automático moderno ha demostrado que "más grande suele ser mejor". Modelos con un número masivo de parámetros, que incluso ajustan exactamente los datos de entrenamiento, a menudo son los de mejor rendimiento fuera de la muestra. Las fuentes sugieren que el analista debería usar el modelo de aproximación más grande que pueda computar, ya que el rendimiento esperado de la previsión y la cartera fuera de la muestra aumenta con la complejidad del modelo.
Este fenómeno está relacionado con el concepto de "doble descenso" y "sobreajuste benigno", donde al aumentar la complejidad del modelo más allá del número de observaciones, el rendimiento fuera de la muestra puede mejorar sorprendentemente. La complejidad de un modelo, definida como la relación entre el número de parámetros (P) y el número de observaciones de entrenamiento (T), (c = P/T), juega un papel crítico. Las fuentes también introducen el concepto de "cuña de complejidad", que es la diferencia esperada entre el rendimiento dentro de la muestra y fuera de la muestra, y consta de dos componentes: el sobreajuste y los límites del aprendizaje.
Aplicaciones Clave
Las fuentes exploran una variedad de aplicaciones del aprendizaje automático en finanzas, organizadas principalmente en tres áreas:
Predicción de Retornos: Modelos como regresiones lineales penalizadas (elastic net, LASSO, ridge), reducción de dimensionalidad (PCR, PLS, Principal Portfolios), árboles de decisión (boosting, random forest), y redes neuronales (feed-forward, RNN, LSTM) han demostrado un rendimiento superior en la predicción de retornos, especialmente en paneles de datos de acciones a nivel individual. También se discute el uso de "datos alternativos" como texto e imágenes para la predicción.
Compensaciones Riesgo-Retorno (Modelos de Factores): El FML se utiliza para estimar modelos de factores latentes, como el Análisis de Componentes Principales Instrumental (IPCA) o autoencoders condicionales, que buscan identificar las fuentes sistemáticas de riesgo y sus primas. Estos modelos pueden capturar la naturaleza dependiente del estado de los precios de los activos.
Carteras Óptimas: Las técnicas de aprendizaje automático abordan el desafío de la incertidumbre en la estimación de las distribuciones de retorno para la construcción de carteras óptimas. Métodos como la Regresión de la Tasa de Sharpe Máxima (MSRR), que puede integrar directamente la maximización de la utilidad en la estimación de los pesos de la cartera, y el aprendizaje por refuerzo, especialmente relevante cuando las decisiones del inversor tienen un impacto en el precio o cuando hay costos de transacción, son ejemplos clave.
En resumen, el aprendizaje automático ofrece un conjunto indispensable de herramientas para comprender y operar en los mercados financieros, superando las limitaciones de los métodos tradicionales al manejar grandes conjuntos de datos, formas funcionales complejas y al priorizar la precisión de la predicción fuera de la muestra.