Por qué no deberías comprar una plataforma de inteligencia artificial, ciencia de datos o aprendizaje automático si tu intención es crear modelos de previsión precisos

Read time
4 min
CATEGORY
Forecasting software

Las plataformas de IA modernas son impresionantes para las tareas predictivas generales, pero cuando el objetivo es una alta precisión en las previsiones de series temporales con un historial limitado, con frecuencia no dan resultados satisfactorios. Décadas de evidencia muestran que los métodos de previsión clásicos diseñados específicamente suelen superar al aprendizaje automático genérico cuando se utilizan series temporales cortas, estacionalidades complejas, valores atípicos, volatilidad cambiante o parámetros variables en el tiempo. Esto no es una opinión, sino que está documentado en los principales concursos y libros de texto sobre predicción en los que confían los profesionales, incluidos los concursos M y Previsión: principios y práctica. El mensaje central es simple: si su intención son las previsiones precisas, especialmente con datos mensuales o trimestrales, invierta en una capacidad de previsión especializada, no en una plataforma de IA genérica.

Lo que sigue sintetiza los hallazgos de estudios empíricos y referencias comprobadas en la práctica, como las competiciones M4 y M5, Hyndman y Athanasopoulos, y las investigaciones revisadas por pares sobre modelos sólidos, estacionales y variables en el tiempo.

La realidad de la previsión empresarial para pequeñas y medianas empresas

La mayoría de las series de planificación sobre finanzas, cadena de suministro y gestión de la fuerza laboral no son largas. Los datos mensuales de 5 a 10 años proporcionan de 60 a 120 observaciones, mientras que los datos trimestrales sobre el mismo horizonte ofrecen de 20 a 40 observaciones. Hyndman y Athanasopoulos hacen hincapié en que la elección del método debe seguir los patrones de los datos y que el régimen de evaluación debe respetar el orden cronológico, normalmente mediante la validación cruzada de las series temporales, no mediante combinaciones aleatorias (descripción general de la validación cruzada de series temporales). En este entorno de muestras pequeñas, los métodos estacionales clásicos, los modelos de espacio de estados y las variantes de regresión penalizadas están diseñados para funcionar de manera efectiva.

Por qué las plataformas de aprendizaje automático genéricas tienen dificultades con la previsión

Las plataformas genéricas de aprendizaje automático suelen abordar la previsión convirtiendo la serie en un problema tabular y añadiendo funciones retrasadas. Incluso los tutoriales que describen métodos neuronales o basados en árboles para series temporales afirman que la ingeniería de características normalmente comienza con la creación de valores rezagados y estadísticas progresivas (ejemplo de discusión). Este enfoque puede funcionar con datos abundantes, pero a menudo tiene un rendimiento inferior cuando la serie es corta porque la complejidad del modelo supera al contenido de la información, lo que genera una gran varianza. La regularización ayuda, y esa es precisamente la razón por la que las regresiones penalizadas son bases de referencia sólidas en muestras pequeñas (imprimación corta).

Cómo funcionan los modelos de aprendizaje automático complejos y por qué exigen datos

El ML moderno puede representar una estructura no lineal muy rica. La compensación es el hambre de muestras. A continuación se muestran ejemplos concretos de lo que cada familia puede captar y de por qué la precisión de los pronósticos suele requerir miles de observaciones o muchas series relacionadas.

  • Redes neuronales de retroalimentación aprenda interacciones no lineales de alto orden mediante transformaciones y activaciones afines apiladas, lo que permite la aproximación universal de funciones (Libro de texto de aprendizaje profundo). Esta capacidad es poderosa para capturar umbrales, saturaciones y efectos cruzados entre factores exógenos, pero el recuento de parámetros aumenta rápidamente con el ancho y la profundidad. Con solo 60 a 120 observaciones mensuales, la relación entre parámetros y observaciones es desfavorable, lo que aumenta el riesgo de sobreajuste, a menos que se trate de paneles transversales grandes o de una regularización intensa.
  • LSTM y otras redes recurrentes están diseñados para capturar las dependencias temporales de largo alcance, los cambios de régimen y la evolución no lineal de los estados mediante mecanismos de cierre (papel LSTM original). En la práctica, los modelos de secuencias con estado son excelentes cuando se utilizan en miles de secuencias largas o en grandes paneles de series relacionadas en los que la red puede compartir información entre artículos, como ocurre con la demanda minorista. Las arquitecturas de nivel industrial, como DeepAR, se basan explícitamente en el aprendizaje cruzado en relación con muchas series relacionadas para funcionar correctamente en las tareas de previsión (Papel DeepAR). Con un puñado de series mensuales cortas, los LSTM tienden a sobreajustarse a la idiosincrasia de cada serie en lugar de aprender una dinámica temporal estable.
  • Árboles con gradiente mejorado como XGBoost capte no linealidades complejas e interacciones de alto orden mediante la creación de conjuntos de árboles de decisión, cada uno de los cuales corrige los errores residuales del anterior (Papel XGBoost). Esto es excelente para modelar los umbrales y los efectos de interacción entre muchas características y covariables rezagadas. Sin embargo, cuando la previsión se enmarca como un problema tabular con docenas de desfases y características de calendario, se crea rápidamente un espacio de características de gran dimensión. Aprender a dividir e interactuar de forma fiable requiere muchas filas de entrenamiento para evitar errores provocados por la varianza. Con 60 observaciones mensuales por serie, simplemente hay muy pocas filas para aprender de forma sólida las estructuras de interacción profundas sin filtraciones ni sobreajustes.

Lo que realmente mostraron las competiciones

La evidencia empírica a gran escala es inequívoca en un punto importante: no existe un método universalmente mejor y el rendimiento depende de las características de los datos.

  • En la competencia M4, los métodos puros de aprendizaje automático tuvieron un rendimiento inferior al de las combinaciones y los métodos estadísticos clásicos en un conjunto de series muy grande y heterogéneo (documento de resultados, resumen y camino a seguir).
  • En la competencia M5 centrada en el comercio minorista, los enfoques de aumento de los gradientes ocuparon un lugar destacado entre las principales candidaturas, pero los autores también señalaron que la simple suavización exponencial seguía siendo muy competitiva en ciertos niveles de agregación y que el aprendizaje cruzado en muchas series relacionadas era crucial (Descripción general de la precisión del M5, informe de los organizadores).

La implicación para los compradores es clara: la precisión depende de tener métodos que coincidan con el régimen de datos. Cuando cada serie es corta e idiosincrásica, como en muchos entornos corporativos, tienden a predominar los modelos y combinaciones de pronósticos especializados. Cuando tienes miles de series diarias relacionadas con abundantes covariables, algunos enfoques de aprendizaje automático pueden brillar, pero se trata de un régimen muy diferente.

Qué buscar en lugar de una plataforma ML genérica

Si su misión son las previsiones precisas, priorice las plataformas y los procesos diseñados específicamente para la previsión de series temporales. Las plataformas especializadas, como Indicio, se centran en la previsión y ofrecen el conjunto de herramientas de modelado y evaluación adecuado. Utilice esta lista de verificación para evaluar el ajuste:

  • Biblioteca de modelos alineada con la estructura de series temporales. VAR, VECM, Lasso, MIDAS, los modelos de espacio de estados, la reconciliación jerárquica y las combinaciones de modelos son esenciales para las series cortas y estacionales (referencia de libros de texto, descripción general de las combinaciones de previsiones).
  • Características de robustez. Manejo nativo de valores atípicos y estimación sólida para que un solo pico no descarrile los parámetros (Holt-Winters robustos).
  • Dinámica variable en el tiempo. El apoyo al TVP, la volatilidad estocástica y los cambios de régimen cuando el mundo cambia (TVP en la práctica, comparación reciente entre TVP-VAR).
  • Backtesting adecuado. Validación cruzada de series temporales y de origen continuo lista para usar (guía tscv).
  • Evidencia de puntos de referencia. Capacidad para reproducir evaluaciones al estilo de una competencia M y combinar pronósticos, lo que proporciona una gran precisión de manera constante (Resultados M4).

Conclusiones clave para los compradores

  • Si se pronostican principalmente series mensuales o trimestrales con decenas o unos pocos cientos de observaciones, los métodos estacionales clásicos, los modelos de espacio de estados y las regresiones penalizadas suelen ser más sólidos y confiables que las canalizaciones genéricas de ML (referencia de libros de texto, Resultados M4).
  • Cuando tienes miles de series relacionadas y datos exógenos abundantes, el aprendizaje automático puede sobresalir, pero solo con una evaluación cuidadosa de las series temporales y el aprendizaje cruzado, como lo demuestra M5 (Descripción general de M5).
  • La ruta práctica hacia la precisión no son las palabras de moda de las plataformas, sino la adaptación del método, la solidez y la disciplina de evaluación basada en la ciencia de la predicción (referencia de libros de texto).

En pocas palabras

Si su intención es hacer pronósticos precisos, especialmente con historiales cortos mensuales o trimestrales, una plataforma general de inteligencia artificial, ciencia de datos o aprendizaje automático es la compra equivocada. Elija una plataforma de previsión especializada que incorpore la modelización estacional, la solidez frente a los valores atípicos, los parámetros variables en el tiempo, la cuantificación de la incertidumbre y la realización de pruebas retrospectivas sin filtraciones. Así es como se convierten los historiales limitados en decisiones confiables.

Explore more of our blog posts

Virtual demo

View our click-through demo

Experience the ease and accuracy of Indicio’s automated forecasting platform firsthand. Click to start a virtual demo today and discover how our cutting-edge tools can streamline your decision-making process.