Perché non dovresti acquistare una piattaforma di intelligenza artificiale, data science o machine learning se il tuo intento è creare modelli di previsione accurati

Read time
4 min
CATEGORY
Forecasting software

Le moderne piattaforme di intelligenza artificiale sono straordinarie per le attività predittive generali, ma quando l'obiettivo è un'elevata precisione nelle previsioni di serie temporali con una cronologia limitata, spesso non forniscono risultati soddisfacenti. Decenni di prove dimostrano che i metodi di previsione classici e appositamente progettati spesso battono il machine learning generico quando si hanno serie temporali brevi, stagionalità complessa, valori anomali, volatilità variabile o parametri che variano nel tempo. Questa non è un'opinione, è documentata nei principali concorsi di previsione e nei libri di testo su cui fanno affidamento i professionisti, compresi i concorsi M e Previsione: principi e pratica. Il messaggio principale è semplice: se intendi fare previsioni accurate, soprattutto con dati mensili o trimestrali, investi in capacità di previsione specializzate, non in una piattaforma AI generica.

Quanto segue sintetizza i risultati di studi empirici e riferimenti comprovati nella pratica come le competizioni M4 e M5, Hyndman e Athanasopoulos e ricerche sottoposte a revisione paritaria su modelli robusti, stagionali e variabili nel tempo.

La piccola realtà delle previsioni aziendali

La maggior parte delle serie di pianificazione in materia di finanza, supply chain e gestione della forza lavoro non sono lunghe. I dati mensili su 5-10 anni forniscono da 60 a 120 osservazioni, i dati trimestrali sullo stesso orizzonte forniscono da 20 a 40 osservazioni. Hyndman e Athanasopoulos sottolineano che la scelta del metodo deve seguire gli schemi dei dati e il regime di valutazione deve rispettare l'ordine temporale, in genere tramite la convalida incrociata delle serie temporali, non mescolamenti casuali (panoramica sulla convalida incrociata delle serie temporali). In questo contesto di piccoli campioni, i metodi stagionali classici, i modelli spaziali degli stati e le varianti di regressione penalizzate sono progettati per funzionare efficacemente.

Perché le piattaforme ML generiche hanno difficoltà a fare previsioni

Le piattaforme di machine learning generiche di solito risolvono le previsioni convertendo la serie in un problema tabulare e aggiungendo funzionalità ritardate. Anche i tutorial che descrivono metodi neurali o basati su alberi per le serie temporali affermano che l'ingegneria delle funzionalità inizia in genere con la creazione di valori ritardati e statistiche progressive (esempio di discussione). Questo approccio può funzionare con una grande quantità di dati, ma spesso le prestazioni sono inferiori quando la serie è breve perché la complessità del modello supera il contenuto delle informazioni, con conseguente varianza elevata. La regolarizzazione aiuta, ed è esattamente il motivo per cui le regressioni penalizzate sono linee di base solide in piccoli campioni (primer corto).

Come funzionano i modelli ML complessi e perché richiedono dati

Il machine learning moderno può rappresentare una struttura molto ricca e non lineare. Il compromesso è la fame di campioni. Di seguito sono riportati esempi concreti di ciò che ogni famiglia può acquisire e del motivo per cui l'accuratezza delle previsioni richiede in genere migliaia di osservazioni o molte serie correlate.

  • Reti neurali feedforward apprendi interazioni non lineari di alto ordine attraverso trasformazioni e attivazioni affini sovrapposte, consentendo l'approssimazione di funzioni universali (Libro di testo sul deep learning). Questa capacità è potente per rilevare soglie, saturazioni ed effetti incrociati tra driver esogeni, ma il numero dei parametri aumenta rapidamente con l'ampiezza e la profondità. Con solo 60-120 osservazioni mensili, il rapporto tra parametri e osservazioni è sfavorevole, il che aumenta il rischio di sovradimensionamento, a meno che non si disponga di pannelli trasversali di grandi dimensioni o di una forte regolarizzazione.
  • LSTM e altre reti ricorrenti sono progettati per catturare dipendenze temporali a lungo raggio, cambiamenti di regime ed evoluzione dello stato non lineare tramite meccanismi di gating (carta originale LSTM). In pratica, i modelli stateful sequence eccellono se addestrati su migliaia di lunghe sequenze o su grandi pannelli di serie correlate in cui la rete può condividere informazioni tra articoli, come nella domanda al dettaglio. Le architetture di livello industriale come DeepAR si affidano esplicitamente al cross-learning per molte serie correlate per svolgere bene le attività di previsione (Carta DeepAR). Con una manciata di brevi serie mensili, gli LSTM tendono a superare le idiosincrasie di ciascuna serie piuttosto che apprendere dinamiche temporali stabili.
  • Alberi con gradiente potenziato come XGBoost catturare non linearità complesse e interazioni di alto ordine costruendo insiemi di alberi decisionali, ciascuno dei quali corregge gli errori residui rispetto a quello precedente (Carta XGBoost). Ciò è eccellente per modellare soglie ed effetti di interazione tra molte feature e covariate ritardate. Tuttavia, quando la previsione è inquadrata come un problema tabulare con dozzine di ritardi e funzionalità di calendario, si crea rapidamente uno spazio di feature ad alta dimensione. L'apprendimento di suddivisioni e interazioni affidabili richiede molte righe di addestramento per evitare errori dovuti alla varianza. Con 60 osservazioni mensili per serie, le righe sono semplicemente troppo poche per apprendere in modo affidabile le strutture di interazione approfondite senza perdite o sovradittamenti.

Cosa hanno effettivamente dimostrato le competizioni

L'evidenza empirica su larga scala è inequivocabile su un punto importante, non esiste un metodo universalmente migliore e le prestazioni dipendono dalle caratteristiche dei dati.

  • Nella competizione M4, i metodi di apprendimento automatico puro hanno ottenuto prestazioni inferiori rispetto alle combinazioni e ai metodi statistici classici in un insieme di serie molto ampio ed eterogeneo (documento dei risultati, riepilogo e via da seguire).
  • Nella competizione M5 incentrata sulla vendita al dettaglio, gli approcci di aumento del gradiente sono stati importanti tra i migliori candidati, ma gli autori hanno anche notato che il semplice livellamento esponenziale rimane altamente competitivo a determinati livelli di aggregazione e che il cross-learning in molte serie correlate è fondamentale (Panoramica della precisione M5, rapporto degli organizzatori).

L'implicazione per gli acquirenti è chiara: la precisione dipende dall'avere metodi che corrispondano al regime dei dati. Quando ogni serie è breve e idiosincratica, come in molti contesti aziendali, tendono a dominare modelli e combinazioni di previsione specializzati. Quando si hanno migliaia di serie giornaliere correlate con ricche covariate, alcuni approcci di machine learning possono brillare, ma questo è un regime molto diverso.

Cosa cercare invece di una piattaforma ML generica

Se la tua missione sono previsioni accurate, dai la priorità a piattaforme e processi creati appositamente per la previsione delle serie temporali. Le piattaforme specializzate, come Indicio, si concentrano sulla previsione ed espongono il giusto toolkit di modellazione e valutazione. Usa questa lista di controllo per valutare l'idoneità:

  • Libreria di modelli allineata alla struttura delle serie temporali. VAR, VECM, Lasso, MIDAS, i modelli spaziali a stati, la riconciliazione gerarchica e le combinazioni di modelli sono essenziali per le serie brevi e stagionali (riferimento al libro di testo, panoramica delle combinazioni previsionali).
  • Caratteristiche di robustezza. Gestione nativa dei valori anomali e stima affidabile in modo che un singolo picco non faccia deragliare i parametri (robusto Holt-Winters).
  • Dinamica variabile nel tempo. Supporto al TVP, alla volatilità stocastica e ai cambiamenti di regime quando il mondo cambia (TVP in pratica, recente confronto TVP-VAR).
  • Backtest adeguati. Validazione incrociata dell'origine rotativa e delle serie temporali pronta all'uso (guida tscv).
  • Evidenza derivante dai benchmark. Capacità di riprodurre le valutazioni in stile M-Competition e combinare le previsioni, garantendo costantemente una forte precisione (Risultati M4).

Aspetti chiave per gli acquirenti

  • Se si prevedono principalmente serie mensili o trimestrali con decine o qualche centinaio di osservazioni, i metodi stagionali classici, i modelli spaziali degli stati e le regressioni penalizzate sono in genere più forti e affidabili delle pipeline ML generiche (riferimento al libro di testo, Risultati M4).
  • Quando si hanno migliaia di serie correlate e ricchi dati esogeni, l'apprendimento automatico può eccellere, ma solo con un'attenta valutazione delle serie temporali e l'apprendimento incrociato, come evidenziato da M5 (Panoramica M5).
  • Il percorso pratico verso l'accuratezza non è una parola d'ordine sulla piattaforma, è adattamento del metodo, robustezza e disciplina di valutazione fondata sulla scienza delle previsioni (riferimento al libro di testo).

Conclusione

Se il tuo intento è una previsione accurata, specialmente con brevi cronologie mensili o trimestrali, una piattaforma generale di intelligenza artificiale, data science o ML è l'acquisto sbagliato. Scegli una piattaforma di previsione specializzata che integri modelli stagionali, affidabilità rispetto ai valori anomali, parametri variabili nel tempo, quantificazione dell'incertezza e backtesting senza perdite. È così che si trasformano storie limitate in decisioni affidabili.

Scopri altri post del nostro blog

Demo virtuale

Visualizza la nostra demo click-through

Prova in prima persona la facilità e l'accuratezza della piattaforma di previsione automatizzata di Indicio. Fai clic per avviare una demo virtuale oggi stesso e scopri come i nostri strumenti all'avanguardia possono semplificare il tuo processo decisionale.