Più indicatori, previsioni peggiori? La verità controintuitiva dietro il sistema a stelle di Indicio

Read time
10 min
CATEGORY
Leading indicators

Fare previsioni era un gioco di numeri: scegli un metodo, adattalo, fornisci una stima puntuale e passa oltre. I team seri non lavorano più così. Il compito ora è capire quali segnali di mercato contano davvero, quali si muovono per primi e se sono efficaci quando li si inserisce nel modello giusto.

Questo è il divario che Indicio è stato creato per colmare. È una piattaforma di previsione che rende accessibili approcci econometrici, di intelligenza artificiale e di machine learning a team che non vogliono scrivere codice o gestire pipeline, costruita attorno a previsioni automatizzate, backtesting, analisi degli indicatori anticipatori e output spiegabili. (indicio.com)

Una funzionalità svolge silenziosamente gran parte del lavoro: l'analisi degli indicatori di influenza delle stelle. Gli indicatori vengono valutati con delle stelle in modo da poter capire, a colpo d'occhio, quali hanno un reale peso predittivo. Più stelle, segnale più forte. Ma c'è una lezione meno ovvia nel sistema:

Più stelle sono meglio. Più indicatori non lo sono.

Un modello che si basa su due o tre indicatori con molte stelle a volte batterà uno imbottito di una dozzina di mediocri. Non è un bug, è il punto.

Cosa fa l'analisi dell'influenza delle stelle

Classifica gli indicatori anticipatori in base a quanto effettivamente aiutano la tua previsione. Più stelle significano un segnale forte. Meno stelle, utile ma meno. Una stella, marginale.

L'obiettivo non è accumulare indicatori. È trovare quelli che migliorano costantemente la previsione. La maggior parte delle aziende dispone di molti più driver potenziali di quanti ne possano utilizzare: dati macro, segnali di domanda, prezzi, catena di approvvigionamento, tendenze di ricerca, meteo, sentiment, mosse dei concorrenti. Alcuni anticipano l'obiettivo. Alcuni sono in ritardo. Alcuni sono duplicati travestiti. La visualizzazione a stelle taglia attraverso la pila e fa emergere i pochi input che meritano il loro posto.

Perché più stelle sono meglio

Un punteggio a stelle più alto significa che un indicatore ha mostrato una relazione reale e utile con la variabile che stai prevedendo: migliore tempistica, un legame statistico più stretto, prestazioni out-of-sample più robuste, un comportamento più coerente.

Niente di tutto questo è nuovo. La letteratura statistica lo dice da decenni. L'articolo originale di Lasso di Tibshirani ha dimostrato che: la riduzione e la selezione ti danno un modello sia interpretabile che ben comportato. (OUP Academic) Nelle serie temporali la posta in gioco è più alta: hai a che fare con rumore, rotture strutturali, stagionalità e relazioni che si spostano. Un buon indicatore anticipatore deve fare più che allinearsi con la storia. Deve aiutare a prevedere periodi che il modello non ha visto.

Perché due o tre indicatori possono batterne dieci

Sembra controintuitivo. Più informazioni dovrebbero significare previsioni migliori, giusto? Non proprio. I modelli di previsione premiano il volume utile , non il volume grezzo. Accumula indicatori e alcune cose vanno storte:

  • Il rumore si insinua. Gli indicatori deboli aggiungono varianza che il modello non può separare dal segnale.
  • Il modello si adatta eccessivamente. Memorizza schemi che non si ripetono.
  • Le variabili si sovrappongono. La metà dei tuoi indicatori dice la stessa cosa, e il modello li conta due volte.
  • Finisci la cronologia. Serie brevi non possono supportare un ampio set di variabili.
  • Perdi la storia. Tre input chiari sono facili da spiegare. Venti input confusi sono una scatola nera anche quando funzionano.

La ricerca su Lasso e metodi correlati giunge sempre alla stessa conclusione: scegliere i predittori più informativi rende i modelli sia più accurati che più stabili. (Proceedings of Machine Learning Research)

Perché i modelli preferiscono un set di indicatori più snello

Molti modelli di previsione evitano attivamente la complessità inutile, specialmente nelle serie temporali multivariate. Ogni nuovo indicatore aggiunge un altro set di relazioni da stimare.

Indicio offre un'ampia libreria: VAR, Structural VAR, VECM, VARX Lasso, VARMA, ARDL, VARX Lag Group Lasso, VAR Elastic Net, HVAR, BVAR, TVP BVAR con volatilità stocastica, Markov Switching VAR, MIDAS, Random Forest VAR e altri. Tutti richiedono un input disciplinato. VAR e BVAR affogano nei parametri una volta spinti in alte dimensioni; la letteratura sui VAR bayesiani raccomanda la riduzione per mantenere stabili le stime. (ScienceDirect) Lasso ed Elastic Net lo risolvono da un'angolazione diversa: Lasso porta a zero i coefficienti deboli, Elastic Net gestisce i predittori correlati. (OUP Academic)

Ecco perché un modello potrebbe accontentarsi di una manciata di indicatori con molte stelle. Non sta scartando informazioni. Sta proteggendo la previsione da input deboli, ridondanti o instabili.

Le stelle rendono la previsione spiegabile

La sola accuratezza non basta. I team di previsione devono spiegare ciò che presentano alla leadership. (indicio.com) Invece di indicare una scatola nera, puoi indicare gli indicatori che svolgono il lavoro e dire perché:

"La previsione sta migliorando perché il modello ha individuato tre forti indicatori anticipatori con un'elevata influenza stellare."

Questo trova riscontro presso i team finanziari, di vendita, della catena di approvvigionamento e il team esecutivo. Sembra un ragionamento, non magia.

Il backtesting non è negoziabile

Un punteggio a stelle non dovrebbe derivare da un'intuizione. Gli indicatori devono essere testati rispetto alle prestazioni storiche effettive: backtesting, valutazione rolling-origin, cross-validazione di serie temporali. La valutazione delle serie temporali deve rispettare il tempo: addestrare sul passato, testare sul futuro, mai semplicemente mescolare i dati come si farebbe nel ML standard. La valutazione rolling-origin è uno dei modi più onesti per simulare previsioni in tempo reale. (Springer)

Un indicatore con stelle ha peso perché non è "pensiamo che questo sia importante". È "il modello ha visto questo segnale nella storia e lo ha trovato utile".

Quando più indicatori aiutano davvero

Piccolo non è sempre meglio. Stock e Watson hanno dimostrato che quando molti predittori condividono una struttura fattoriale sottostante, è possibile comprimerli in pochi fattori e fare previsioni da questi. (stock.scholars.harvard.edu) Il problema: ogni indicatore aggiuntivo deve aggiungere qualcosa di nuovo. Dieci indicatori che tracciano lo stesso movimento non sono dieci indicatori, sono un unico segnale con ridondanza. Il sistema a stelle è il modo per distinguere tra più dati e dati migliori.

Un flusso di lavoro coerente

  1. Lancia una rete ampia per gli indicatori candidati.
  2. Fai emergere quelli con molte stelle.
  3. Esegui il backtest dei modelli su di essi.
  4. Lascia che il modello graviti verso i segnali più forti e stabili.
  5. Usa la visualizzazione a stelle quando devi spiegare la previsione.
  6. Aggiorna man mano che arrivano nuovi dati.

Perché è importante per il business

Le previsioni aziendali tendono a fallire in uno dei due modi: i team si fidano troppo del loro istinto, oppure complicano eccessivamente il modello con variabili marginali. Indicio è stato creato per ridurre entrambi i problemi, abbinando metodi accademici seri con l'usabilità di cui i team di previsione hanno effettivamente bisogno. (indicio.com) Per i decisori, il vantaggio è concreto: migliore accuratezza, letture più precoci sui cambiamenti del mercato, previsioni che puoi difendere in una riunione e meno tempo sprecato a esaminare gli indicatori manualmente.

Il punto chiave

La previsione premia la qualità rispetto alla quantità. Un indicatore a tre stelle è prezioso perché porta un segnale predittivo reale. Una previsione costruita su due o tre di essi spesso batterà una costruita su una lunga lista di quelli deboli.

Più stelle sono meglio. Ma la migliore previsione non è quella con il maggior numero di indicatori. È quella con quelli giusti.

Scopri altri post del nostro blog

Demo virtuale

Visualizza la nostra demo click-through

Prova in prima persona la facilità e l'accuratezza della piattaforma di previsione automatizzata di Indicio. Fai clic per avviare una demo virtuale oggi stesso e scopri come i nostri strumenti all'avanguardia possono semplificare il tuo processo decisionale.