Selezione variabile

Nel mondo dinamico delle previsioni, la scelta delle variabili giuste, chiamate anche indicatori o caratteristiche principali, può fare la differenza tra previsioni accurate e inaffidabili. Il nostro strumento avanzato di selezione delle variabili consente di identificare le variabili più rilevanti, ottimizzando i modelli di previsione in termini di precisione, efficienza e affidabilità.

Correlazione vs. metodi avanzati

Molte organizzazioni si affidano alla correlazione per identificare gli indicatori principali, ma questo approccio spesso non riesce a produrre previsioni accurate.

La correlazione misura solo la relazione lineare tra due variabili, mentre i metodi avanzati possono valutare le interazioni tra più variabili, quantificare il contributo di ciascuna e tenere conto degli effetti di gruppo. Ciò porta a una precisione delle previsioni notevolmente migliorata.

Per ulteriori approfondimenti, dai un'occhiata alla nostra intervista con la professoressa Sune Karlsson, uno dei principali contributori alla ricerca sulla selezione delle variabili bayesiane.

Caratteristiche principali di Indicio

Webinar - Identificazione degli indicatori principali

In questo webinar registrato, esploreremo i vantaggi e gli svantaggi delle varie metodologie per identificare gli indicatori principali. Tratteremo approcci che vanno dal tracciamento visivo e dall'analisi di correlazione a tecniche avanzate per la selezione delle variabili.

Come funziona

Domande frequenti

Cos'è la selezione delle variabili e perché è importante per l'accuratezza delle previsioni?

La selezione delle variabili è il processo di scelta delle variabili (caratteristiche) che il modello deve effettivamente utilizzare. Cose come prezzi, promozioni, condizioni meteorologiche, festività, indicatori macro o segnali aziendali personalizzati. Invece di fornire al modello tutte le possibili variabili, manteniamo i segnali che aggiungono valore predittivo e eliminiamo quelli che aggiungono rumore.

In che modo la funzionalità determina quali variabili e trasformazioni includere o escludere?

La nostra funzionalità offre diverse strategie per scegliere variabili e trasformazioni. Può utilizzare algoritmi di ricerca (indietro, avanti, graduale) per testare molte combinazioni di variabili, Lasso per ridurre piccoli coefficienti a zero e metodi bayesiani che mantengono le variabili con un'elevata probabilità di inclusione a posteriori.

Posso combinare la selezione automatica con le mie variabili selezionate dagli esperti?

Sì, puoi sovrascrivere i risultati della selezione delle variabili se hai bisogno di variabili specifiche nei tuoi modelli di previsione.

Come gestite la multicollinearità e i predittori ridondanti?

La multicollinearità colpisce principalmente i modelli statistici classici, mentre gli approcci Lasso e Bayesiano la penalizzano già. Per i modelli classici, è possibile eliminare le variabili contrassegnate negli avvisi di multicollinearità o lasciare che la selezione delle variabili le rimuova utilizzando un modello sensibile alla multicollinearità.

La selezione delle variabili funziona sia per le serie temporali univariate che multivariate?

In Indicio, la selezione delle variabili viene applicata solo ai modelli multivariati. I modelli univariati possono includere altre variabili solo tramite la modellazione esogena, che richiede previsioni e introdurrebbe una distorsione prospettica durante la valutazione, poiché per le variabili esogene vengono utilizzati valori effettivi.

Quali metodi utilizzate (ad esempio, regolarizzazione, importanza delle caratteristiche, SHAP) per classificare la rilevanza delle variabili?

Indicio offre diversi metodi per classificare le variabili in base alla rilevanza. Può essere fatto nella selezione delle variabili, dove utilizziamo algoritmi di ricerca (indietro, avanti, graduale) che testano le combinazioni di variabili, Lasso per ridurre piccoli coefficienti a zero e metodi bayesiani che mantengono le variabili con un'elevata probabilità di inclusione a posteriori.

La classificazione della rilevanza delle variabili può essere effettuata anche nell'ultima fase del processo di previsione per tradurre modelli previsionali complessi in fattori e barriere utilizzando SHAP.


In che modo la funzionalità impedisce il sovradattamento, in particolare con molte variabili candidate?

Indicio limita l'overfitting in diversi modi: suddivisioni train/validazione e convalida incrociata, regolarizzazione (restringimento Lasso e Bayesiano) e selezione automatica delle variabili che rimuove i predittori deboli o ridondanti.

Suggerimento: il confronto dei risultati all'interno del campione e all'esterno del campione aiuta a individuare il sovradattamento.

Posso vedere trasparenza/spiegabilità sul motivo per cui una variabile è stata selezionata o eliminata?

Sì. È possibile controllare la diagnostica, ad esempio i coefficienti e l'impatto sulla precisione. Insieme, questi dati mostrano quali variabili sono state mantenute o eliminate, in che misura influiscono sul modello e se contribuiscono o danneggiano le prestazioni previsionali.

In che modo la selezione variabile influisce sulla velocità di addestramento e sulla latenza di inferenza su larga scala?

La selezione delle variabili aggiunge un certo sovraccarico, poiché deve testare e confrontare diversi sottoinsiemi di predittori. Su larga scala, tale costo è compensato da modelli finali più piccoli: un numero inferiore di predittori velocizza l'addestramento del modello scelto e riduce la latenza di inferenza in produzione.

Quale preparazione dei dati è richiesta (valori mancanti, contrassegni di stagionalità/festività, codifiche categoriche) per ottenere i migliori risultati?

Indicio rileva e tratta automaticamente i valori mancanti e la stagionalità. Puoi anche contrassegnare e gestire i valori anomali e gli effetti del calendario, come le festività, per migliorare ulteriormente le prestazioni del modello.

Esplora altre funzionalità

Esplora tutte le funzionalità

Demo virtuale

Visualizza la nostra demo click-through

Prova in prima persona la facilità e l'accuratezza della piattaforma di previsione automatizzata di Indicio. Fai clic per avviare una demo virtuale oggi stesso e scopri come i nostri strumenti all'avanguardia possono semplificare il tuo processo decisionale.