Selezione variabile durante la previsione

Q: Cos'è la selezione delle variabili e perché è importante per l'accuratezza delle previsioni?

La selezione delle variabili è il processo di identificazione delle variabili o degli indicatori principali più rilevanti che influiscono sull'accuratezza delle previsioni.

Q: In che modo la funzionalità determina quali variabili e trasformazioni includere o escludere?

La funzionalità utilizza l'apprendimento automatico per classificare automaticamente le variabili in base al loro impatto sull'accuratezza delle previsioni.

Q: La selezione delle variabili funziona sia per le serie temporali univariate che multivariate?

La selezione delle variabili funziona sia per la previsione di serie temporali univariate che multivariate.

Q: Quali metodi utilizzate (ad esempio, regolarizzazione, importanza delle caratteristiche, SHAP) per classificare la rilevanza delle variabili?

La piattaforma utilizza metodi di apprendimento automatico, inclusa l'analisi dell'importanza delle funzionalità per classificare la rilevanza delle variabili.

Q: In che modo la funzionalità impedisce il sovradattamento, in particolare con molte variabili candidate?

La funzionalità utilizza la convalida incrociata per testare diversi set di variabili e garantire che i modelli funzionino bene su dati fuori campione.

Caratteristiche principali di Indicio

Analisi automatizzata dell'importanza delle feature
‍Sfrutta la potenza del machine learning per classificare automaticamente le variabili in base al loro impatto sull'accuratezza delle previsioni. Risparmia tempo consentendo al nostro sistema di evidenziare le variabili più critiche, assicurandoti di concentrarti su quelle che determinano realmente i risultati.
Sostituzione manuale
Sebbene l'automazione sia potente, tu conosci meglio i tuoi dati. Sostituisci facilmente le selezioni automatiche selezionando o deselezionando manualmente le variabili. Questo ti dà il pieno controllo sul processo di previsione e consente la personalizzazione per esigenze aziendali specifiche.
Convalida incrociata
Testa diversi set di variabili l'uno contro l'altro utilizzando la convalida incrociata integrata. Ciò garantisce che le variabili selezionate funzionino bene su dati che il modello non ha ancora visto (fuori dal campione), migliorando le prestazioni predittive del modello.
Progettazione delle funzionalità delle serie temporali
Genera automaticamente caratteristiche di ritardo, medie mobili e fattori stagionali rilevanti per la previsione delle serie temporali. Regola facilmente queste funzionalità per adattarle alla granularità dei dati e all'orizzonte di previsione, migliorando la precisione a lungo termine.

Come funziona

Crea una previsione
Inizia impostando la tua previsione. Assegnagli un nome univoco e definisci l'orizzonte di previsione, specificando quanto lontano nel futuro vuoi prevedere, che si tratti di giorni, mesi o persino anni.
Importa dati
Porta facilmente i tuoi dati nella piattaforma caricando file, recuperando dati dalle nostre integrazioni con fornitori di dati di terze parti o connettendoti direttamente al tuo database. Indicio supporta un'ampia gamma di formati per garantire flessibilità.
Analizza l'importanza delle variabili
Lascia che Indicio analizzi e classifichi automaticamente l'importanza di ogni variabile. Il nostro sistema valuta quali caratteristiche hanno maggiori probabilità di influire sulla precisione delle previsioni, aiutandoti a concentrarti sui fattori chiave del tuo modello.
Costruisci modelli
Scegli da un'ampia libreria di modelli statistici e di machine learning per creare la tua previsione. Che tu preferisca approcci collaudati nel tempo come ARIMA o reti neurali all'avanguardia, Indicio ha quello che fa per te.
Valuta i modelli
Usa la convalida incrociata per valutare i tuoi modelli e ottenere una precisione fuori dal campione. Confronta i modelli in base alle metriche più pertinenti alle tue esigenze aziendali (RMSE, MAPE, MASE o HIT-Ratio) e scegli il modello con le migliori prestazioni per l'implementazione.
Previsione di esportazione
Una volta finalizzata la previsione, esportala facilmente nel tuo ambiente IT. Condividi i risultati con il tuo team per aiutare la tua organizzazione a prendere decisioni informate e basate sui dati con sicurezza.

Domande frequenti

Cos'è la selezione delle variabili e perché è importante per l'accuratezza delle previsioni?

‍La selezione delle variabili è il processo di scelta delle variabili (caratteristiche) che il modello deve effettivamente utilizzare. Cose come prezzi, promozioni, condizioni meteorologiche, festività, indicatori macro o segnali aziendali personalizzati. Invece di fornire al modello tutte le possibili variabili, manteniamo i segnali che aggiungono valore predittivo e eliminiamo quelli che aggiungono rumore.

In che modo la funzionalità determina quali variabili e trasformazioni includere o escludere?

La nostra funzionalità offre diverse strategie per scegliere variabili e trasformazioni. Può utilizzare algoritmi di ricerca (indietro, avanti, graduale) per testare molte combinazioni di variabili, Lasso per ridurre piccoli coefficienti a zero e metodi bayesiani che mantengono le variabili con un'elevata probabilità di inclusione a posteriori.

Posso combinare la selezione automatica con le mie variabili selezionate dagli esperti?

Sì, puoi sovrascrivere i risultati della selezione delle variabili se hai bisogno di variabili specifiche nei tuoi modelli di previsione.

Come gestite la multicollinearità e i predittori ridondanti?

La multicollinearità colpisce principalmente i modelli statistici classici, mentre gli approcci Lasso e Bayesiano la penalizzano già. Per i modelli classici, è possibile eliminare le variabili contrassegnate negli avvisi di multicollinearità o lasciare che la selezione delle variabili le rimuova utilizzando un modello sensibile alla multicollinearità.

La selezione delle variabili funziona sia per le serie temporali univariate che multivariate?

In Indicio, la selezione delle variabili viene applicata solo ai modelli multivariati. I modelli univariati possono includere altre variabili solo tramite la modellazione esogena, che richiede previsioni e introdurrebbe una distorsione prospettica durante la valutazione, poiché per le variabili esogene vengono utilizzati valori effettivi.

‍

Quali metodi utilizzate (ad esempio, regolarizzazione, importanza delle caratteristiche, SHAP) per classificare la rilevanza delle variabili?

Indicio offre diversi metodi per classificare le variabili in base alla rilevanza. Può essere fatto nella selezione delle variabili, dove utilizziamo algoritmi di ricerca (indietro, avanti, graduale) che testano le combinazioni di variabili, Lasso per ridurre piccoli coefficienti a zero e metodi bayesiani che mantengono le variabili con un'elevata probabilità di inclusione a posteriori.

La classificazione della rilevanza delle variabili può essere effettuata anche nell'ultima fase del processo di previsione per tradurre modelli previsionali complessi in fattori e barriere utilizzando SHAP.

In che modo la funzionalità impedisce il sovradattamento, in particolare con molte variabili candidate?

Indicio limita l'overfitting in diversi modi: suddivisioni train/validazione e convalida incrociata, regolarizzazione (restringimento Lasso e Bayesiano) e selezione automatica delle variabili che rimuove i predittori deboli o ridondanti.

Suggerimento: il confronto dei risultati all'interno del campione e all'esterno del campione aiuta a individuare il sovradattamento.

Posso vedere trasparenza/spiegabilità sul motivo per cui una variabile è stata selezionata o eliminata?

Sì. È possibile controllare la diagnostica, ad esempio i coefficienti e l'impatto sulla precisione. Insieme, questi dati mostrano quali variabili sono state mantenute o eliminate, in che misura influiscono sul modello e se contribuiscono o danneggiano le prestazioni previsionali.

In che modo la selezione variabile influisce sulla velocità di addestramento e sulla latenza di inferenza su larga scala?

La selezione delle variabili aggiunge un certo sovraccarico, poiché deve testare e confrontare diversi sottoinsiemi di predittori. Su larga scala, tale costo è compensato da modelli finali più piccoli: un numero inferiore di predittori velocizza l'addestramento del modello scelto e riduce la latenza di inferenza in produzione.

Quale preparazione dei dati è richiesta (valori mancanti, contrassegni di stagionalità/festività, codifiche categoriche) per ottenere i migliori risultati?

Indicio rileva e tratta automaticamente i valori mancanti e la stagionalità. Puoi anche contrassegnare e gestire i valori anomali e gli effetti del calendario, come le festività, per migliorare ulteriormente le prestazioni del modello.

Selezione variabile

Correlazione vs. metodi avanzati

Caratteristiche principali di Indicio

Webinar - Identificazione degli indicatori principali

Come funziona

Domande frequenti

Esplora altre funzionalità

Costruisci modelli

Analisi dello scenario

Previsioni spiegabili

Demo virtuale

Visualizza la nostra demo click-through