Variablenauswahl bei Prognosen

Q: Was ist Variablenauswahl und warum ist sie für die Prognosegenauigkeit wichtig?

Bei der Variablenauswahl werden die relevantesten Variablen oder Frühindikatoren identifiziert, die sich auf die Prognosegenauigkeit auswirken.

Q: Wie bestimmt Ihre Funktion, welche Variablen und Transformationen ein- oder ausgeschlossen werden sollen?

Die Funktion verwendet maschinelles Lernen, um Variablen automatisch nach ihren Auswirkungen auf die Prognosegenauigkeit zu ordnen.

Q: Funktioniert die Variablenauswahl sowohl für univariate als auch für multivariate Zeitreihen?

Die Variablenauswahl funktioniert sowohl für univariate als auch für multivariate Zeitreihenprognosen.

Q: Welche Methoden verwenden Sie (z. B. Regularisierung, Merkmalsbedeutung, SHAP), um die Variablenrelevanz zu bewerten?

Die Plattform verwendet Methoden des maschinellen Lernens, einschließlich der Merkmalsbedeutungsanalyse, um die Variablenrelevanz zu bewerten.

Q: Wie verhindert die Funktion eine Überanpassung, insbesondere bei vielen Kandidatenvariablen?

Die Funktion verwendet eine Kreuzvalidierung, um verschiedene Variablensätze zu testen und sicherzustellen, dass Modelle bei Daten außerhalb der Stichprobe eine gute Leistung erbringen.

Q: Wie wirkt sich die Variablenauswahl auf die Trainingsgeschwindigkeit und die Inferenzlatenz in großem Maßstab aus?

Die Variablenauswahl erhöht den Aufwand, da sie verschiedene Teilmengen von Prädiktoren testet und vergleicht. Im großen Maßstab werden diese Kosten oft durch kleinere endgültige Modelle ausgeglichen: Weniger Prädiktoren beschleunigen das Training und reduzieren die Inferenzlatenz in der Produktion.

Hauptmerkmale von Indicio

Automatisierte Analyse der Merkmalsbedeutung
‍Nutzen Sie das Potenzial des maschinellen Lernens, um Variablen automatisch anhand ihrer Auswirkungen auf die Prognosegenauigkeit zu ordnen. Sparen Sie Zeit, indem Sie es unserem System ermöglichen, die wichtigsten Variablen hervorzuheben. So stellen Sie sicher, dass Sie sich auf diejenigen konzentrieren, die wirklich zu Ergebnissen führen.
Manuelles Übersteuern
Automatisierung ist zwar leistungsstark, aber Sie kennen Ihre Daten am besten. Überschreiben Sie automatische Auswahlen ganz einfach, indem Sie Variablen manuell an- oder abwählen. Dies gibt Ihnen die volle Kontrolle über den Prognoseprozess und ermöglicht die Anpassung an spezifische Geschäftsanforderungen.
Kreuzvalidierung
Testen Sie verschiedene Variablensätze mithilfe der integrierten Kreuzvalidierung gegeneinander. Dadurch wird sichergestellt, dass die ausgewählten Variablen bei Daten, die das Modell noch nicht gesehen hat (außerhalb der Stichprobe), eine gute Leistung erbringen, wodurch die Prognoseleistung des Modells verbessert wird.
Zeitreihen-Feature-Engineering
Generieren Sie automatisch Lag-Merkmale, gleitende Durchschnitte und saisonale Faktoren, die für Zeitreihenprognosen relevant sind. Passen Sie diese Funktionen einfach an die Granularität und den Prognosehorizont Ihrer Daten an und verbessern Sie so die langfristige Genauigkeit.

So funktioniert's

Erstellen Sie eine Prognose
Beginnen Sie mit der Erstellung Ihrer Prognose. Geben Sie ihr einen eindeutigen Namen und definieren Sie den Prognosehorizont. Geben Sie an, wie weit in die Zukunft Sie prognostizieren möchten — egal, ob es sich um Tage, Monate oder sogar Jahre handelt.
Daten importieren
Bringen Sie Ihre Daten nahtlos auf die Plattform, indem Sie Dateien hochladen, Daten aus unseren Integrationen mit Datenanbietern von Drittanbietern abrufen oder eine direkte Verbindung zu Ihrer Datenbank herstellen. Indicio unterstützt eine Vielzahl von Formaten, um Flexibilität zu gewährleisten.
Analysieren Sie die Bedeutung der Variablen
Lassen Sie Indicio die Wichtigkeit jeder Variablen automatisch analysieren und einstufen. Unser System bewertet, welche Merkmale sich am ehesten auf die Prognosegenauigkeit auswirken, sodass Sie sich auf die wichtigsten Faktoren Ihres Modells konzentrieren können.
Modelle bauen
Wählen Sie aus einer umfangreichen Bibliothek mit statistischen Modellen und Modellen für maschinelles Lernen, um Ihre Prognose zu erstellen. Egal, ob Sie bewährte Ansätze wie ARIMA oder modernste neuronale Netze bevorzugen, Indicio bietet Ihnen alles.
Modelle evaluieren
Verwenden Sie die Kreuzvalidierung, um Ihre Modelle zu bewerten und eine Genauigkeit außerhalb der Stichprobe zu erzielen. Vergleichen Sie Modelle auf der Grundlage der Metriken, die für Ihre Geschäftsanforderungen am relevantesten sind — RMSE, MAPE, MASE oder HIT-Ratio — und wählen Sie die beste Leistung für die Bereitstellung aus.
Exportprognose
Sobald Ihre Prognose fertiggestellt ist, können Sie sie einfach in Ihre IT-Umgebung exportieren. Teilen Sie die Ergebnisse mit Ihrem Team, damit Ihr Unternehmen fundierte, datengestützte Entscheidungen mit Zuversicht treffen kann.

Häufig gestellte Fragen

Was ist Variablenauswahl und warum ist sie für die Prognosegenauigkeit wichtig?

‍Bei der Variablenauswahl wird ausgewählt, welche Variablen (Features) Ihr Modell tatsächlich verwenden soll. Dinge wie Preis, Werbeaktionen, Wetter, Feiertage, Makroindikatoren oder benutzerdefinierte Geschäftssignale. Anstatt das Modell mit allen möglichen Variablen zu versorgen, behalten wir die Signale bei, die den prädiktiven Wert erhöhen, und entfernen die Signale, die das Rauschen hinzufügen.

Wie bestimmt Ihre Funktion, welche Variablen und Transformationen ein- oder ausgeschlossen werden sollen?

Unsere Funktion bietet verschiedene Strategien zur Auswahl von Variablen und Transformationen. Es kann Suchalgorithmen (rückwärts, vorwärts, schrittweise) verwenden, um viele Variablenkombinationen zu testen, Lasso, um kleine Koeffizienten auf Null zu verkleinern, und Bayes-Methoden, die Variablen mit einer hohen Wahrscheinlichkeit für einen späteren Einschluss beibehalten.

Kann ich die automatische Auswahl mit meinen eigenen, von Experten ausgewählten Variablen kombinieren?

Ja, Sie können die Ergebnisse der Variablenauswahl überschreiben, wenn Sie bestimmte Variablen in Ihren Prognosemodellen benötigen.

Wie geht man mit Multikollinearität und redundanten Prädiktoren um?

Multikollinearität wirkt sich hauptsächlich auf klassische statistische Modelle aus, während Lasso- und Bayessche Ansätze sie bereits benachteiligen. Bei klassischen Modellen können Sie Variablen, die in Multikollinearitätswarnungen gekennzeichnet sind, löschen oder sie durch die Variablenauswahl entfernen lassen, indem Sie ein Modell verwenden, das empfindlich auf Multikollinearität reagiert.

Funktioniert die Variablenauswahl sowohl für univariate als auch für multivariate Zeitreihen?

In Indicio wird die Variablenauswahl nur auf multivariate Modelle angewendet. Univariate Modelle können andere Variablen nur durch exogene Modellierung einbeziehen. Dafür sind Prognosen erforderlich und bei der Bewertung würde es zu einer Verzerrung der Vorausschau kommen, da die tatsächlichen Werte für die exogenen Variablen verwendet werden.

‍

Welche Methoden verwenden Sie (z. B. Regularisierung, Merkmalsbedeutung, SHAP), um die Variablenrelevanz zu bewerten?

Indicio bietet verschiedene Methoden, um Variablen nach Relevanz zu ordnen. Dies kann entweder bei der Variablenauswahl geschehen, wo wir Suchalgorithmen (rückwärts, vorwärts, schrittweise) verwenden, um Variablenkombinationen zu testen, Lasso, um kleine Koeffizienten auf Null zu verkleinern, und Bayes-Methoden, die Variablen mit hoher Wahrscheinlichkeit für einen späteren Einschluss beibehalten.

Die Relevanz der Variablen kann auch im letzten Schritt des Prognoseprozesses eingestuft werden, um komplexe Prognosemodelle mithilfe von SHAP in Treiber und Hindernisse umzuwandeln.

Wie verhindert die Funktion eine Überanpassung, insbesondere bei vielen Kandidatenvariablen?

Indicio begrenzt die Überanpassung auf verschiedene Weise: Zug-/Validierungs-Splits und Kreuzvalidierung, Regularisierung (Lasso- und Bayessche Schrumpfung) und automatisierte Variablenauswahl, die schwache oder redundante Prädiktoren entfernt.

Tipp: Der Vergleich der Ergebnisse innerhalb der Probe und der Ergebnisse außerhalb der Probe hilft dabei, Überanpassungen zu erkennen.

Kann ich Transparenz/Erklärbarkeit dafür sehen, warum eine Variable ausgewählt oder gelöscht wurde?

Ja. Sie können Diagnosen wie Koeffizienten und Auswirkungen auf die Genauigkeit überprüfen. Zusammen zeigen sie, welche Variablen beibehalten oder weggelassen wurden, wie stark sie das Modell beeinflussen und ob sie die Prognoseleistung verbessern oder beeinträchtigen.

Wie wirkt sich die Variablenauswahl auf die Trainingsgeschwindigkeit und die Inferenzlatenz in großem Maßstab aus?

Die Variablenauswahl erhöht den Aufwand, da verschiedene Teilmengen von Prädiktoren getestet und verglichen werden müssen. Im großen Maßstab werden diese Kosten durch kleinere endgültige Modelle ausgeglichen: Weniger Prädiktoren beschleunigen das Training des ausgewählten Modells und reduzieren die Inferenzlatenz in der Produktion.

Welche Datenvorbereitung ist erforderlich (fehlende Werte, Saison-/Feiertagsflaggen, kategoriale Kodierungen), um beste Ergebnisse zu erzielen?

Indicio erkennt und behandelt automatisch fehlende Werte und Saisonalität. Sie können auch Ausreißer und Kalendereffekte wie Feiertage kennzeichnen und behandeln, um die Modellleistung weiter zu verbessern.

Variablenauswahl

Korrelation im Vergleich zu fortgeschrittenen Methoden

Hauptmerkmale von Indicio

Webinar — Identifizierung von Frühindikatoren

So funktioniert's

Häufig gestellte Fragen

Erkunden Sie weitere Funktionen

Modelle bauen

Szenarioanalyse

Erklärbare Prognosen

Virtuelle Demo

Sehen Sie sich unsere Click-Through-Demo an