Variablenauswahl

In der dynamischen Welt der Prognosen kann die Auswahl der richtigen Variablen, auch Frühindikatoren oder Merkmale genannt, den Unterschied zwischen genauen und unzuverlässigen Prognosen ausmachen. Unser fortschrittliches Tool zur Variablenauswahl ermöglicht es Ihnen, die relevantesten Variablen zu identifizieren und Ihre Prognosemodelle im Hinblick auf Genauigkeit, Effizienz und Zuverlässigkeit zu optimieren.

Korrelation im Vergleich zu fortgeschrittenen Methoden

Viele Unternehmen verlassen sich auf Korrelationen, um Frühindikatoren zu identifizieren, aber dieser Ansatz reicht oft nicht aus, um genaue Prognosen zu erstellen.

Korrelation misst nur die lineare Beziehung zwischen zwei Variablen, wohingegen fortgeschrittene Methoden Interaktionen zwischen mehreren Variablen bewerten, den Beitrag jeder Variablen quantifizieren und Gruppeneffekte berücksichtigen können. Dies führt zu einer deutlich verbesserten Prognosegenauigkeit.

Weitere Einblicke finden Sie in unserem Interview mit Professor Sune Karlsson, einem wichtigen Beitrag zur Erforschung der Bayesschen Variablenauswahl.

Hauptmerkmale von Indicio

Webinar — Identifizierung von Frühindikatoren

In diesem aufgezeichneten Webinar werden wir die Vor- und Nachteile verschiedener Methoden zur Identifizierung von Frühindikatoren untersuchen. Wir werden Ansätze behandeln, die von der visuellen Darstellung und Korrelationsanalyse bis hin zu fortgeschrittenen Techniken zur Variablenauswahl reichen.

So funktioniert's

Häufig gestellte Fragen

Was ist Variablenauswahl und warum ist sie für die Prognosegenauigkeit wichtig?

Bei der Variablenauswahl wird ausgewählt, welche Variablen (Features) Ihr Modell tatsächlich verwenden soll. Dinge wie Preis, Werbeaktionen, Wetter, Feiertage, Makroindikatoren oder benutzerdefinierte Geschäftssignale. Anstatt das Modell mit allen möglichen Variablen zu versorgen, behalten wir die Signale bei, die den prädiktiven Wert erhöhen, und entfernen die Signale, die das Rauschen hinzufügen.

Wie bestimmt Ihre Funktion, welche Variablen und Transformationen ein- oder ausgeschlossen werden sollen?

Unsere Funktion bietet verschiedene Strategien zur Auswahl von Variablen und Transformationen. Es kann Suchalgorithmen (rückwärts, vorwärts, schrittweise) verwenden, um viele Variablenkombinationen zu testen, Lasso, um kleine Koeffizienten auf Null zu verkleinern, und Bayes-Methoden, die Variablen mit einer hohen Wahrscheinlichkeit für einen späteren Einschluss beibehalten.

Kann ich die automatische Auswahl mit meinen eigenen, von Experten ausgewählten Variablen kombinieren?

Ja, Sie können die Ergebnisse der Variablenauswahl überschreiben, wenn Sie bestimmte Variablen in Ihren Prognosemodellen benötigen.

Wie geht man mit Multikollinearität und redundanten Prädiktoren um?

Multikollinearität wirkt sich hauptsächlich auf klassische statistische Modelle aus, während Lasso- und Bayessche Ansätze sie bereits benachteiligen. Bei klassischen Modellen können Sie Variablen, die in Multikollinearitätswarnungen gekennzeichnet sind, löschen oder sie durch die Variablenauswahl entfernen lassen, indem Sie ein Modell verwenden, das empfindlich auf Multikollinearität reagiert.

Funktioniert die Variablenauswahl sowohl für univariate als auch für multivariate Zeitreihen?

In Indicio wird die Variablenauswahl nur auf multivariate Modelle angewendet. Univariate Modelle können andere Variablen nur durch exogene Modellierung einbeziehen. Dafür sind Prognosen erforderlich und bei der Bewertung würde es zu einer Verzerrung der Vorausschau kommen, da die tatsächlichen Werte für die exogenen Variablen verwendet werden.

Welche Methoden verwenden Sie (z. B. Regularisierung, Merkmalsbedeutung, SHAP), um die Variablenrelevanz zu bewerten?

Indicio bietet verschiedene Methoden, um Variablen nach Relevanz zu ordnen. Dies kann entweder bei der Variablenauswahl geschehen, wo wir Suchalgorithmen (rückwärts, vorwärts, schrittweise) verwenden, um Variablenkombinationen zu testen, Lasso, um kleine Koeffizienten auf Null zu verkleinern, und Bayes-Methoden, die Variablen mit hoher Wahrscheinlichkeit für einen späteren Einschluss beibehalten.

Die Relevanz der Variablen kann auch im letzten Schritt des Prognoseprozesses eingestuft werden, um komplexe Prognosemodelle mithilfe von SHAP in Treiber und Hindernisse umzuwandeln.


Wie verhindert die Funktion eine Überanpassung, insbesondere bei vielen Kandidatenvariablen?

Indicio begrenzt die Überanpassung auf verschiedene Weise: Zug-/Validierungs-Splits und Kreuzvalidierung, Regularisierung (Lasso- und Bayessche Schrumpfung) und automatisierte Variablenauswahl, die schwache oder redundante Prädiktoren entfernt.

Tipp: Der Vergleich der Ergebnisse innerhalb der Probe und der Ergebnisse außerhalb der Probe hilft dabei, Überanpassungen zu erkennen.

Kann ich Transparenz/Erklärbarkeit dafür sehen, warum eine Variable ausgewählt oder gelöscht wurde?

Ja. Sie können Diagnosen wie Koeffizienten und Auswirkungen auf die Genauigkeit überprüfen. Zusammen zeigen sie, welche Variablen beibehalten oder weggelassen wurden, wie stark sie das Modell beeinflussen und ob sie die Prognoseleistung verbessern oder beeinträchtigen.

Wie wirkt sich die Variablenauswahl auf die Trainingsgeschwindigkeit und die Inferenzlatenz in großem Maßstab aus?

Die Variablenauswahl erhöht den Aufwand, da verschiedene Teilmengen von Prädiktoren getestet und verglichen werden müssen. Im großen Maßstab werden diese Kosten durch kleinere endgültige Modelle ausgeglichen: Weniger Prädiktoren beschleunigen das Training des ausgewählten Modells und reduzieren die Inferenzlatenz in der Produktion.

Welche Datenvorbereitung ist erforderlich (fehlende Werte, Saison-/Feiertagsflaggen, kategoriale Kodierungen), um beste Ergebnisse zu erzielen?

Indicio erkennt und behandelt automatisch fehlende Werte und Saisonalität. Sie können auch Ausreißer und Kalendereffekte wie Feiertage kennzeichnen und behandeln, um die Modellleistung weiter zu verbessern.

Erkunden Sie weitere Funktionen

Entdecke alle Funktionen

Virtuelle Demo

Sehen Sie sich unsere Click-Through-Demo an

Erleben Sie die Einfachheit und Genauigkeit der automatisierten Prognoseplattform von Indicio aus erster Hand. Klicken Sie hier, um noch heute eine virtuelle Demo zu starten und zu erfahren, wie unsere hochmodernen Tools Ihren Entscheidungsprozess optimieren können.