In der dynamischen Welt der Prognosen kann die Auswahl der richtigen Variablen, auch Frühindikatoren oder Merkmale genannt, den Unterschied zwischen genauen und unzuverlässigen Prognosen ausmachen. Unser fortschrittliches Tool zur Variablenauswahl ermöglicht es Ihnen, die relevantesten Variablen zu identifizieren und Ihre Prognosemodelle im Hinblick auf Genauigkeit, Effizienz und Zuverlässigkeit zu optimieren.
Viele Unternehmen verlassen sich auf Korrelationen, um Frühindikatoren zu identifizieren, aber dieser Ansatz reicht oft nicht aus, um genaue Prognosen zu erstellen.
Korrelation misst nur die lineare Beziehung zwischen zwei Variablen, wohingegen fortgeschrittene Methoden Interaktionen zwischen mehreren Variablen bewerten, den Beitrag jeder Variablen quantifizieren und Gruppeneffekte berücksichtigen können. Dies führt zu einer deutlich verbesserten Prognosegenauigkeit.
Weitere Einblicke finden Sie in unserem Interview mit Professor Sune Karlsson, einem wichtigen Beitrag zur Erforschung der Bayesschen Variablenauswahl.
In diesem aufgezeichneten Webinar werden wir die Vor- und Nachteile verschiedener Methoden zur Identifizierung von Frühindikatoren untersuchen. Wir werden Ansätze behandeln, die von der visuellen Darstellung und Korrelationsanalyse bis hin zu fortgeschrittenen Techniken zur Variablenauswahl reichen.
Bei der Variablenauswahl wird ausgewählt, welche Variablen (Features) Ihr Modell tatsächlich verwenden soll. Dinge wie Preis, Werbeaktionen, Wetter, Feiertage, Makroindikatoren oder benutzerdefinierte Geschäftssignale. Anstatt das Modell mit allen möglichen Variablen zu versorgen, behalten wir die Signale bei, die den prädiktiven Wert erhöhen, und entfernen die Signale, die das Rauschen hinzufügen.
Unsere Funktion bietet verschiedene Strategien zur Auswahl von Variablen und Transformationen. Es kann Suchalgorithmen (rückwärts, vorwärts, schrittweise) verwenden, um viele Variablenkombinationen zu testen, Lasso, um kleine Koeffizienten auf Null zu verkleinern, und Bayes-Methoden, die Variablen mit einer hohen Wahrscheinlichkeit für einen späteren Einschluss beibehalten.
Ja, Sie können die Ergebnisse der Variablenauswahl überschreiben, wenn Sie bestimmte Variablen in Ihren Prognosemodellen benötigen.
Multikollinearität wirkt sich hauptsächlich auf klassische statistische Modelle aus, während Lasso- und Bayessche Ansätze sie bereits benachteiligen. Bei klassischen Modellen können Sie Variablen, die in Multikollinearitätswarnungen gekennzeichnet sind, löschen oder sie durch die Variablenauswahl entfernen lassen, indem Sie ein Modell verwenden, das empfindlich auf Multikollinearität reagiert.
In Indicio wird die Variablenauswahl nur auf multivariate Modelle angewendet. Univariate Modelle können andere Variablen nur durch exogene Modellierung einbeziehen. Dafür sind Prognosen erforderlich und bei der Bewertung würde es zu einer Verzerrung der Vorausschau kommen, da die tatsächlichen Werte für die exogenen Variablen verwendet werden.
Indicio bietet verschiedene Methoden, um Variablen nach Relevanz zu ordnen. Dies kann entweder bei der Variablenauswahl geschehen, wo wir Suchalgorithmen (rückwärts, vorwärts, schrittweise) verwenden, um Variablenkombinationen zu testen, Lasso, um kleine Koeffizienten auf Null zu verkleinern, und Bayes-Methoden, die Variablen mit hoher Wahrscheinlichkeit für einen späteren Einschluss beibehalten.
Die Relevanz der Variablen kann auch im letzten Schritt des Prognoseprozesses eingestuft werden, um komplexe Prognosemodelle mithilfe von SHAP in Treiber und Hindernisse umzuwandeln.
Indicio begrenzt die Überanpassung auf verschiedene Weise: Zug-/Validierungs-Splits und Kreuzvalidierung, Regularisierung (Lasso- und Bayessche Schrumpfung) und automatisierte Variablenauswahl, die schwache oder redundante Prädiktoren entfernt.
Tipp: Der Vergleich der Ergebnisse innerhalb der Probe und der Ergebnisse außerhalb der Probe hilft dabei, Überanpassungen zu erkennen.
Ja. Sie können Diagnosen wie Koeffizienten und Auswirkungen auf die Genauigkeit überprüfen. Zusammen zeigen sie, welche Variablen beibehalten oder weggelassen wurden, wie stark sie das Modell beeinflussen und ob sie die Prognoseleistung verbessern oder beeinträchtigen.
Die Variablenauswahl erhöht den Aufwand, da verschiedene Teilmengen von Prädiktoren getestet und verglichen werden müssen. Im großen Maßstab werden diese Kosten durch kleinere endgültige Modelle ausgeglichen: Weniger Prädiktoren beschleunigen das Training des ausgewählten Modells und reduzieren die Inferenzlatenz in der Produktion.
Indicio erkennt und behandelt automatisch fehlende Werte und Saisonalität. Sie können auch Ausreißer und Kalendereffekte wie Feiertage kennzeichnen und behandeln, um die Modellleistung weiter zu verbessern.
.gif)


Erleben Sie die Einfachheit und Genauigkeit der automatisierten Prognoseplattform von Indicio aus erster Hand. Klicken Sie hier, um noch heute eine virtuelle Demo zu starten und zu erfahren, wie unsere hochmodernen Tools Ihren Entscheidungsprozess optimieren können.