Wybór zmiennej

W dynamicznym świecie prognozowania wybór odpowiednich zmiennych, zwanych również wiodącymi wskaźnikami lub cechami, może mieć wpływ na dokładne i niewiarygodne prognozy. Nasze zaawansowane narzędzie do wyboru zmiennych umożliwia identyfikację najbardziej odpowiednich zmiennych, optymalizując modele prognozowania pod kątem dokładności, wydajności i niezawodności.

Korelacja a zaawansowane metody

Wiele organizacji opiera się na korelacji w celu identyfikacji wiodących wskaźników, ale takie podejście często nie daje dokładnych prognoz.

Korelacja mierzy tylko liniową zależność między dwiema zmiennymi, podczas gdy zaawansowane metody mogą oceniać interakcje między wieloma zmiennymi, ilościowo określić udział każdej z nich i uwzględnić efekty grupowe. Prowadzi to do znacznej poprawy dokładności prognoz.

Aby uzyskać więcej informacji, zapoznaj się z naszym wywiadem z profesorem Sune Karlssonem, kluczowym współpracownikiem badań nad doborami zmiennych bayesowskich.

Najważniejsze cechy Indicio

Webinar - Identyfikacja wiodących wskaźników

W tym nagranym webinarium zbadamy zalety i wady różnych metodologii identyfikacji wiodących wskaźników. Omówimy podejścia, od kreślenia wizualnego i analizy korelacji po zaawansowane techniki doboru zmiennych.

Jak to działa

Często zadawane pytania

Co to jest wybór zmiennych i dlaczego ma to znaczenie dla dokładności prognozowania?

Wybór zmiennych to proces wybierania zmiennych (cech), których model powinien faktycznie używać. Rzeczy takie jak cena, promocje, pogoda, święta, wskaźniki makro lub niestandardowe sygnały biznesowe. Zamiast podawać modelowi każdą możliwą zmienną, zachowujemy sygnały, które dodają wartość predykcyjną i upuszczamy te, które dodają szumu.

W jaki sposób funkcja określa, które zmienne i transformacje należy uwzględnić lub wykluczyć?

Nasza funkcja oferuje kilka strategii wyboru zmiennych i transformacji. Może używać algorytmów wyszukiwania (do tyłu, do przodu, krok po kroku) do testowania wielu kombinacji zmiennych, Lasso do zmniejszania małych współczynników do zera oraz metod bayesowskich, które utrzymują zmienne o wysokim prawdopodobieństwie włączenia tylnego.

Czy mogę łączyć automatyczny wybór ze zmiennymi wybranymi przez ekspertów?

Tak, możesz nadpisać wyniki wyboru zmiennych, jeśli potrzebujesz określonych zmiennych w modelach prognozowania.

Jak radzisz sobie z predyktorami wielokoliniowości i nadmiarowymi?

Wielokoliniowość wpływa głównie na klasyczne modele statystyczne, podczas gdy podejścia Lasso i Bayesowskie już ją karzą. W przypadku modeli klasycznych można upuszczać zmienne oznaczone w ostrzeżeniach o wielokoliniowości lub pozwolić, aby wybór zmiennych usunął je przy użyciu modelu wrażliwego na wielokoliniowość.

Czy wybór zmiennych działa zarówno dla jednozmiennych, jak i wielowymiarowych szeregów czasowych?

W Indicio wybór zmiennych jest stosowany tylko do modeli wielowymiarowych. Modele jednowymienne mogą obejmować inne zmienne tylko poprzez modelowanie egzogenne, które wymaga prognoz i wprowadziłoby błąd spojrzenia w przyszłość podczas oceny, ponieważ dla zmiennych egzogennych używane są rzeczywiste wartości.

Jakich metod używasz (np. regularyzacji, ważności funkcji, SHAP), aby uszeregować trafność zmiennej?

Indicio oferuje kilka metod rankingu zmiennych według trafności. Można to zrobić w wyborze zmiennych, gdzie używamy algorytmów wyszukiwania (do tyłu, do przodu, krok po kroku), które testują kombinacje zmiennych, Lasso do zmniejszania małych współczynników do zera oraz metod bayesowskich, które utrzymują zmienne o wysokim prawdopodobieństwie włączenia tylnego.

Ranking trafności zmiennych może być również przeprowadzony na ostatnim etapie procesu prognozowania, aby przetłumaczyć złożone modele prognozy na czynniki napędowe i bariery za pomocą SHAP.


W jaki sposób funkcja zapobiega nadmiernemu dopasowaniu, zwłaszcza w przypadku wielu zmiennych kandydujących?

Indico ogranicza nadmierne dopasowanie na kilka sposobów; podziały treningu/walidacji i walidację krzyżową, regularyzację (skurcz Lasso i Bayesa) oraz automatyczny wybór zmiennych, który usuwa słabe lub nadmiarowe predyktory.

Wskazówka: porównanie wyników w próbce i poza próbką pomaga wykryć nadmierne dopasowanie.

Czy mogę zobaczyć przezroczystość/wyjaśnialność, dlaczego zmienna została wybrana lub upuszczona?

Tak. Możesz sprawdzić diagnostykę, taką jak współczynniki, i wpływ na dokładność. Razem pokazują one, które zmienne zostały zachowane lub upuszczone, jak silnie wpływają na model i czy pomagają, czy szkodzą wydajności prognozy.

Jak zmienna selekcja wpływa na szybkość treningu i opóźnienie wnioskowania w skali?

Wybór zmiennej dodaje pewne koszty ogólne, ponieważ wymaga przetestowania i porównywania różnych podzbiorów predyktorów. W skali koszt ten jest równoważony przez mniejsze modele końcowe: mniej predyktorów przyspiesza szkolenie wybranego modelu i zmniejsza opóźnienie wnioskowania w produkcji.

Jakie przygotowanie danych jest wymagane (brakujące wartości, flagi sezonowe/świąteczne, kodowania kategoryczne), aby uzyskać najlepsze wyniki?

Indicio automatycznie wykrywa i traktuje brakujące wartości i sezonowość. Możesz także oznaczać i obsługiwać wartości odstające i efekty kalendarza, takie jak święta, aby jeszcze bardziej poprawić wydajność modelu.

Poznaj więcej funkcji

Poznaj wszystkie funkcje

Wirtualne demo

Zobacz naszą demonstrację klików

Poznaj łatwość i dokładność automatycznej platformy prognozowania Indicio z pierwszej ręki. Kliknij, aby rozpocząć wirtualną wersję demonstracyjną już dziś i dowiedzieć się, w jaki sposób nasze najnowocześniejsze narzędzia mogą usprawnić proces podejmowania decyzji.