Wybór zmiennych podczas prognozowania

Q: Co to jest wybór zmiennych i dlaczego ma to znaczenie dla dokładności prognozowania?

Wybór zmiennych to proces identyfikacji najważniejszych zmiennych lub wiodących wskaźników, które wpływają na dokładność prognozy.

Q: W jaki sposób funkcja określa, które zmienne i transformacje należy uwzględnić lub wykluczyć?

Funkcja wykorzystuje uczenie maszynowe do automatycznego pozycjonowania zmiennych na podstawie ich wpływu na dokładność prognozy.

Q: Czy wybór zmiennych działa zarówno dla jednozmiennych, jak i wielowymiarowych szeregów czasowych?

Wybór zmiennych działa zarówno w przypadku jednozmiennego, jak i wielowymiarowego prognozowania szeregów czasowych.

Q: Jakich metod używasz (np. regularyzacji, ważności funkcji, SHAP), aby uszeregować trafność zmiennej?

Platforma wykorzystuje metody uczenia maszynowego, w tym analizę ważności funkcji, aby ocenić trafność zmiennej.

Q: W jaki sposób funkcja zapobiega nadmiernemu dopasowaniu, zwłaszcza w przypadku wielu zmiennych kandydujących?

Funkcja wykorzystuje walidację krzyżową do testowania różnych zestawów zmiennych i zapewnienia, że modele działają dobrze na danych poza próbką.

Q: Czy mogę zobaczyć przezroczystość/wyjaśnialność, dlaczego zmienna została wybrana lub upuszczona?

Tak. Możesz sprawdzić diagnostykę, taką jak współczynniki i wpływ na dokładność. Razem pokazują one, które zmienne zostały zachowane lub upuszczone, jak silnie wpływają na model i czy pomagają, czy szkodzą wydajności prognozy.

Q: Jak zmienna selekcja wpływa na szybkość treningu i opóźnienie wnioskowania w skali?

Wybór zmiennych dodaje pewne koszty ogólne, ponieważ testuje i porównuje różne podzbiory predyktorów. Na dużą skalę koszt ten jest często równoważony przez mniejsze modele końcowe: mniej predyktorów przyspiesza trening i zmniejsza opóźnienie wnioskowania w produkcji.

Najważniejsze cechy Indicio

Zautomatyzowana analiza znaczenia funkcji
‍Wykorzystaj moc uczenia maszynowego, aby automatycznie oceniać zmienne na podstawie ich wpływu na dokładność prognozy. Oszczędzaj czas, pozwalając naszemu systemowi wyróżnić najbardziej krytyczne zmienne, zapewniając skupienie się na tych, które naprawdę wpływają na wyniki.
Ręczne zastąpienie
Chociaż automatyzacja jest potężna, najlepiej znasz swoje dane. Łatwo zastępuj automatyczne zaznaczenia, ręcznie wybierając lub usuwając zaznaczanie zmiennych. Daje to pełną kontrolę nad procesem prognozowania i umożliwia dostosowanie do konkretnych potrzeb biznesowych.
Walidacja krzyżowa
Testuj różne zestawy zmiennych względem siebie za pomocą wbudowanej walidacji krzyżowej. Gwarantuje to, że wybrane zmienne działają dobrze na danych, których model jeszcze nie widział (poza próbką), poprawiając wydajność predykcyjną modelu.
Inżynieria funkcji szeregów czasowych
Automatycznie generuj funkcje opóźnień, średnie kroczące i czynniki sezonowe istotne dla prognozowania szeregów czasowych. Łatwo dostosowuj te funkcje do szczegółowości danych i horyzontu prognozowania, poprawiając długoterminową dokładność.

Jak to działa

Utwórz prognozę
Zacznij od skonfigurowania prognozy. Nadaj mu unikalną nazwę i zdefiniuj horyzont prognozy, określając, jak daleko chcesz przewidzieć przyszłość — czy to dni, miesiące, a nawet lata.
Importuj dane
Bezproblemowo przenieś swoje dane na platformę, przesyłając pliki, pobierając dane z naszych integracji z dostawcami danych innych firm lub łącząc się bezpośrednio z bazą danych. Indicio obsługuje szeroką gamę formatów, aby zapewnić elastyczność.
Analizuj znaczenie zmiennej
Pozwól Indicio automatycznie analizować i oceniać znaczenie każdej zmiennej. Nasz system ocenia, które funkcje najprawdopodobniej wpłyną na dokładność prognozy, pomagając Ci skupić się na kluczowych czynnikach Twojego modelu.
Tworzenie modeli
Wybieraj spośród obszernej biblioteki modeli statystycznych i uczenia maszynowego, aby zbudować prognozę. Niezależnie od tego, czy wolisz sprawdzone w czasie podejścia, takie jak ARIMA, czy najnowocześniejsze sieci neuronowe, Indicio Cię omawia.
Oceń modele
Użyj walidacji krzyżowej, aby ocenić swoje modele i uzyskać dokładność poza próbką. Porównaj modele oparte na wskaźnikach najbardziej odpowiadających potrzebom Twojej firmy — RMSE, MAPE, MASE lub HIT-ratio — i wybierz najlepszą wydajność do wdrożenia.
Prognoza eksportu
Po sfinalizowaniu prognozy z łatwością wyeksportuj ją do środowiska IT. Udostępniaj wyniki swojemu zespołowi, aby pomóc organizacji w podejmowaniu świadomych decyzji opartych na danych z pewnością.

Często zadawane pytania

Co to jest wybór zmiennych i dlaczego ma to znaczenie dla dokładności prognozowania?

‍Wybór zmiennych to proces wybierania zmiennych (cech), których model powinien faktycznie używać. Rzeczy takie jak cena, promocje, pogoda, święta, wskaźniki makro lub niestandardowe sygnały biznesowe. Zamiast podawać modelowi każdą możliwą zmienną, zachowujemy sygnały, które dodają wartość predykcyjną i upuszczamy te, które dodają szumu.

W jaki sposób funkcja określa, które zmienne i transformacje należy uwzględnić lub wykluczyć?

Nasza funkcja oferuje kilka strategii wyboru zmiennych i transformacji. Może używać algorytmów wyszukiwania (do tyłu, do przodu, krok po kroku) do testowania wielu kombinacji zmiennych, Lasso do zmniejszania małych współczynników do zera oraz metod bayesowskich, które utrzymują zmienne o wysokim prawdopodobieństwie włączenia tylnego.

Czy mogę łączyć automatyczny wybór ze zmiennymi wybranymi przez ekspertów?

Tak, możesz nadpisać wyniki wyboru zmiennych, jeśli potrzebujesz określonych zmiennych w modelach prognozowania.

Jak radzisz sobie z predyktorami wielokoliniowości i nadmiarowymi?

Wielokoliniowość wpływa głównie na klasyczne modele statystyczne, podczas gdy podejścia Lasso i Bayesowskie już ją karzą. W przypadku modeli klasycznych można upuszczać zmienne oznaczone w ostrzeżeniach o wielokoliniowości lub pozwolić, aby wybór zmiennych usunął je przy użyciu modelu wrażliwego na wielokoliniowość.

Czy wybór zmiennych działa zarówno dla jednozmiennych, jak i wielowymiarowych szeregów czasowych?

W Indicio wybór zmiennych jest stosowany tylko do modeli wielowymiarowych. Modele jednowymienne mogą obejmować inne zmienne tylko poprzez modelowanie egzogenne, które wymaga prognoz i wprowadziłoby błąd spojrzenia w przyszłość podczas oceny, ponieważ dla zmiennych egzogennych używane są rzeczywiste wartości.

‍

Jakich metod używasz (np. regularyzacji, ważności funkcji, SHAP), aby uszeregować trafność zmiennej?

Indicio oferuje kilka metod rankingu zmiennych według trafności. Można to zrobić w wyborze zmiennych, gdzie używamy algorytmów wyszukiwania (do tyłu, do przodu, krok po kroku), które testują kombinacje zmiennych, Lasso do zmniejszania małych współczynników do zera oraz metod bayesowskich, które utrzymują zmienne o wysokim prawdopodobieństwie włączenia tylnego.

Ranking trafności zmiennych może być również przeprowadzony na ostatnim etapie procesu prognozowania, aby przetłumaczyć złożone modele prognozy na czynniki napędowe i bariery za pomocą SHAP.

W jaki sposób funkcja zapobiega nadmiernemu dopasowaniu, zwłaszcza w przypadku wielu zmiennych kandydujących?

Indico ogranicza nadmierne dopasowanie na kilka sposobów; podziały treningu/walidacji i walidację krzyżową, regularyzację (skurcz Lasso i Bayesa) oraz automatyczny wybór zmiennych, który usuwa słabe lub nadmiarowe predyktory.

Wskazówka: porównanie wyników w próbce i poza próbką pomaga wykryć nadmierne dopasowanie.

Czy mogę zobaczyć przezroczystość/wyjaśnialność, dlaczego zmienna została wybrana lub upuszczona?

Tak. Możesz sprawdzić diagnostykę, taką jak współczynniki, i wpływ na dokładność. Razem pokazują one, które zmienne zostały zachowane lub upuszczone, jak silnie wpływają na model i czy pomagają, czy szkodzą wydajności prognozy.

Jak zmienna selekcja wpływa na szybkość treningu i opóźnienie wnioskowania w skali?

Wybór zmiennej dodaje pewne koszty ogólne, ponieważ wymaga przetestowania i porównywania różnych podzbiorów predyktorów. W skali koszt ten jest równoważony przez mniejsze modele końcowe: mniej predyktorów przyspiesza szkolenie wybranego modelu i zmniejsza opóźnienie wnioskowania w produkcji.

Jakie przygotowanie danych jest wymagane (brakujące wartości, flagi sezonowe/świąteczne, kodowania kategoryczne), aby uzyskać najlepsze wyniki?

Indicio automatycznie wykrywa i traktuje brakujące wartości i sezonowość. Możesz także oznaczać i obsługiwać wartości odstające i efekty kalendarza, takie jak święta, aby jeszcze bardziej poprawić wydajność modelu.

Wybór zmiennej

Korelacja a zaawansowane metody

Najważniejsze cechy Indicio

Webinar - Identyfikacja wiodących wskaźników

Jak to działa

Często zadawane pytania

Poznaj więcej funkcji

Tworzenie modeli

Analiza scenariusza

Wyjaśnialne prognozowanie

Wirtualne demo

Zobacz naszą demonstrację klików