8 najlepszych narzędzi prognozowania ekonometrycznego dla analityków danych

Read time
4 min
CATEGORY
Forecasting software

Prognozowanie zmiennych ekonomicznych, takich jak PKB, inflacja, popyt, ceny surowców i ryzyko finansowe, zawsze było kluczowe dla polityki, planowania i strategii. Ale w ostatnich latach oprogramowanie do prognozowania zmieniło tę dziedzinę. Automatyzacja, dostęp do dużych i różnorodnych źródeł danych, uczenie maszynowe i metody bayesowskie, zespoły modeli i wdrażanie w czasie rzeczywistym są obecnie powszechne. Ustrukturyzowany proces oceny testowania modeli, przechowywanie danych, porównywanie prognoz wydajności i monitorowanie dryfu ma zasadnicze znaczenie dla identyfikacji wysokich wyników i zapewnienia ciągłego doskonalenia. Co więcej, nie wystarczy już zbudować jeden model i wdrożyć; najlepsze zespoły stale wdrażają nowe modele i metody prognozowania, dostosowują się do nowych danych, dostosowują zestawy funkcji/wskaźników, ponownie wybierają zmienne, przekwalifikowują i integrują informacje zwrotne.

W tym kontekście oto 8 najlepszych narzędzi prognozowania ekonometrycznego dla analityków danych, ocenianych pod względem mocnych i słabych stron.

1. Wskaźnik

Wprowadzenie
Indicio to nowoczesna zautomatyzowana platforma prognozowania mająca na celu połączenie zaawansowanych metod ekonometrycznych, uczenia maszynowego i badań statystycznych z potrzebami prognozowania biznesowego lub politycznego. Zapewnia interfejs bez kodu, aby analitycy bez doktoratu mogli budować, porównywać i wdrażać modele prognozy. Za kulisami Indicio integruje dużą liczbę źródeł danych (na przykład Macrobond, Bloomberg, Refinitiv, FRED, Eurostat i wiele innych) do wprowadzania wskaźników. Algorytm wyboru zmiennego lub wyszukiwania pomaga zidentyfikować, które wskaźniki zewnętrzne są istotne. Posiada bogatą bibliotekę modeli: statystycznych, ML, Bayesowskich, regresji karalnych, modeli mieszanych szeregów częstotliwości i szeregów czasowych itp. Obsługuje również zespoły modeli; ważenie modeli razem, analizę scenariuszy, wykrywanie wskaźników wiodących i testowanie wsteczne. Automatyzuje większość prac modelarskich, uwalniając analityków do skupienia się na interpretacji, wdrażaniu i monitorowaniu.

Plusy

  1. Bardzo silna automatyzacja i łatwość obsługi: narzędzia bez kodu oznaczają szybką iterację, dostępną dla analityków spoza doktoratu.
  2. Szeroka biblioteka modeli statystycznych, ML, bayesowskich, mieszanych i karanych modelów+zdolność do ich ważenia/zestawiania, a także zintegrowana metodologia wyboru zmienny/analiza wskaźników wiodących.
  3. Zintegrowany dostęp do wielu zewnętrznych źródeł danych makroekonomicznych (Macrobond, Bloomberg, Refinitiv, FRED, Eurostat itp.), co pomaga w budowaniu bogatszych zestawów funkcji.

Wady

  1. Droższe niż narzędzia open source: koszty licencjonowania/subskrypcji mogą być wysokie w zależności od skali.
  2. Ograniczona możliwość kodowania własnych modeli: jesteś ograniczony do biblioteki dostarczonych modeli; niestandardowe lub nowatorskie specyfikacje modeli mogą nie być możliwe.
  3. Wymaga połączenia z Internetem: ponieważ źródła danych, obliczenia, interfejs są oparte na sieci, offline lub środowiska o niskiej łączności są trudniejsze do obsługi.

2. eViews

Wprowadzenie
eViews to wieloletni komercyjny pakiet oprogramowania ekonometrycznego, bardzo popularny w badaniach ekonomicznych, bankach centralnych, doradztwie i środowisku akademickim. Oferuje bogaty zestaw narzędzi do analizy szeregów czasowych, danych panelowych, przekroju poprzecznego, prognozowania, strukturalnego modelowania ekonometrycznego, symulacji, testowania hipotez itp. Interfejs użytkownika jest bardziej graficzny i oparty na menu, ale obsługuje również skrypty i uruchamiania wsadowe. W swoich najnowszych wersjach (eViews 14 itp.) dodał ulepszone możliwości: narzędzia regulacji sezonowej, kwantowe oszacowanie ARDL, ulepszenia MIDAS/GARCH, testy przerw strukturalnych itp. Jest silny, gdy potrzebujesz zarówno tradycyjnego modelowania ekonometrycznego (VAR, ARIMA, state space, panel), jak i dobrego zarządzania danymi, narzędzi diagnostycznych i narzędzi oceny prognozowania.

Plusy

  1. Dojrzałe, stabilne narzędzie z wieloma wdrożonymi metodami ekonometrycznymi (szeregi czasowe, ARIMA, VAR, GARCH, modele strukturalne, przestrzeń stanów itp.).
  2. Silne narzędzia diagnostyczne, testowe i ewaluacyjne (np. testy przerw strukturalnych, ocena prognozy, uśrednianie prognoz).
  3. Dobry dla użytkowników, którzy chcą zarówno łatwości opartej na GUI /menu, jak i skryptów/automatyzacji; również dobre wsparcie, dokumentacja, jakość publikacji.

Wady

  1. Komercyjne: opłaty licencyjne mogą być znaczne, szczególnie dla mniejszych organizacji lub niezależnych analityków.
  2. Mniej elastyczny/mniej „krwawiąca krawędź” pod względem integracji nowych technik ML /głębokiego uczenia w porównaniu z niektórymi nowszymi narzędziami.
  3. Głównie zorientowany na system Windows; może być mniej przyjazny dla wdrażania lub integracji w chmurze/pociągach produkcyjnych w porównaniu z narzędziami Python/R typu open source.

3. Prognoza R+/Tidyverse/Pakiety Bayesowskie

Wprowadzenie
R pozostaje jednym z najpotężniejszych środowisk prognozowania ekonometrycznego. Z pakietami takimi jak prognozy, bajka, cibble, prorok, bsts, Wars, coda, oraz rosnąca liczba bayesowskich i karanych pakietów regresji, R zapewnia analitykom elastyczność, przejrzystość i pełną kontrolę nad specyfikacją modelu. Analitycy mogą łączyć szeregi czasowe, regresję przyczynową, modele przestrzeni stanów, modele hierarchiczne itp. Ocena modelu, diagnostyka szczątkowa, walidacja krzyżowa i niepewność prognozowania są dobrze wspierane. Ponieważ jest to open source, można stale integrować nowe metody badawcze.

Plusy

  1. Bardzo elastyczny i rozszerzalny: możesz kodować prawie wszystko, dostosowywać modele, testować najnowsze pomysły badawcze.
  2. Bogate wsparcie społeczności, zasoby edukacyjne, wiele istniejących pakietów; przejrzystość metod oznacza łatwiejsze do zrozumienia zachowanie.
  3. Koszt: bezpłatny; z możliwością lokalnego działania (brak zależności od Internetu lub zewnętrznych płatnych usług, poza źródłami danych).

Wady

  1. Stroma krzywa uczenia się: wymaga programowania, wiedzy statystycznej; zarządzanie zależnościami, wersjonowanie, odtwarzalność może wymagać wysiłku.
  2. Wydajność może ulec pogorszeniu przy bardzo dużych zbiorach danych lub bardzo złożonych modelach (chyba że zoptymalizować/używa szybkich pakietów/backendów C ++).
  3. Wdrażanie/planowanie/monitorowanie musi być skonfigurowane samodzielnie; mniej funkcji korporacyjnych „po wyjęciu z pudełka” niż niektóre narzędzia komercyjne.

4. Python/ Statsmodels/Prophet/ Inne narzędzia ekosystemu Pythona

Wprowadzenie
Python stał się standardowym narzędziem do analizy i prognozowania danych. Biblioteka Statsmodels obsługuje modele SARIMAX, VAR, State Space, Unobservated Components itp. Prophet (by Meta) dodaje automatyczną procedurę prognozowania odpowiednią dla szeregów czasowych z sezonowością i trendem i jest dość odporna na brakujące dane i wartości odstające. Istnieją również nowsze biblioteki, takie jak Darts, scikit-prognosis (statsprognosis), pytorch/tensorflow/sklearn pociągi dla ML lub prognozowanie głębokiego uczenia. Silny ekosystem Pythona (pobieranie danych, rurociągi ML, wizualizacja, wdrażanie) sprawia, że jest on szczególnie przydatny, gdy prognozy muszą być zintegrowane z systemami produkcyjnymi.

Plusy

  1. Elastyczność: możesz łączyć metody ekonometryczne i ML, integrować z potokami danych, chmurą itp.
  2. Silne wsparcie open source, wiele bibliotek; duża społeczność.
  3. Dobry do wdrażania: obsługa modeli, interfejsy API REST, konteneryzacja itp. Łatwiej dzięki Pythonowi.

Wady

  1. Podobnie jak w R, potrzebujesz umiejętności programowania; skonfigurowanie powtarzalnych, dobrze przetestowanych systemów prognoz wymaga wysiłku.
  2. Niektóre metody ekonometryczne (zwłaszcza zaawansowane) mogą być mniej dopracowane w porównaniu do dedykowanego oprogramowania ekonometrycznego.
  3. W przypadku danych niesezonowych/niestandardowych założenia Propheta mogą nie pasować; może być wymagane ręczne strojenie lub bardziej złożone modele.

5. RATS (analiza regresji szeregów czasowych)

Wprowadzenie
RATS to dobrze znane oprogramowanie do ekonometrii/szeregów czasowych firmy Estima. Ma silne dziedzictwo w akademickiej i stosowanej pracy ekonometrycznej. Obsługuje ARIMA, VAR, modele funkcji transferu/regresji dynamicznej, analizę spektralną, modele stanowo-przestrzenne, GARCH/ARCH itp. Jest oparty na poleceniach, ale ma również możliwości graficzne, funkcje importu/eksportu danych, silną diagnostykę. Jest używany przez praktyków, którzy potrzebują solidnego prognozowania szeregów czasowych z nieco większą kontrolą i mocą niż podstawowe narzędzia.

Plusy

  1. Szeroki wachlarz modeli ekonometrycznych, zwłaszcza zorientowanych na szeregi czasowe, z ustalonymi metodami.
  2. Dobry do precyzyjnego, niestandardowego budowania modeli i szczegółowej diagnostyki.
  3. Sprawdzone osiągnięcia; niezawodny, stabilny.

Wady

  1. Zastrzeżony/licencjonowany; koszt może być barierą.
  2. Mniej „efektowny” lub wygodny dla osób przyzwyczajonych do GUI lub nowoczesnych desek rozdzielczych; bardziej stroma krzywa uczenia się.
  3. Konfiguracja integracji/wdrażania może być bardziej ręczna w porównaniu z platformami prognozowania w chmurze/SaaS.

6. SHAZAM

Wprowadzenie
SHAZAM to kolejny starszy, ale wciąż używany pakiet ekonometryczny/statystyczny, szczególnie w środowisku akademickim i specjalistycznych dziedzinach. Obsługuje szacowanie, testowanie, symulację, prognozowanie wielu rodzajów modeli ekonometrycznych. Przez dziesięciolecia opracował funkcje przekroju poprzecznego, szeregów czasowych, szacowania systemów i tym podobnych. Chociaż może być mniej „krzykliwy” niż nowsze narzędzia, jego stabilność, dobrze udokumentowana funkcjonalność i długa historia sprawiają, że jest to opcja dla tych, którzy potrzebują przejrzystych, dokładnie przetestowanych prognoz ekonometrycznych.

Plusy

  1. Silny w podstawowej ekonometrii: symulacje, testowanie hipotez, różne metody szacowania itp.
  2. Dobra dokumentacja i długa historia: dojrzały, dobrze przetestowany.
  3. Może być mniej zasobochłonna lub prostsza instalacja niż bardzo duże, bogate w funkcje systemy.

Wady

  1. Interfejs/wrażenia użytkownika mogą wydawać się nieco przestarzałe.
  2. Ograniczone nowoczesne funkcje (np. mniej natywnego ML, mniej automatycznego wyboru zmiennych) w porównaniu z nowszymi pakietami.
  3. Mniejszy impuls społecznościowy/mniej najnowszych innowacji w porównaniu z ekosystemami R lub Python.

7. Gretl

Wprowadzenie
Gretl („Gnu Regression, Econometrics and Time-Series Library”) to pakiet ekonometryczny typu open source, popularny wśród studentów, badaczy akademickich i analityków. Obsługuje szeroką gamę szeregów czasowych, przekroju poprzecznego, metod danych panelowych, skryptów użytkownika, grafiki itp. Ponieważ jest darmowy i stosunkowo lekki, jest dobrym rozwiązaniem do prototypowania modeli, nauczania, małych projektów badawczych lub zadań prognozowania na wczesnym etapie.

Plusy

  1. Bezpłatne, otwarte źródło. Dobre pokrycie podstawowych metod ekonometrycznych.
  2. Lekki; łatwy w instalacji i uruchomieniu; przydatny do nauczania lub dla analityków, którzy chcą wypróbować modele bez ciężkiej infrastruktury.
  3. Przejrzysty; dobry do uczenia się i walidacji metod.

Wady

  1. Mniej nadaje się do bardzo dużych zbiorów danych lub wdrażania produkcji; mniej wbudowanych nowoczesnych narzędzi ML-/ Bayesowskich.
  2. Mniej zautomatyzowane przepływy pracy (wybór zmiennych, zespół itp.) niż narzędzia SaaS.
  3. Mniej polski/mniej integracji z zewnętrznymi źródłami danych lub pulpitami nawigacyjnymi.

8. SAS/STATA/Pozostałe (Połączone)

Wprowadzenie
Oprogramowanie takie jak Stata a SAS Są również podstawowymi elementami ekonometrii, statystyki i prognozowania. Są to narzędzia komercyjne, które cieszą się dużym zaufaniem w pracy akademickiej, politycznej i korporacyjnej. Zapewniają rozbudowane biblioteki modeli (liniowe, nieliniowe, panelowe, szeregi czasowe), diagnostykę, a także skryptów, automatyzację i często dobre wsparcie i społeczność użytkowników. Wiele organizacji używa ich, gdy muszą opracować rzetelne prognozy, przeprowadzić analizę scenariuszy lub potrzebować zgodności z przepisami/odtwarzalnością.

Plusy

  1. Silne wsparcie handlowe, stabilność, dokumentacja. Dobry do raportowania regulowanego lub oficjalnego.
  2. Bogate zestawy narzędzi; wiele wdrożonych metod; mocna diagnostyka.
  3. Dobrze zintegrowany ze źródłami danych, raportowaniem, czasami skryptami GUI +.

Wady

  1. Koszt: licencjonowanie, wsparcie, szkolenie mogą być kosztowne.
  2. Czasami mniej zwinny/wolniej dostosowywać nowsze rzeczy ML, bayesowskie, głębokie uczenie się lub zespołowe, chyba że używane są dodatki lub integracje zewnętrzne.
  3. Może mieć bardziej stromą krzywą uczenia się; być może również mniej przyjazny dla wdrażania dla analityków „samoobsługowych” w porównaniu z nowszymi platformami SaaS.

Jak wybrać spośród nich i ciągłe doskonalenie

Oto kryteria, które warto zastosować przy ocenie narzędzi prognozowania:

  • Różnorodność modeli i elastyczność: Czy możesz użyć wielu rodzajów modeli (szeregi czasowe, regresja przyczynowa, bayesowska, ML)? Czy możesz określić lub zakodować modele niestandardowe?
  • Integracja danych: Możliwość pobierania zewnętrznych danych makro/ekonomicznych, wiodących wskaźników, źródeł w czasie rzeczywistym lub bliskich w czasie rzeczywistym.
  • Automatyzacja i łatwość obsługi: Dla użytkowników, którzy nie są ekspertami w teorii ekonometrycznej, ile konfiguracji (wybór zmiennych, sprawdzanie stacjonarności, wykrywanie przerw) jest zautomatyzowana?
  • Ważenie zestawów/modelu: Prognozy często działają lepiej podczas łączenia modeli; pomaga oprogramowanie obsługujące uśrednianie modeli lub zestawianie modeli.
  • Diagnostyka i ocena: Testowanie wsteczne, próba wstrzymania, testy statystyczne (Diebold-Mariano itp.), walidacja krzyżowa, wykrywanie przerw itp.
  • Wdrożenie i produkcja: Czy prognozy mogą być eksportowane, obsługiwane, planowane, monitorowane pod kątem dryfu?
  • Koszt, licencjonowanie i wsparcie: Otwarte źródło vs komercyjne; społeczność kontra wsparcie dostawców; dokumentacja i szkolenia.

Ponadto najlepsze praktyki obejmują ciągłą ocenę dokładności prognoz w czasie, przekwalifikowanie lub zastępowanie modeli w miarę zmiany danych lub reżimów, dodawanie nowych wskaźników i ewentualnie łączenie prognoz z wielu narzędzi lub typów modeli.

Poznaj więcej naszych postów na blogu

Wirtualne demo

Zobacz naszą demonstrację klików

Poznaj łatwość i dokładność automatycznej platformy prognozowania Indicio z pierwszej ręki. Kliknij, aby rozpocząć wirtualną wersję demonstracyjną już dziś i dowiedzieć się, w jaki sposób nasze najnowocześniejsze narzędzia mogą usprawnić proces podejmowania decyzji.