MIDAS Sparse Group Penalty

Modele próbkowania danych mieszanych (MIDAS) wykorzystują wskaźniki wysokiej częstotliwości do przewidywania zmiennej niskiej częstotliwości. Dzięki zastosowaniu rzadkiej funkcji kary grupowej parametry są zmniejszane do zera, zmniejszając ryzyko nadmiernego dopasowania.

Model Mixed Data Sampling Sparse Group Lasso (MIDAS Sparse Group Lasso) jest jednym z modeli mieszanych częstotliwości dostępnych w Indicio. Jest podobny do modelu MIDAS Lasso, ale zamiast używać podstawowej kary Lasso, używa rzadkiej grupy Lasso, która jest dostosowana do struktury danych.

Prognozując wolniej poruszające się szeregi czasowe, takie jak miesięczne, kwartalne lub roczne, wielką korzyścią może być użycie wskaźników wysokiej częstotliwości w celu dostarczenia bardziej aktualnych informacji o tym, jak dzieje się w gospodarce.

Najbardziej podstawowym modelem MIDAS jest ten określany jako MIDAS Unlimited, który w przypadku kwartalnej zmiennej głównej z pojedynczym wskaźnikiem miesięcznym przyjmie formę

gdzie zmienna wskaźnikowa ma indeks dolny t,migdzie mimiodnosi się do ostatniej dostępnej miesięcznej obserwacji. Na przykład, gdybyśmy mieli prognozować II kwartał i mamy miesięczne dane wskaźnika dostępne do maja, dodalibyśmy do równania obserwacje z marca, kwietnia i maja.

W niektórych przypadkach możemy mieć kwartalną lub nawet roczną zmienną główną, a być może wskaźniki tygodniowe lub nawet dzienne. Powoduje to bardzo dużą liczbę parametrów do oszacowania, co może zarówno sprawić, że szacunki będą niestabilne, jak i zwiększać ryzyko nadmiernego dopasowania modelu do danych. Model MIDAS Sparse Group Lasso rozwiązuje to, stosując karę Group Lasso podczas dopasowywania modelu.

Matematycznie kara Lasso Sparse Group jest terminem, który jest dodawany do funkcji, która jest zoptymalizowana podczas dopasowania modelu, dla ogólnego modelu regresji z pp współczynniki można zapisać jako

gdzie iX2 jest Frobeniusz norma X który jest zdefiniowany jako

dla macierzy X, gdzie tracetrace jest sumą przekątnych wpisów macierzy kwadratowej. Zaletą tego rodzaju kary jest to, że jest w stanie zmniejszyć całe grupy współczynników do zera, pozostawiając inne grupy o wartościach niezerowych. W przypadku MIDAS Sparse Group Lasso służy to do karania wszystkich opóźnień określonych zmiennych jako grup, umożliwiając modelowi wybór optymalnego efektu, jaki konkretna zmienna powinna mieć na zmienną główną.

Jak Indicio pasuje do MIDAS Sparse Group Lasso?

Pierwszym krokiem w kierunku dopasowania modelu MIDAS Sparse Group Lasso jest podzielenie danych na dwie części, które są określane jako zestaw treningowy i zestaw testowy.

Drugim krokiem jest dopasowanie modelu przy użyciu zestawu obserwacji treningowych dla szeregu różnych λ wartości. Modele te są następnie wykorzystywane do tworzenia prognoz dla punktów czasowych w zestawie testowym. Proces ten jest powtarzany wielokrotnie, a średni błąd prognozy jest używany jako miara tego, jak dobrze działa model, biorąc pod uwagę różne wartości λ. Z tego wybierana jest najlepsza wartość dająca najdokładniejsze prognozy.

Z optymalnym λ wybrana wartość, przy użyciu tej wartości tworzony jest ostateczny model dopasowany do wszystkich danych. Powoduje to model z karą, która jest dostrojona tak, aby wyodrębnić maksymalną moc predykcyjną danych, bez nadmiernego dopasowania modelu.

Explore more models

Within this category

More categories