MIDAS Sparse Group Penalty

Mixed Data Sampling (MIDAS) -modellen gebruiken hoogfrequente indicatoren om een laagfrequente variabele te voorspellen. Door een schaarse groepsstraffunctie toe te passen, worden de parameters naar nul gekrompen, waardoor het risico op overaanpassing wordt verkleind.

Het Mixed Data Sampling Sparse Group Lasso-model (MIDAS Sparse Group Lasso) is een van de modellen met gemengde frequentie die beschikbaar zijn in Indicio. Het lijkt op het MIDAS Lasso-model, maar in plaats van de standaard Lasso-straf te gebruiken, wordt een Lasso met een schaarse groep gebruikt die is afgestemd op de structuur van de gegevens.

Bij het voorspellen van een langzamere tijdreeks, zoals een maandelijkse, driemaandelijkse of jaarlijkse reeks, kan het een groot voordeel zijn om hoogfrequente indicatoren te gebruiken om meer actuele informatie te geven over hoe wat er in de economie gebeurt.

Het meest basale MIDAS-model is het model dat wordt aangeduid als Unrestricted MIDAS, dat in het geval van een driemaandelijkse hoofdvariabele met een enkele maandelijkse indicator de vorm aanneemt

waarbij de indicatorvariabele het subscript heeft t,miwaar mimiverwijst naar de laatste maandelijkse waarneming die beschikbaar is. Als we bijvoorbeeld het tweede kwartaal zouden voorspellen en we tot mei maandelijkse gegevens van de indicator beschikbaar hebben, zouden we de waarnemingen van maart, april en mei bij de vergelijking optellen.

In sommige gevallen hebben we misschien een hoofdvariabele per kwartaal of zelfs een jaar, en misschien wekelijkse of zelfs dagelijkse indicatoren. Dit resulteert in een zeer groot aantal parameters die moeten worden geschat, waardoor de schattingen instabiel kunnen worden en het risico kan toenemen dat het model te veel wordt aangepast aan de gegevens. Het MIDAS Sparse Group Lasso-model lost dit op door een Group Lasso-straf toe te passen bij de aanpassing van het model.

Wiskundig gezien is de Lasso Sparse Group-straf een term die wordt toegevoegd aan de functie die is geoptimaliseerd wanneer het model wordt aangepast, voor een algemeen regressiemodel met pp coëfficiënten het kan worden geschreven als

waar enX2 is de Frobenius norm van X die wordt gedefinieerd als

voor een matrix X, waarbij de tracetrace de som is van de diagonale ingangen van een vierkante matrix. Het voordeel van dit type straf is dat het hele groepen coëfficiënten tot nul kan verkleinen, waardoor andere groepen geen waarden meer hebben dan nul. Voor de MIDAS Sparse Group Lasso wordt dit gebruikt om alle vertragingen van specifieke variabelen als groepen te kunnen bestraffen, zodat het model het optimale effect kan selecteren dat een specifieke variabele zou moeten hebben op de hoofdvariabele.

Hoe past Indicio in een MIDAS Sparse Group Lasso?

De eerste stap om een MIDAS Sparse Group Lasso-model aan te passen, is het splitsen van de gegevens in twee delen, die de trainingsset en de testset worden genoemd.

De tweede stap is om het model aan te passen met behulp van de trainingsset van observaties voor een reeks verschillende λ waarden. Deze modellen worden vervolgens gebruikt om voorspellingen te maken voor de tijdstippen in de testset. Dit proces wordt meerdere keren herhaald en de gemiddelde voorspellingsfout wordt gebruikt als maatstaf voor hoe goed het model presteert bij verschillende waarden van λ. Hieruit wordt de beste waarde geselecteerd die de meest nauwkeurige voorspellingen geeft.

Met de optimale λ geselecteerde waarde, met behulp van die waarde wordt een definitief model gemaakt dat aan alle gegevens is aangepast. Dit resulteert in een model met een penalty dat is afgestemd om de maximale voorspellende kracht uit de gegevens te halen, zonder het model te veel aan te passen.

Explore more models

Within this category

More categories