MIDAS Lasso

Les modèles MIDAS (Mixed Data Sampling) utilisent des indicateurs à haute fréquence pour prédire une variable à basse fréquence. En appliquant une fonction de pénalité au lasso, les paramètres sont réduits à zéro, ce qui réduit le risque de sur-ajustement.

Le modèle Mixed Data Sampling Lasso (MIDAS Lasso) est l'un des modèles à fréquences mixtes disponibles dans Indicio.

Lors de la prévision d'une série chronologique à évolution plus lente, telle qu'une série mensuelle, trimestrielle ou annuelle, il peut être très avantageux d'utiliser des indicateurs à haute fréquence pour fournir des informations plus à jour sur l'évolution de l'économie.

Le modèle MIDAS le plus élémentaire est celui appelé MIDAS sans restriction qui, dans le cas d'une variable principale trimestrielle avec un seul indicateur mensuel, prendra la forme

où la variable indicatrice a l'indice t,mimifait référence à la ième dernière observation mensuelle disponible. Par exemple, si nous devions prévoir le deuxième trimestre et que les données mensuelles de l'indicateur étaient disponibles jusqu'en mai, nous ajouterions les observations de mars, avril et mai dans l'équation.

Dans certains cas, nous pouvons avoir une variable principale trimestrielle ou même annuelle, et peut-être des indicateurs hebdomadaires ou même quotidiens. Il en résulte un très grand nombre de paramètres à estimer, ce qui peut à la fois rendre les estimations instables et augmenter le risque de surajustement du modèle aux données. Le modèle MIDAS Lasso résout ce problème en appliquant une pénalité de Lasso lors de l'ajustement du modèle.

Mathématiquement, la pénalité de Lasso est un terme qui est ajouté à la fonction qui est optimisé lors de l'ajustement du modèle, pour un modèle de régression général avec pp coefficients, il peut être écrit sous la forme

βjdésigne le j'ième coefficient. La somme de toutes les valeurs absolues des coefficients est additionnée, puis cette somme est mise à l'échelle avec la valeur de λ. Cela a pour effet de ramener les estimations des paramètres à zéro (et certains paramètres à exactement zéro), ce qui signifie que nous obtiendrons un modèle plus clairsemé et plus conservateur.

Comment s'adapte Indicio à un Lasso MIDAS ?

La première étape pour ajuster un modèle MIDAS Lasso consiste à diviser les données en deux parties, appelées ensemble d'apprentissage et ensemble de test.

La deuxième étape consiste à ajuster le modèle à l'aide de l'ensemble d'observations d'entraînement pour un éventail de λ valeurs. Ces modèles sont ensuite utilisés pour créer des prévisions pour les points temporels de l'ensemble de tests. Ce processus est répété plusieurs fois et l'erreur de prévision moyenne est utilisée pour mesurer les performances du modèle en fonction de différentes valeurs de λ. À partir de là, la meilleure valeur donnant les prévisions les plus précises est sélectionnée.

Avec la solution optimale λ valeur sélectionnée, un modèle final adapté à toutes les données est créé à l'aide de cette valeur. Il en résulte un modèle avec une pénalité qui est réglé pour extraire le maximum de puissance prédictive des données, sans surajuster le modèle.

Explore more models

Within this category

More categories