Dans le monde dynamique des prévisions, le choix des bonnes variables, également appelées indicateurs avancés ou caractéristiques, peut faire toute la différence entre des prévisions précises et peu fiables. Notre outil avancé de sélection de variables vous permet d'identifier les variables les plus pertinentes et d'optimiser vos modèles de prévision en termes de précision, d'efficacité et de fiabilité.
De nombreuses organisations s'appuient sur la corrélation pour identifier les indicateurs avancés, mais cette approche ne permet souvent pas de produire des prévisions précises.
La corrélation mesure uniquement la relation linéaire entre deux variables, tandis que les méthodes avancées permettent d'évaluer les interactions entre plusieurs variables, de quantifier la contribution de chacune et de prendre en compte les effets de groupe. Cela conduit à une amélioration significative de la précision des prévisions.
Pour en savoir plus, consultez notre entretien avec le professeur Sune Karlsson, un contributeur clé à la recherche sur la sélection bayésienne des variables.
Dans ce webinaire enregistré, nous explorerons les avantages et les inconvénients des différentes méthodologies d'identification des indicateurs avancés. Nous aborderons des approches allant du traçage visuel et de l'analyse de corrélation aux techniques avancées de sélection de variables.
La sélection de variables est le processus qui consiste à choisir les variables (caractéristiques) que votre modèle doit réellement utiliser. Des éléments tels que les prix, les promotions, la météo, les vacances, les indicateurs macroéconomiques ou les signaux commerciaux personnalisés. Au lieu de fournir au modèle toutes les variables possibles, nous conservons les signaux qui ajoutent une valeur prédictive et supprimons ceux qui ajoutent du bruit.
Notre fonctionnalité propose plusieurs stratégies pour choisir les variables et les transformations. Il peut utiliser des algorithmes de recherche (en arrière, en avant, pas à pas) pour tester de nombreuses combinaisons de variables, le Lasso pour réduire les petits coefficients à zéro et des méthodes bayésiennes qui conservent les variables présentant une probabilité d'inclusion postérieure élevée.
Oui, vous pouvez modifier les résultats de sélection des variables si vous avez besoin de variables spécifiques dans vos modèles de prévision.
La multicolinéarité affecte principalement les modèles statistiques classiques, alors que les approches lasso et bayésienne la pénalisent déjà. Pour les modèles classiques, vous pouvez supprimer les variables signalées dans les avertissements de multicolinéarité ou laisser la sélection des variables les supprimer à l'aide d'un modèle sensible à la multicolinéarité.
Dans Indicio, la sélection de variables est appliquée uniquement aux modèles multivariés. Les modèles univariés ne peuvent inclure d'autres variables que par le biais de la modélisation exogène, qui nécessite des prévisions et introduirait un biais prospectif lors de l'évaluation puisque les valeurs réelles sont utilisées pour les variables exogènes.
Indicio propose plusieurs méthodes pour classer les variables par pertinence. Cela peut être fait soit dans la sélection des variables, où nous utilisons des algorithmes de recherche (en arrière, en avant, pas à pas) qui testent les combinaisons de variables, soit dans le Lasso pour réduire les petits coefficients à zéro, soit dans des méthodes bayésiennes qui conservent les variables présentant une probabilité d'inclusion postérieure élevée.
Il est également possible de classer la pertinence des variables à la dernière étape du processus de prévision afin de traduire des modèles de prévision complexes en moteurs et en obstacles à l'aide de SHAP.
Indicio limite le surajustement de plusieurs manières : fractionnement entre entraînement et validation et validation croisée, régularisation (rétrécissement de Lasso et bayésien) et sélection automatique de variables qui supprime les prédicteurs faibles ou redondants.
Conseil : la comparaison des résultats dans l'échantillon et hors échantillon permet de détecter le surajustement.
Oui Vous pouvez inspecter les diagnostics tels que les coefficients et leur impact sur la précision. Ensemble, ils indiquent quelles variables ont été conservées ou supprimées, dans quelle mesure elles influencent le modèle et si elles contribuent ou nuisent à la performance des prévisions.
La sélection de variables entraîne des frais supplémentaires, car elle doit tester et comparer différents sous-ensembles de prédicteurs. À grande échelle, ce coût est compensé par des modèles finaux plus petits : moins de prédicteurs accélèrent l'apprentissage du modèle choisi et réduisent la latence d'inférence en production.
Indicio détecte et traite automatiquement les valeurs manquantes et la saisonnalité. Vous pouvez également signaler et gérer les valeurs aberrantes et les effets de calendrier tels que les jours fériés afin d'améliorer encore les performances du modèle.
.gif)


Découvrez de première main la facilité et la précision de la plateforme de prévisions automatisée d'Indicio. Cliquez pour démarrer une démonstration virtuelle dès aujourd'hui et découvrez comment nos outils de pointe peuvent rationaliser votre processus de prise de décision.