Plus d'indicateurs, de moins bonnes prévisions ? La vérité contre-intuitive derrière le système d'étoiles d'Indicio

Read time
10 min
CATEGORY
Leading indicators

La prévision était autrefois un jeu de chiffres : choisir une méthode, l'ajuster, livrer une estimation ponctuelle, passer à autre chose. Les équipes sérieuses ne fonctionnent plus ainsi. Le travail consiste désormais à déterminer quels signaux de marché comptent réellement, lesquels réagissent en premier, et s'ils apportent une réelle contribution lorsque vous les intégrez au bon modèle.

C'est la lacune qu'Indicio a été conçu pour combler. C'est une plateforme de prévision qui met les approches économétriques, d'IA et d'apprentissage automatique à la portée des équipes qui ne veulent pas écrire de code ou superviser des pipelines – conçue autour de la prévision automatisée, du backtesting, de l'analyse des indicateurs avancés et de résultats explicables. (indicio.com)

Une fonctionnalité accomplit discrètement une grande partie du travail : l'analyse d'influence des indicateurs par étoiles. Les indicateurs sont notés avec des étoiles afin que vous puissiez identifier, en un coup d'œil, ceux qui ont un réel poids prédictif. Plus d'étoiles, signal plus fort. Mais il y a une leçon moins évidente dans le système :

Plus d'étoiles, c'est mieux. Plus d'indicateurs, non.

Un modèle s'appuyant sur deux ou trois indicateurs très étoilés surpassera parfois un modèle rempli d'une douzaine d'indicateurs médiocres. Ce n'est pas un bug, c'est le principe.

Ce que fait l'analyse d'influence par étoiles

Elle classe les indicateurs avancés en fonction de leur contribution réelle à votre prévision. Plus d'étoiles signifie un signal fort. Moins d'étoiles, utile mais moins pertinent. Une étoile, marginal.

L'objectif n'est pas d'accumuler les indicateurs. C'est de trouver ceux qui améliorent constamment la prévision. La plupart des entreprises disposent de bien plus de facteurs potentiels qu'elles ne peuvent en utiliser – données macroéconomiques, signaux de demande, prix, chaîne d'approvisionnement, tendances de recherche, météo, sentiment, mouvements des concurrents. Certains anticipent la cible. D'autres sont en retard. Certains sont des doublons déguisés. La vue par étoiles permet de trier le tas et de faire ressortir les quelques entrées qui méritent leur place.

Pourquoi plus d'étoiles, c'est mieux

Une note en étoiles plus élevée signifie qu'un indicateur a montré une relation réelle et utile avec la variable que vous prévoyez – meilleur timing, un lien statistique plus étroit, une performance hors échantillon plus solide, un comportement plus cohérent.

Rien de tout cela n'est nouveau. La littérature statistique le dit depuis des décennies. L'article original de Tibshirani sur Lasso a démontré que la régularisation (shrinkage) et la sélection vous donnent un modèle à la fois interprétable et bien comporté. (OUP Academic) Dans les séries temporelles, les enjeux sont plus élevés : vous avez affaire au bruit, aux ruptures structurelles, à la saisonnalité et aux relations qui dérivent. Un bon indicateur avancé doit faire plus que s'aligner sur l'historique. Il doit aider à prédire des périodes que le modèle n'a pas encore vues.

Pourquoi deux ou trois indicateurs peuvent en battre dix

Cela semble contre-intuitif. Plus d'informations devraient signifier de meilleures prévisions, n'est-ce pas ? Pas vraiment. Les modèles de prévision privilégient le volume utile , pas le volume brut. Si vous empilez les indicateurs, plusieurs choses tournent mal :

  • Le bruit s'infiltre. Les indicateurs faibles ajoutent une variance que le modèle ne peut pas séparer du signal.
  • Le modèle surajuste. Il mémorise des schémas qui ne se répètent pas.
  • Les variables se chevauchent. La moitié de vos indicateurs disent la même chose, et le modèle les compte en double.
  • Vous manquez d'historique. Les séries courtes ne peuvent pas supporter un large ensemble de variables.
  • Vous perdez le fil. Trois entrées claires sont faciles à expliquer. Vingt entrées floues sont une boîte noire, même lorsqu'elles fonctionnent.

La recherche sur Lasso et les méthodes connexes aboutit toujours à la même conclusion : choisir les prédicteurs les plus informatifs rend les modèles à la fois plus précis et plus stables. (Proceedings of Machine Learning Research)

Pourquoi les modèles préfèrent un ensemble d'indicateurs plus restreint

De nombreux modèles de prévision évitent activement la complexité inutile, surtout dans les séries temporelles multivariées. Chaque nouvel indicateur ajoute un autre ensemble de relations à estimer.

Indicio offre une vaste bibliothèque : VAR, Structural VAR, VECM, VARX Lasso, VARMA, ARDL, VARX Lag Group Lasso, VAR Elastic Net, HVAR, BVAR, TVP BVAR avec volatilité stochastique, Markov Switching VAR, MIDAS, Random Forest VAR, et d'autres. Tous nécessitent des entrées rigoureuses. Les modèles VAR et BVAR se noient dans les paramètres une fois que vous les poussez dans des dimensions élevées ; la littérature sur les VAR bayésiens recommande la régularisation (shrinkage) pour maintenir la stabilité des estimations. (ScienceDirect) Lasso et Elastic Net résolvent le problème sous un angle différent : Lasso ramène les coefficients faibles à zéro, Elastic Net gère les prédicteurs corrélés. (OUP Academic)

C'est pourquoi un modèle pourrait se contenter d'une poignée d'indicateurs très étoilés. Il ne jette pas d'informations. Il protège la prévision des entrées faibles, redondantes ou instables.

Les étoiles rendent la prévision explicable

La précision seule ne suffit pas. Les équipes de prévision doivent expliquer ce qu'elles présentent à la direction. (indicio.com) Au lieu de pointer du doigt une boîte noire, vous pouvez désigner les indicateurs qui font le travail et expliquer pourquoi :

« La prévision s'améliore parce que le modèle a identifié trois indicateurs avancés solides avec une forte influence par étoiles. »

Cela résonne auprès des équipes financières, commerciales, de la chaîne d'approvisionnement et de la direction. Cela ressemble à un raisonnement, pas à de la magie.

Le backtesting est non négociable

Une note en étoiles ne devrait pas provenir d'une intuition. Les indicateurs doivent être testés par rapport à la performance historique réelle – backtesting, évaluation par origine glissante, validation croisée de séries temporelles. L'évaluation des séries temporelles doit respecter le temps : entraîner sur le passé, tester sur le futur, ne jamais simplement mélanger les données comme on le ferait en ML standard. L'évaluation par origine glissante est l'une des manières les plus fiables de simuler la prévision en temps réel. (Springer)

Un indicateur étoilé a du poids parce qu'il ne s'agit pas de « nous pensons que cela compte ». Il s'agit de « le modèle a vu ce signal dans l'historique et l'a trouvé utile ».

Quand plus d'indicateurs sont utiles

Moins n'est pas toujours mieux. Stock et Watson ont montré que lorsque de nombreux prédicteurs partagent une structure factorielle sous-jacente, vous pouvez les compresser en quelques facteurs et faire des prévisions à partir de ceux-ci. (stock.scholars.harvard.edu) La nuance : chaque indicateur supplémentaire doit apporter quelque chose de nouveau. Dix indicateurs qui suivent le même mouvement ne sont pas dix indicateurs, mais un seul signal avec redondance. Le système d'étoiles est la manière de faire la différence entre plus de données et de meilleures données.

Un flux de travail cohérent

  1. Jetez un large filet pour les indicateurs candidats.
  2. Faites ressortir ceux qui ont beaucoup d'étoiles.
  3. Testez les modèles par rapport à eux (backtest).
  4. Laissez le modèle graviter vers les signaux les plus forts et les plus stables.
  5. Utilisez la vue par étoiles lorsque vous devez expliquer la prévision.
  6. Actualisez à mesure que de nouvelles données arrivent.

Pourquoi c'est important pour l'entreprise

La prévision commerciale a tendance à échouer de deux manières : les équipes font trop confiance à leur intuition, ou elles surcompliquent le modèle avec des variables marginales. Indicio est conçu pour réduire les deux, associant des méthodes académiques sérieuses à la convivialité dont les équipes de prévision ont réellement besoin. (indicio.com) Pour les décideurs, le bénéfice est concret : une meilleure précision, une détection plus précoce des changements de marché, des prévisions que vous pouvez défendre en réunion, et moins de temps passé à analyser manuellement les indicateurs.

Le point à retenir

La prévision privilégie la qualité à la quantité. Un indicateur trois étoiles est précieux car il apporte un réel signal prédictif. Une prévision construite sur deux ou trois d'entre eux surpassera souvent une prévision construite sur une longue liste d'indicateurs faibles.

Plus d'étoiles, c'est mieux. Mais la meilleure prévision n'est pas celle qui contient le plus d'indicateurs. C'est celle qui contient les bons.

Découvrez d'autres articles de notre blog

Démo virtuelle

Consultez notre démo en un clic

Découvrez de première main la facilité et la précision de la plateforme de prévisions automatisée d'Indicio. Cliquez pour démarrer une démonstration virtuelle dès aujourd'hui et découvrez comment nos outils de pointe peuvent rationaliser votre processus de prise de décision.