Un modèle ARIMA se compose de trois parties distinctes, à savoir autorégressif (AR), intégré (I) et moyenne mobile (MA).
Un modèle autorégressif décrit la valeur actuelle en fonction d'un nombre fixe de valeurs passées (décalages). Désigne la valeur actuelle à l'instant tt comme Yt, un modèle autorégressif simple avec pp lags s'écrit comme

où αiest le coefficient de décalage je et test le terme d'erreur (c'est-à-dire la variation que le modèle) ne expliquer à l'instant tt). Par exemple, si notre variable Ytreprésente les ventes au cours de la période tt, le modèle ci-dessus suppose que les ventes du mois en cours sont fonction des ventes du pp les mois précédents.
La partie intégrée du modèle indique que les données sont remplacées par la différence entre chaque valeur et la valeur qui la précède. Les valeurs différentielles peuvent être écrites sous la forme

En combinant cela avec un modèle autorégressif, si, dans l'exemple ci-dessus, nous modélisions directement les ventes, nous modélisons maintenant la différence des ventes d'une période à l'autre en fonction du pp différences précédentes. Un modèle d'ordre supérieur peut être intégré, dans lequel les différences sont prises plusieurs fois.
Enfin, la partie relative à la moyenne mobile modélise les termes d'erreur « t ».tsous la forme d'une combinaison linéaire des termes d'erreur précédents. Cela peut pour qq les lags doivent être écrits comme suit

où μ est la moyenne des données et θiest le coefficient de la combinaison linéaire pour le décalage je. Cela peut être considéré comme une moyenne mobile pondérée au cours de la dernière q périodes. Si nous reprenons l'exemple des données de ventes, le modèle de moyenne mobile prend en compte les ventes par période t être une moyenne pondérée des q dernières périodes, plus une erreur aléatoire t.
En combinant ces trois composants, nous obtenons le modèle ARIMA qui est assez flexible dans la mesure où il peut modéliser de nombreuses séries chronologiques différentes. Lorsque l'on parle d'un modèle d'arima, il est assez courant de le décrire à l'aide du commande il a, c'est-à-dire quelles valeurs p et q dans les parties AR et MA, et combien de fois d il est intégré. Nous écrivons que nous avons un modèle ou un ordre ARIMA (p, d, q) (p,d,q). Les valeurs de ces trois paramètres déterminent la forme du modèle.
Nous pouvons écrire l'ARIMA complet (p,0, q) (p0,q) modéliser comme

Si un ordre d'intégration autre que 0 est utilisé, Ytles valeurs sont remplacées par δten conséquence des deux côtés de l'équation.
Dans Indicio, il est possible d'ajouter des événements à une prévision, ceux-ci sont modélisés comme variables exogènes ce qui signifie qu'ils suivent une trajectoire prédéterminée, même dans les périodes futures inconnues de la prévision. Un modèle ARIMA les soutient en les ajoutant sur le côté droit de l'équation, ce qui signifie que la valeur actuelle n'est pas seulement fonction de ses propres retards passés, mais également des valeurs contemporaines des variables exogènes. Si un événement extrême a eu un effet sur les données, un événement survenu à ce moment permettra au modèle d'attribuer la partie des données qui n'est pas expliquée par le modèle utilisant l'événement, ce qui donnera au modèle une meilleure opportunité de décrire la série chronologique telle qu'elle aurait été sans l'événement.
Pour ajuster un modèle ARIMA, les paramètres p, d et q doit être sélectionné. Dans Indicio, cela se fait en évaluant un grand nombre de modèles différents. Celui qui correspond le mieux aux données selon le critère d'information (AIC) d'Akaike est sélectionné, ce qui favorise un modèle simple par rapport à un modèle plus complexe, tout en tenant compte d'un bon ajustement du modèle.