Een ARIMA-model bestaat uit drie verschillende onderdelen, namelijk autoregressief (AR), geïntegreerd (I) en voortschrijdend gemiddelde (MA).
Een autoregressief model beschrijft de huidige waarde als functie van een vast aantal waarden uit het verleden (vertragingen). Aanduiding van de huidige waarde op tijdstip tt zoals Yt, een eenvoudig autoregressief model met pp lags is geschreven als

waar αiis de coëfficiënt voor lag ik en αtis de foutterm (d.w.z. de variatie die het model doet niet leg het op tijd uit tt). Als onze variabele bijvoorbeeld Ytvertegenwoordigt de verkoop in tijdsperiode tt, gaat het bovenstaande model ervan uit dat de verkoop in de huidige maand een functie is van de verkoop in de pp voorgaande maanden.
Het geïntegreerde deel van het model geeft aan dat de gegevens worden vervangen door het verschil tussen elke waarde en de waarde ervoor. De verschillende waarden kunnen worden geschreven als

De combinatie van dit met een autoregressief model betekent dat als we in het bovenstaande voorbeeld de verkoop rechtstreeks zouden modelleren, we nu in plaats daarvan het verschil in verkoop van periode tot periode modelleren als een functie van de pp eerdere verschillen. Een model kan van een hogere orde worden geïntegreerd, waarbij de verschillen meerdere keren worden meegenomen.
Ten slotte is het voortschrijdend gemiddelde deel het modelleren van de fouttermen αtαtals een lineaire combinatie van de vorige fouttermen. Dit kan voor qq vlaggen worden geschreven als

waar μ is het gemiddelde van de gegevens en □ iis de coëfficiënt in de lineaire combinatie voor lag ik. Dit kan worden gezien als een gewogen voortschrijdend gemiddelde over de laatste q periodes. Als we opnieuw het voorbeeld van de verkoopgegevens bekijken, houdt het voortschrijdend gemiddelde model rekening met de verkoop in de periode t om een gewogen gemiddelde te zijn van de q laatste periodes, plus een willekeurige fout αt.
Als we deze drie componenten samenvoegen, krijgen we het ARIMA-model dat vrij flexibel is omdat het veel verschillende tijdreeksen kan modelleren. Bij het bespreken van een arima-model is het vrij gebruikelijk om het te beschrijven met behulp van de orde het heeft, wat betekent welke waarden p en q in de AR- en MA-onderdelen zitten, en hoe vaak d het is geïntegreerd. We schrijven dat we een ARIMA-model of -bestelling hebben (p, d, q) (p,d,q). De waarden van deze drie parameters bepalen de vorm van het model.
We kunnen de volledige ARIMA schrijven (p,0, q) (p,0,q) model als

Als een andere integratieorder dan 0 wordt gebruikt, Ytwaarden worden vervangen door δtdus aan beide kanten van de vergelijking.
In Indicio is het mogelijk om gebeurtenissen toe te voegen aan een voorspelling, deze worden gemodelleerd als exogene variabelen wat betekent dat ze een vooraf bepaald pad volgen, zelfs in de onbekende toekomstige perioden van de voorspelling. Een ARIMA-model ondersteunt deze door ze aan de rechterkant van de vergelijking op te tellen, wat betekent dat de huidige waarde niet alleen een functie is van de eigen vertragingen in het verleden, maar ook van de hedendaagse waarden van de exogene variabelen. Als een extreme gebeurtenis een effect had op de gegevens, zal een gebeurtenis op dit moment het model in staat stellen om het deel van de gegevens toe te wijzen dat niet wordt verklaard door het model dat de gebeurtenis gebruikt, waardoor het model een betere gelegenheid krijgt om de tijdreeks te beschrijven zoals deze er zonder de gebeurtenis uit zou hebben gezien.
Om in een ARIMA-model te passen, moeten de parameters p, d en q moet worden geselecteerd. In Indicio wordt dit gedaan door een groot aantal verschillende modellen te evalueren. Het model dat het beste bij de gegevens past volgens het informatiecriterium (AIC) van Akaike is geselecteerd. Dit geeft de voorkeur aan een eenvoudig model boven een ingewikkelder model, maar zorgt nog steeds voor een goede pasvorm van het model.