El modelo de red neuronal artificial (ANN) multivariante es un modelo de aprendizaje automático que puede considerarse una versión multivariante del modelo neuronal univariado (consulte Avanzado: Neural). La diferencia obvia es que el modelo ANN es capaz de modelar varias series temporales juntas.
Para modelar un conjunto de kk serie temporal Y1,... , Reino UnidoY1, ... ,Ykutilizando una red neuronal, la p⋅kp⋅k los valores retrasados se utilizan como entradas y la red neuronal se entrena para explicar la p actualp valores de la serie temporal incluida. Al igual que en el caso univariado, se puede crear una previsión utilizando yt,... , yt−p+1yt, ... ,yt−p+1 como entradas para predecir yt+1yt+1. Tenga en cuenta que ahora estamos escribiendo ytytpara indicar el vector de kk valores en el momento tt, lo que significa que el modelo creará previsiones para todo variables incluidas. Luego, esto se puede repetir de manera recursiva utilizando como entrada los valores de solo pronóstico, creando un pronóstico de la longitud deseada.
A medida que aumenta el número de entradas y salidas de un modelo, también aumenta el tamaño requerido de las capas ocultas y, con ello, la complejidad del modelo. Esto plantea un desafío, ya que un modelo complejo siempre corre el riesgo de sobreajustarse a los datos. Para solucionar este problema, los datos se dividen en un conjunto de trenes y un conjunto de validación.
El modelo se entrena con los datos de entrenamiento utilizando el descenso de gradiente estocástico (SGD). Solo se utilizan algunas de las observaciones en cada iteración, lo que significa que después de un número determinado de iteraciones, el algoritmo SGD habrá analizado todos los datos. Cada uno de estos conjuntos de iteraciones se denomina época. Después de cada época, el modelo se utiliza para crear una previsión en el conjunto de validación y se calcula el error de previsión fuera de la muestra. El modelo también forma parte del proceso de capacitación que produce pronósticos dentro de la muestra, que se denominan valores ajustados, a partir de los cuales se puede calcular el error de pronóstico dentro de la muestra.
Esto generará dos series de errores de pronóstico, dentro y fuera de la muestra por época. En Signo se utiliza lo que se denomina parada temprana, que significa que cuando la falta de precisión de la muestra comienza a empeorar a lo largo de varias épocas, el proceso de entrenamiento se detiene y se considera que el modelo ha terminado.