ANN

A rede neural artificial (ANN) é um modelo inspirado em redes neurais biológicas, como o cérebro humano. O modelo é um exemplo de um modelo de aprendizado de máquina mais esparso em comparação com o LSTM e o GRU. Isso diminui o risco de sobreajuste e, ao mesmo tempo, oferece mais flexibilidade do que um modelo linear. O ANN é treinado em dados usando variantes de gradiente descendente, como AdaGrad e ADAM.

O modelo multivariado de Rede Neural Artificial (ANN) é um modelo de aprendizado de máquina que pode ser visto como uma versão multivariada do modelo neural univariado (consulte Avançado: Neural). A diferença óbvia é que o modelo ANN é capaz de modelar várias séries temporais juntas.

Séries temporais multivariadas e redes neurais

Para modelar um conjunto de kk série temporal Y1,... , Reino UnidoY1, ... ,Simusando uma rede neural, o p⋅kpk valores defasados são usados como entradas e a rede neural é treinada para explicar o p atualp valores da série temporal incluída. Assim como no caso univariado, uma previsão pode então ser criada usando yt,... , yt−p+1yt, ... ,ytp+1 como entradas para prever yt+1yt+1. Observe que agora estamos escrevendoytpara denotar o vetor de kk valores no tempo tt, o que significa que o modelo criará previsões para tudo variáveis incluídas. Isso pode então ser repetido de forma recursiva usando apenas os valores previstos como entrada, criando uma previsão do comprimento desejado.

Como o Indicio se encaixa em um modelo ANN?

À medida que o número de entradas e saídas de um modelo aumenta, também aumenta o tamanho necessário das camadas ocultas e, com elas, a complexidade do modelo. Isso representa um desafio, pois um modelo complexo sempre corre o risco de ser ajustado demais aos dados. Para remediar isso, os dados são divididos em um conjunto de trens e um conjunto de validação.

O modelo é treinado com base nos dados de treinamento usando Stochastic Gradient Descent (SGD). Apenas algumas das observações são usadas em cada iteração, o que significa que, após um determinado número de iterações, o algoritmo SGD terá examinado todos os dados. Cada um desses conjuntos de iterações é chamado de época. Após cada época, o modelo é usado para criar uma previsão no conjunto de validação e o erro de previsão fora da amostra é calculado. O modelo também faz parte do processo de treinamento, produzindo previsões na amostra, chamadas de valores ajustados, a partir dos quais o erro de previsão na amostra pode ser calculado.

Isso criará duas séries de erros de previsão, dentro e fora da amostra por época. A Indicio aplica algo chamado parada precoce, o que significa que quando a falta de precisão da amostra começa a piorar em várias épocas, o processo de treinamento é interrompido e o modelo é considerado concluído.

Explore more models

Within this category

More categories