Saturday 14 April 2018

Autoregressive moving average concept


Um RIMA significa os modelos da Média Móvel Integrada Autoregressive. Univariada (vetor único) ARIMA é uma técnica de previsão que projeta os valores futuros de uma série baseada inteiramente em sua própria inércia. Sua principal aplicação é na área de previsão de curto prazo que requer pelo menos 40 pontos de dados históricos. Funciona melhor quando seus dados exibem um padrão estável ou consistente ao longo do tempo com uma quantidade mínima de exceções. Às vezes chamado Box-Jenkins (depois dos autores originais), o ARIMA é geralmente superior às técnicas de suavização exponencial quando os dados são razoavelmente longos e a correlação entre as observações passadas é estável. Se os dados forem curtos ou altamente voláteis, algum método de suavização poderá ter um melhor desempenho. Se você não tiver pelo menos 38 pontos de dados, deve considerar algum outro método além do ARIMA. O primeiro passo na aplicação da metodologia ARIMA é verificar a estacionariedade. A estacionariedade implica que a série permaneça em um nível razoavelmente constante ao longo do tempo. Se houver uma tendência, como na maioria dos aplicativos comerciais ou econômicos, seus dados NÃO são estacionários. Os dados também devem mostrar uma variação constante em suas flutuações ao longo do tempo. Isto é facilmente visto com uma série que é fortemente sazonal e cresce a um ritmo mais rápido. Nesse caso, os altos e baixos da sazonalidade se tornarão mais dramáticos ao longo do tempo. Sem essas condições de estacionariedade, muitos dos cálculos associados ao processo não podem ser calculados. Se uma plotagem gráfica dos dados indicar não-estacionariedade, você deverá diferenciar a série. A diferenciação é uma excelente maneira de transformar uma série não estacionária em uma estacionária. Isso é feito subtraindo a observação no período atual da anterior. Se essa transformação é feita apenas uma vez para uma série, você diz que os dados foram primeiro diferenciados. Esse processo essencialmente elimina a tendência se sua série está crescendo a uma taxa razoavelmente constante. Se estiver crescendo a uma taxa crescente, você pode aplicar o mesmo procedimento e diferenciar os dados novamente. Seus dados seriam então diferenciados em segundo lugar. Autocorrelações são valores numéricos que indicam como uma série de dados está relacionada a si mesma ao longo do tempo. Mais precisamente, ele mede a intensidade com que os valores de dados em um intervalo especificado de períodos estão correlacionados entre si ao longo do tempo. O número de períodos separados é geralmente chamado de atraso. Por exemplo, uma autocorrelação no desfasamento 1 mede como os valores de 1 período separados são correlacionados entre si ao longo da série. Uma autocorrelação no atraso 2 mede como os dados separados por dois períodos estão correlacionados ao longo da série. Autocorrelações podem variar de 1 a -1. Um valor próximo de 1 indica uma correlação positiva alta, enquanto um valor próximo de -1 implica uma alta correlação negativa. Essas medidas são mais frequentemente avaliadas por meio de gráficos gráficos chamados correlagramas. Um correlograma plota os valores de autocorrelação para uma determinada série em diferentes lags. Isso é chamado de função de autocorrelação e é muito importante no método ARIMA. A metodologia ARIMA tenta descrever os movimentos em uma série temporal estacionária como uma função do que é chamado de parâmetros autorregressivos e de média móvel. Estes são referidos como parâmetros AR (autoregessivo) e parâmetros MA (médias móveis). Um modelo AR com apenas 1 parâmetro pode ser escrito como. X (t) A (1) X (t-1) E (t) onde X (t) séries temporais sob investigação A (1) parâmetro autorregressivo de ordem 1 X (t-1) série temporal defasada 1 período E (t) o termo de erro do modelo Isto significa simplesmente que qualquer dado valor X (t) pode ser explicado por alguma função do seu valor anterior, X (t-1), mais algum erro aleatório inexplicável, E (t). Se o valor estimado de A (1) fosse 0,30, então o valor atual da série estaria relacionado a 30 de seu valor 1 período atrás. Claro, a série pode estar relacionada a mais do que apenas um valor passado. Por exemplo, X (t) A (1) X (t-1) A (2) X (t-2) E (t) Isso indica que o valor atual da série é uma combinação dos dois valores imediatamente anteriores, X (t-1) e X (t-2), mais algum erro aleatório E (t). Nosso modelo é agora um modelo autorregressivo de ordem 2. Modelos de Média Móvel: Um segundo tipo de modelo Box-Jenkins é chamado de modelo de média móvel. Embora esses modelos pareçam muito semelhantes ao modelo AR, o conceito por trás deles é bem diferente. Parâmetros de média móvel relacionam o que acontece no período t apenas aos erros aleatórios que ocorreram em períodos de tempo passados, ie E (t-1), E (t-2), etc. em vez de X (t-1), X ( t-2), (Xt-3) como nas abordagens autorregressivas. Um modelo de média móvel com um termo MA pode ser escrito como segue. X (t) - B (1) E (t-1) E (t) O termo B (1) é chamado de MA de ordem 1. O sinal negativo na frente do parâmetro é usado apenas para a convenção e geralmente é impresso automaticamente pela maioria dos programas de computador. O modelo acima diz simplesmente que qualquer valor dado de X (t) está diretamente relacionado apenas ao erro aleatório no período anterior, E (t-1), e ao termo de erro atual, E (t). Como no caso dos modelos autoregressivos, os modelos de média móvel podem ser estendidos para estruturas de ordem superior cobrindo diferentes combinações e comprimentos médios móveis. A metodologia ARIMA também permite a construção de modelos que incorporam parâmetros autorregressivos e de média móvel. Esses modelos são geralmente chamados de modelos mistos. Embora isso crie uma ferramenta de previsão mais complicada, a estrutura pode simular melhor a série e produzir uma previsão mais precisa. Modelos puros indicam que a estrutura consiste apenas em parâmetros AR ou MA - não em ambos. Os modelos desenvolvidos por essa abordagem são geralmente chamados de modelos ARIMA porque usam uma combinação de autorregressivo (AR), integração (I) - referindo-se ao processo inverso de diferenciação para produzir as operações de previsão e média móvel (MA). Um modelo ARIMA é geralmente declarado como ARIMA (p, d, q). Isso representa a ordem dos componentes autoregressivos (p), o número de operadores de diferenciação (d) e a ordem mais alta do termo de média móvel. Por exemplo, ARIMA (2,1,1) significa que você tem um modelo autoregressivo de segunda ordem com um componente de média móvel de primeira ordem cuja série foi diferenciada uma vez para induzir a estacionariedade. Escolhendo a Especificação Certa: O principal problema no Box-Jenkins clássico é tentar decidir qual especificação ARIMA usar - por exemplo. Quantos parâmetros AR e / ou MA incluir? Isso é o que muito de Box-Jenkings 1976 foi dedicado ao processo de identificação. Dependia da avaliação gráfica e numérica das funções de autocorrelação e autocorrelação parcial da amostra. Bem, para seus modelos básicos, a tarefa não é muito difícil. Cada um tem funções de autocorrelação que parecem de uma certa maneira. No entanto, quando você sobe em complexidade, os padrões não são tão facilmente detectados. Para tornar as coisas mais difíceis, seus dados representam apenas uma amostra do processo subjacente. Isso significa que erros de amostragem (outliers, erro de medição, etc.) podem distorcer o processo de identificação teórica. É por isso que a modelagem ARIMA tradicional é mais uma arte do que uma ciência. Eu tenho tentado descobrir como escrever uma resposta do tipo Quora a essa pergunta. Na verdade, é mais fácil explicar a matemática que explicar o que é. Mas, vamos tentar. Primeiro, o ARMA é parte de um conjunto de técnicas para analisar dados que são sequenciais, geralmente com o tempo como uma variável independente. (No entanto, usei as técnicas para analisar a data em que o tempo não era um fator) Como os dados geralmente são coletados seqüencialmente no tempo em um determinado intervalo, os dados em si são chamados de séries temporais. O objetivo dessas técnicas é encontrar uma equação que explique os dados e faça uma previsão a partir dos dados. Essas previsões são usadas em estatística, economia, gerenciamento industrial e em sistemas de controle. O próprio ARMA é uma combinação de duas das técnicas: auto regressivo (AR) e média móvel (MA). Primeiro, considerando a parte regressiva, isso é simplesmente uma curva linear ajustada a um conjunto de pontos de dados. Quando um novo ponto de dados chega, a regressão é movida um ponto acima e o ponto de dados mais antigo é descartado. O comprimento dos pontos de dados considerados é anotado como AR (4), onde 4 dos pontos de dados mais recentes são considerados. Os coeficientes da regressão são pesos ou parâmetros da equação e são geralmente encontrados usando a regressão por mínimos quadrados. A parte média móvel faz exatamente a mesma coisa, exceto que o erro entre o valor real e o valor previsto é usado em vez dos pontos de dados. Assim, MA (3) seria uma média ponderada do erro atual e dos dois últimos erros. Novamente, os pesos são geralmente encontrados subtraindo a média do ponto de dados e, em seguida, usando a regressão de mínimos quadrados para determinar os pesos. Quando essas duas técnicas são reunidas por adição, o resultado seria um modelo ARMA (4,3). Há muitas extensões para essas técnicas básicas de AR e MA, incluindo uma integração de termos para um modelo ARIMA, usando termos não lineares para um modelo NARMA, usando variáveis ​​exógenas para formar os modelos ARX, MAX, ARMAX e NARMAX. Outro conjunto pertencente a essas técnicas são os modelos ARCH e GARCH (formulários avançados também incluem termos integrais e não lineares) que usam termos que representam medidas estatísticas. EDIT ADDED: Veja o meu comentário abaixo sobre a bondade de ajuste. Há algo mais sobre isso que eu apenas pensei como eu estava deitado na cama. O ARMA e outros modelos desse tipo geralmente são muito bons em fazer previsões um passo à frente. No entanto, muitas vezes falham miseravelmente ao fazer estimativas em várias etapas. Eu acho que isso porque o próximo ponto provavelmente está limitado no quanto ele pode variar do ponto anterior na maioria dos casos. Mas o erro de ir mais longe é, pelo menos, aditivo e pode ser multiplicativo ou exponencial, resultando na predição de se afastar mais e mais dos dados coletados reais. Assim, o usuário tem cuidado com o 804 Visualizações middot View Upvotes middot Not for Reproduction A documentação é a média incondicional do processo, e x03C8 (L) é um polinômio de operador de atraso de grau infinito racional, (1 x03C8 1 L x03C8 2 L 2 x2026). Nota: A propriedade Constant de um objeto de modelo arima corresponde a c. e não a média incondicional 956. Por decomposição de Wolds 1. A Equação 5-12 corresponde a um processo estocástico estacionário desde que os coeficientes x03C8 i sejam absolutamente somados. Este é o caso quando o polinômio AR, x03D5 (L). é estável. ou seja, todas as suas raízes estão fora do círculo unitário. Além disso, o processo é causal, desde que o polinômio MA seja invertível. ou seja, todas as suas raízes estão fora do círculo unitário. O Econetrics Toolbox reforça a estabilidade e a invertibilidade dos processos ARMA. Quando você especifica um modelo ARMA usando arima. você recebe um erro se inserir coeficientes que não correspondem a um polinômio AR estável ou polinomial MA invertível. Da mesma forma, a estimativa impõe restrições de estacionariedade e invertibilidade durante a estimativa. Referências 1 Wold, H. Um Estudo na Análise de Séries Temporais Estacionárias. Uppsala, Suécia: Almqvist amp Wiksell, 1938. Selecione seu país

No comments:

Post a Comment