Friday 24 November 2017

Seasonality In Moving Average


Implementação de planilhas de ajuste sazonal e suavização exponencial É fácil executar o ajuste sazonal e ajustar modelos exponenciais de suavização usando o Excel. As imagens e gráficos de tela a seguir são extraídos de uma planilha que foi configurada para ilustrar o ajuste sazonal multiplicativo e a suavização exponencial linear nos seguintes dados de vendas trimestrais do Outboard Marine: Para obter uma cópia do próprio arquivo de planilha, clique aqui. A versão de suavização exponencial linear que será usada aqui para fins de demonstração é a versão de Brown8217s, simplesmente porque ela pode ser implementada com uma única coluna de fórmulas e há apenas uma constante de suavização para otimizar. Normalmente é melhor usar a versão Holt8217s que tem constantes de suavização separadas para nível e tendência. O processo de previsão prossegue da seguinte forma: (i) primeiro os dados são ajustados sazonalmente (ii) então as previsões são geradas para os dados ajustados sazonalmente por meio de suavização exponencial linear e (iii) finalmente as previsões são ajustadas sazonalmente para obter previsões para a série original . O processo de ajuste sazonal é realizado nas colunas D a G. O primeiro passo no ajuste sazonal é calcular uma média móvel centrada (realizada aqui na coluna D). Isto pode ser feito tomando a média de duas médias anuais que são compensadas por um período em relação um ao outro. (Uma combinação de duas médias de compensação ao invés de uma única média é necessária para fins de centralização quando o número de estações é par.) O próximo passo é calcular a relação com a média móvel - i. e. Os dados originais divididos pela média móvel em cada período - o que é realizado aqui na coluna E. (Isso também é chamado de componente quottrend-cyclequot do padrão, na medida em que os efeitos da tendência e do ciclo de negócios podem ser considerados como sendo tudo isso Permanece após a média de dados de um ano inteiro. Naturalmente, as mudanças mês a mês que não são devido à sazonalidade poderia ser determinada por muitos outros fatores, mas a média de 12 meses suaviza sobre eles em grande medida.) O índice sazonal estimado para cada estação é calculado pela primeira média de todas as razões para essa estação particular, que é feita nas células G3-G6 usando uma fórmula AVERAGEIF. As razões médias são então redimensionadas de modo que somam exatamente 100 vezes o número de períodos em uma estação, ou 400, neste caso, o que é feito nas células H3-H6. Abaixo na coluna F, as fórmulas VLOOKUP são usadas para inserir o valor do índice sazonal apropriado em cada linha da tabela de dados, de acordo com o trimestre do ano que ele representa. A média móvel centrada e os dados ajustados sazonalmente acabam parecidos com isto: Note que a média móvel normalmente se parece com uma versão mais lisa da série ajustada sazonalmente, e é mais curta em ambas as extremidades. Uma outra planilha no mesmo arquivo do Excel mostra a aplicação do modelo de suavização exponencial linear aos dados dessazonalizados, começando na coluna G. Um valor para a constante de alisamento (alfa) é inserido acima da coluna de previsão (aqui, na célula H9) e Por conveniência é atribuído o nome do intervalo quotAlpha. quot (O nome é atribuído usando o comando quotInsert / Name / Createquot). O modelo LES é inicializado definindo as duas primeiras previsões iguais ao primeiro valor real da série ajustada sazonalmente. A fórmula usada aqui para a previsão de LES é a forma recursiva de equação única do modelo Brown8217s: Esta fórmula é inserida na célula correspondente ao terceiro período (aqui, célula H15) e copiada para baixo a partir daí. Observe que a previsão do LES para o período atual se refere às duas observações precedentes e aos dois erros de previsão anteriores, bem como ao valor de alfa. Assim, a fórmula de previsão na linha 15 refere-se apenas a dados que estavam disponíveis na linha 14 e anteriores. (É claro que, se desejássemos usar a suavização linear simples em vez de linear, poderíamos substituir a fórmula SES aqui. Também poderíamos usar Holt8217s ao invés do modelo LES de Brown8217s, o que exigiria mais duas colunas de fórmulas para calcular o nível ea tendência Que são usados ​​na previsão.) Os erros são computados na coluna seguinte (aqui, coluna J) subtraindo as previsões dos valores reais. O erro médio quadrático é calculado como a raiz quadrada da variância dos erros mais o quadrado da média. (Isto decorre da identidade matemática: VARIANCE MSE (erros) (AVERAGE (erros)) 2.) No cálculo da média e variância dos erros nesta fórmula, os dois primeiros períodos são excluídos porque o modelo não começa a prever até O terceiro período (linha 15 na planilha). O valor ótimo de alfa pode ser encontrado alterando manualmente alfa até que o RMSE mínimo seja encontrado, ou então você pode usar o quotSolverquot para executar uma minimização exata. O valor de alpha que o Solver encontrado é mostrado aqui (alpha0.471). Geralmente é uma boa idéia traçar os erros do modelo (em unidades transformadas) e também calcular e traçar suas autocorrelações em defasagens de até uma estação. Aqui está um gráfico de séries temporais dos erros (ajustados sazonalmente): As autocorrelações de erro são calculadas usando a função CORREL () para calcular as correlações dos erros com elas mesmas retardadas por um ou mais períodos - os detalhes são mostrados no modelo de planilha . Aqui está um gráfico das autocorrelações dos erros nos primeiros cinco lags: As autocorrelações nos intervalos 1 a 3 são muito próximas de zero, mas a espiga no retardo 4 (cujo valor é 0,35) é ligeiramente problemática - sugere que a Processo de ajuste sazonal não foi completamente bem sucedido. No entanto, é apenas marginalmente significativo. 95 para determinar se as autocorrelações são significativamente diferentes de zero são mais ou menos 2 / SQRT (n-k), onde n é o tamanho da amostra e k é o atraso. Aqui n é 38 e k varia de 1 a 5, então a raiz quadrada-de-n-menos-k é de cerca de 6 para todos eles, e, portanto, os limites para testar a significância estatística de desvios de zero são mais ou menos - Ou-menos 2/6, ou 0,33. Se você variar o valor de alfa à mão neste modelo do Excel, você pode observar o efeito sobre as parcelas de tempo de série e de autocorrelação dos erros, bem como sobre o erro raiz-médio-quadrado, que será ilustrado abaixo. Na parte inferior da planilha, a fórmula de previsão é quotbootstrappedquot para o futuro, simplesmente substituindo as previsões de valores reais no ponto onde os dados reais se esgotou - i. e. Onde o futuro começa. (Em outras palavras, em cada célula onde um valor de dados futuro ocorreria, uma referência de célula é inserida que aponta para a previsão feita para esse período.) Todas as outras fórmulas são simplesmente copiadas para baixo de cima: Observe que os erros para previsões de O futuro são todos computados como sendo zero. Isso não significa que os erros reais serão zero, mas sim apenas reflete o fato de que para fins de previsão estamos assumindo que os dados futuros serão iguais às previsões em média. As previsões de LES resultantes para os dados ajustados sazonalmente são as seguintes: Com este valor específico de alfa, que é ideal para as previsões de um período antecipado, a tendência projetada é ligeiramente alta, refletindo a tendência local observada nos últimos 2 anos ou então. Para outros valores de alfa, uma projeção de tendência muito diferente pode ser obtida. Geralmente é uma boa idéia ver o que acontece com a projeção de tendência de longo prazo quando alfa é variado, porque o valor que é melhor para previsão de curto prazo não será necessariamente o melhor valor para prever o futuro mais distante. Por exemplo, aqui está o resultado que é obtido se o valor de alfa é manualmente definido como 0.25: A tendência de longo prazo projetada é agora negativa em vez de positiva Com um menor valor de alfa, o modelo está colocando mais peso em dados mais antigos em A sua estimativa do nível e da tendência actuais e as suas previsões a longo prazo reflectem a tendência descendente observada nos últimos 5 anos, em vez da tendência ascendente mais recente. Este gráfico também ilustra claramente como o modelo com um valor menor de alfa é mais lento para responder a pontos de quoturno nos dados e, portanto, tende a fazer um erro do mesmo sinal para muitos períodos em uma linha. Seus erros de previsão de 1 passo são maiores em média do que aqueles obtidos antes (RMSE de 34,4 em vez de 27,4) e fortemente positivamente autocorrelacionados. A autocorrelação lag-1 de 0,56 excede largamente o valor de 0,33 calculado acima para um desvio estatisticamente significativo de zero. Como alternativa ao aumento do valor de alfa para introduzir mais conservadorismo nas previsões de longo prazo, às vezes é adicionado ao modelo um fator de amortecimento de quottrend para fazer com que a tendência projetada se aplique após alguns períodos. A etapa final na construção do modelo de previsão é a de igualar as previsões de LES, multiplicando-as pelos índices sazonais apropriados. Dessa forma, as previsões reseasonalized na coluna I são simplesmente o produto dos índices sazonais na coluna F e as previsões de LES estacionalmente ajustadas na coluna H. É relativamente fácil calcular intervalos de confiança para as previsões de um passo à frente feitas por este modelo: primeiro Calcular o RMSE (erro quadrático médio, que é apenas a raiz quadrada do MSE) e, em seguida, calcular um intervalo de confiança para a previsão ajustada sazonalmente, adicionando e subtraindo duas vezes o RMSE. (Em geral, um intervalo de confiança de 95 para uma previsão de um período antecipado é aproximadamente igual à previsão de ponto mais ou menos duas vezes o desvio padrão estimado dos erros de previsão, supondo que a distribuição do erro é aproximadamente normal eo tamanho da amostra É grande o suficiente, digamos, 20 ou mais. Aqui, o RMSE em vez do desvio padrão da amostra dos erros é a melhor estimativa do desvio padrão de futuros erros de previsão porque leva bias, bem como variações aleatórias em conta.) Os limites de confiança Para a previsão ajustada sazonalmente são então reseasonalized. Juntamente com a previsão, multiplicando-os pelos índices sazonais apropriados. Neste caso o RMSE é igual a 27,4 e a previsão ajustada sazonalmente para o primeiro período futuro (Dec-93) é 273,2. O intervalo de confiança ajustado sazonalmente é de 273,2-227,4 218,4 para 273,2227,4 328,0. Multiplicando esses limites por Decembers índice sazonal de 68,61. Obtemos limites de confiança inferior e superior de 149,8 e 225,0 em torno da previsão de ponto Dec-93 de 187,4. Os limites de confiança para as previsões de mais de um período de tempo em geral aumentarão à medida que o horizonte de previsão aumentar, devido à incerteza quanto ao nível e à tendência, bem como aos fatores sazonais, mas é difícil computá-los em geral por métodos analíticos. (A maneira apropriada de calcular limites de confiança para a previsão de LES é usando a teoria ARIMA, mas a incerteza nos índices sazonais é outra questão.) Se você quer um intervalo de confiança realista para uma previsão mais de um período à frente, tomando todas as fontes de A sua melhor aposta é usar métodos empíricos: por exemplo, para obter um intervalo de confiança para uma previsão de duas etapas à frente, você poderia criar outra coluna na planilha para calcular uma previsão de duas etapas para cada período ( Por bootstrapping a previsão one-step-ahead). Em seguida, calcular o RMSE dos erros de previsão em duas etapas e usá-lo como a base para um intervalo de confiança de 2 etapas. Previsão de tendências e tendências estacionais ponderadas exponencialmente médias O papel fornece um desenvolvimento sistemático das expressões de previsão para exponencial Médias móveis ponderadas. Métodos para séries sem tendência, ou tendência aditiva ou multiplicativa são examinados. Da mesma forma, os métodos cobrem séries não-sazonais e sazonais com estruturas de erro aditivo ou multiplicativo. O artigo é uma versão reimpressa do relatório de 1957 para o Escritório de Pesquisa Naval (ONR 52) e está sendo publicado aqui para fornecer maior acessibilidade. Suavização exponencial Previsão Local sazonal Tendências locais Copyright copy 2004 Publicado por Elsevier B. V. Biografia: Charles C. HOLT é Professor de Gestão emérito na Escola de Pós-Graduação de Negócios da Universidade do Texas em Austin. Sua pesquisa atual é sobre métodos de decisão quantitativa, sistemas de apoio à decisão e previsão financeira. Anteriormente, ele fez pesquisa e ensino em M. I.T. A Universidade Carnegie Mellon, a London School of Economics, a Universidade de Wisconsin eo Urban Institute. Atua em aplicações de computador desde 1947 e tem feito pesquisas sobre controle automático, simulação de sistemas econômicos, programação de produção, emprego e estoques e dinâmica de inflação e desemprego.5.2 Smoothing Time Series Smoothing é geralmente feito para nos ajudar Melhor ver padrões, tendências, por exemplo, em séries temporais. Geralmente suavizar a irregularidade irregular para ver um sinal mais claro. Para os dados sazonais, podemos suavizar a sazonalidade para que possamos identificar a tendência. Suavização não nos fornece um modelo, mas pode ser um bom primeiro passo para descrever vários componentes da série. O termo filtro às vezes é usado para descrever um procedimento de suavização. Por exemplo, se o valor suavizado de um determinado tempo é calculado como uma combinação linear de observações para tempos circundantes, pode-se dizer que weve aplicado um filtro linear para os dados (não o mesmo que dizer o resultado é uma linha reta, por o caminho). O uso tradicional do termo média móvel é que em cada ponto no tempo determinamos médias (possivelmente ponderadas) dos valores observados que circundam um determinado tempo. Por exemplo, no instante t. Uma média móvel centrada do comprimento 3 com pesos iguais seria a média dos valores às vezes t -1. T. E t1. Para tirar a sazonalidade de uma série, para que possamos ver melhor a tendência, usaríamos uma média móvel com um período sazonal span. Assim, na série suavizada, cada valor alisado foi calculado em média em todas as estações. Isso pode ser feito olhando para uma média móvel unilateral em que você média todos os valores para os anos anteriores de dados ou uma média móvel centrada na qual você usa valores antes e depois da hora atual. Para dados trimestrais, por exemplo, poderíamos definir um valor suavizado para o tempo t como (x t x t-1 x t-2 x t-3) / 4, a média deste tempo e os 3 trimestres anteriores. No código R, este será um filtro unilateral. Uma média móvel centrada cria um pouco de uma dificuldade quando temos um número par de períodos de tempo no período sazonal (como costumamos fazer). Para suavizar a sazonalidade nos dados trimestrais. A fim de identificar a tendência, a convenção usual é usar a média móvel alisada no momento t é Para suavizar a sazonalidade em dados mensais. Para identificar a tendência, a convenção usual é usar a média móvel alisada no instante t. Isto é, aplicamos o peso 1/24 aos valores às vezes t6 e t6 e peso 1/12 a todos os valores em todos os momentos entre t5 e T5. No comando R filtro, bem especificar um filtro de dois lados quando queremos usar valores que vêm antes e depois do tempo para o qual foram suavização. Observe que na página 71 de nosso livro, os autores aplicam pesos iguais em uma média móvel sazonal centrada. Thats ok também. Por exemplo, um trimestral mais suave pode ser suavizado no momento t é fraccionado x frac x frac x frac x frac x Um mensal mais suave pode aplicar um peso de 1/13 a todos os valores de tempos t-6 a t6. O código que os autores usam na página 72 tira vantagem de um comando rep que repete um valor um certo número de vezes. Eles não usam o parâmetro filter dentro do comando filter. Exemplo 1 Produção Trimestral de Cerveja na Austrália Tanto na Lição 1 quanto na Lição 4, analisamos uma série de produção trimestral de cerveja na Austrália. O código R seguinte cria uma série suavizada que nos permite ver o padrão de tendência e traça esse padrão de tendência no mesmo gráfico da série de tempo. O segundo comando cria e armazena a série suavizada no objeto chamado trendpattern. Note que dentro do comando filter, o parâmetro named filter dá os coeficientes para o nosso alisamento e sides 2 faz com que um centrado suave seja calculado. Beerprod (beerprod. dat) filtro de tendência (beerprod, filtro c (1/8, 1/4, 1/4, 1/4, 1/8), sides2) parcela (beerprod, tipo b, ) Linhas (trendpattern) Heres o resultado: Podemos subtrair o padrão de tendência dos valores de dados para ter uma melhor visão da sazonalidade. O resultado segue: Outra possibilidade para a série de alisamento para ver a tendência é o filtro one-sided do filtro trendpattern2 (beerprod, filtro c (1/4, 1/4, 1/4, 1/4), sides1) Com isso, o valor suavizado é a média do ano passado. Exemplo 2. Desemprego mensal nos Estados Unidos Na lição de casa da semana 4 você analisou uma série mensal de desemprego nos Estados Unidos para 1948-1978. Heres um alisamento feito para olhar para a tendência. Trendunemployfilter (unemploy, filterc (1 / 24,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12, (Trendunemploy, mainTrend no desemprego nos Estados Unidos, 1948-1978, ano xlab) Apenas a tendência alisada é plotada. O segundo comando identifica as características de tempo do calendário da série. Isso faz com que a trama tenha um eixo mais significativo. A trama segue. Para séries não-sazonais, você arent obrigado a alisar sobre qualquer extensão particular. Para alisar você deve experimentar com médias móveis de diferentes extensões. Esses períodos de tempo podem ser relativamente curtos. O objetivo é derrubar as bordas ásperas para ver qual tendência ou padrão pode estar lá. Outros Métodos de Suavização (Seção 2.4) A Seção 2.4 descreve várias alternativas sofisticadas e úteis para o alisamento médio móvel. Os detalhes podem parecer esboçado, mas isso é bom porque não queremos ficar atolados em muitos detalhes para esses métodos. Dos métodos alternativos descritos na Seção 2.4, o lowess (regressão localmente ponderada) pode ser o mais utilizado. Exemplo 2 Continua O gráfico seguinte é uma linha de tendência suavizada para a série de Desemprego dos EUA, encontrada utilizando um lowess mais suave, no qual uma quantidade substancial (2/3) contribuiu para cada estimativa suavizada. Note que isso suavizou a série mais agressivamente do que a média móvel. Os comandos utilizados foram os desempregados (desemprego, início c (1948,1), freq12) parcela (lowess (desempregado, f 2/3), suavização Lowess da tendência de desemprego nos EUA) Suavização Exponencial Única A equação básica de previsão para suavização exponencial única (1-alfa) hat t text Nós prognosticamos que o valor de x no tempo t1 seja uma combinação ponderada do valor observado no tempo t eo valor previsto no instante t. Embora o método seja chamado um método de suavização, seu usado principalmente para previsão de curto prazo. O valor de é chamado de constante de suavização. Por qualquer razão, 0.2 é uma popular escolha padrão de programas. Isso coloca um peso de 0,2 na observação mais recente e um peso de 1,2,8 na previsão mais recente. Com um valor relativamente pequeno de, o alisamento será relativamente mais extenso. Com um valor relativamente grande de, o alisamento é relativamente menos extenso à medida que mais peso será colocado no valor observado. Este é um método simples de previsão de um passo à frente que, à primeira vista, parece não exigir um modelo para os dados. De fato, este método é equivalente ao uso de um modelo ARIMA (0,1,1) sem constante. O procedimento ideal é ajustar um modelo ARIMA (0,1,1) ao conjunto de dados observado e usar os resultados para determinar o valor de. Isso é ótimo no sentido de criar o melhor para os dados já observados. Embora o objetivo seja suavizar e um passo à frente previsões, a equivalência ao modelo ARIMA (0,1,1) traz um bom ponto. Não devemos cegamente aplicar alisamento exponencial porque o processo subjacente pode não ser bem modelado por um ARIMA (0,1,1). Considere um ARIMA (0,1,1) com média 0 para as primeiras diferenças, xt - x t-1: begin hat amp amp xt theta1 wt amp amp xt theta1 (xt - que t) amp amp (1 theta1) xt - theta1hat tendem. Se deixarmos (1 1) e assim - (1) 1, vemos a equivalência à equação (1) acima. Por que o Método é Chamado Suavização Exponencial Isso produz o seguinte: começo chapéu amplificador amp alfa xt (1-alfa) alfa x (1-alfa) chapéu amp amp alfa xt alfa (1-alfa) x (1-alfa) 2hat fim Continuar Desta forma substituindo sucessivamente o valor previsto no lado direito da equação. Isto leva a: hat alpha alfa (1-alfa) x alfa (1-alfa) 2 x dots alfa (1-alfa) jx pontos alfa (1-alfa) x1 texto A equação 2 mostra que o valor previsto é uma média ponderada De todos os valores passados ​​da série, com pesos exponencialmente variáveis ​​à medida que nos movemos de volta na série. Optimal Exponential Smoothing in R Basicamente, basta ajustar um ARIMA (0,1,1) aos dados e determinar o coeficiente. Podemos examinar o ajuste do bom, comparando os valores previstos com a série real. A suavização exponencial tende a ser usada mais como uma ferramenta de previsão do que uma verdadeira suavidade, por isso procuramos ver se temos um bom ajuste. Exemplo 3. N 100 observações mensais do logaritmo de um índice de preços do petróleo nos Estados Unidos. A série de dados é: Um ajuste ARIMA (0,1,1) em R deu um coeficiente MA (1) 0,3877. Assim, (1 1) 1,3877 e 1- -0,3877. A equação exponencial de suavização de previsão é 1.3877xt - 0.3877hat t No tempo 100, o valor observado da série é x 100 0,86601. O valor previsto para a série nesse momento é Assim, a previsão para o tempo 101 é o chapéu 1.3877x - 0.3877hat 1.3877 (0.86601) -0.3877 (0.856789) 0.8696 A seguir é o quão bem o mais suave se encaixa a série. É um bom ajuste. Isso é um bom sinal para a previsão, o principal objectivo para este mais suave. Aqui estão os comandos usados ​​para gerar a saída para este exemplo: oilindex scan (oildata. dat) gráfico (oilindex, tipo b, registro principal de índice de óleo série) expsmoothfit arima (oilindex, ordem c (0,1,1)) expsmoothfit Para ver o arima resultados preditos oilindex - expsmoothfitresiduals previu valores gráfico (oilindex, typeb, principal Exponencial Suavização do Log of Oil Index) linhas (preditos) 1.3877oilindex100-0.3877predicteds100 previsão de tempo 101 Duplo suavização exponencial Dupla exponencial alisamento pode ser usado quando theres Tendência (longo ou curto prazo), mas sem sazonalidade. Essencialmente, o método cria uma previsão combinando estimativas exponencialmente suavizadas da tendência (inclinação de uma linha reta) eo nível (basicamente, a intercepção de uma linha reta). Dois pesos diferentes, ou parâmetros de suavização, são usados ​​para atualizar esses dois componentes a cada vez. O nível alisado é mais ou menos equivalente a uma suavização exponencial simples dos valores de dados ea tendência suavizada é mais ou menos equivalente a uma suavização exponencial simples das primeiras diferenças. O procedimento é equivalente à montagem de um modelo ARIMA (0,2,2), sem constante, pode ser realizado com um ajuste ARIMA (0,2,2). (1-B) 2 xt (1teta1B theta2B2) p. Navegação

No comments:

Post a Comment