Auto correlação é uma característica dos dados que mostra o grau de semelhança entre os valores das mesmas variáveis ao longo de sucessivos intervalos de tempo. Este post explica o que é autocorrelação, tipos de autocorrelação – autocorrelação positiva e negativa, bem como a forma de diagnosticar e testar a autocorrelação.
Quando se tem uma série de números, e há um padrão tal que os valores da série podem ser previstos com base em valores anteriores na série, diz-se que a série de números exibe a autocorrelação. Isto também é conhecido como correlação em série e dependência em série. A existência de autocorrelação nos resíduos de um modelo é um sinal de que o modelo pode ser infundado. A autocorrelação é diagnosticada usando um correlograma (gráfico ACF) e pode ser testada usando o teste de Durbin-Watson.
A parte autocorrelação é da palavra grega para autocorrelação, e autocorrelação significa dados que estão correlacionados consigo mesmo, em vez de estarem correlacionados com alguns outros dados. Considere os nove valores de Y abaixo. A coluna à direita mostra os últimos oito destes valores, movidos “para cima” uma linha, com o primeiro valor eliminado. Quando correlacionamos estas duas colunas de dados, excluindo a última observação que tem valores em falta, a correlação é de 0,64. Isto significa que os dados estão correlacionados consigo próprios (isto é, o valor de 0,64), temos a autocorrelação/correlação em série).
Autocorrelação positiva e negativa
O exemplo acima mostra autocorrelação positiva de primeira ordem, onde a primeira ordem indica que as observações que estão separadas estão correlacionadas, e positiva significa que a correlação entre as observações é positiva. Quando os dados que apresentam correlação positiva de primeira ordem são traçados, os pontos aparecem numa curva suave como a de uma serpente, como à esquerda. Com correlação negativa de primeira ordem, os pontos formam um padrão em ziguezague se ligados, como se mostra à direita.
Diagnosticar a autocorrelação usando um correlograma
Um correlograma mostra a correlação de uma série de dados consigo mesmo; é também conhecido como gráfico de autocorrelação e gráfico ACF. O correlograma é para os dados mostrados acima. O desfasamento refere-se à ordem de correlação. Podemos ver neste gráfico que no desfasamento 0, a correlação é 1, uma vez que os dados estão correlacionados consigo próprios. Com um desfasamento de 1, a correlação é mostrada como sendo cerca de 0,5 (isto é diferente da correlação calculada acima, pois o correlograma usa uma fórmula ligeiramente diferente). Também podemos ver que temos correlações negativas quando os pontos estão separados por 3, 4, e 5.
Teste para autocorrelação
Só erro de amostragem significa que normalmente veremos alguma autocorrelação em qualquer conjunto de dados, por isso é necessário um teste estatístico para descartar a possibilidade de erro de amostragem estar a causar a autocorrelação. O teste padrão para isto é o teste de Durbin-Watson. Este teste apenas testa explicitamente a correlação de primeira ordem, mas na prática tende a detectar as formas mais comuns de autocorrelação, dado que a maioria das formas de autocorrelação apresentam algum grau de correlação de primeira ordem.
As implicações da autocorrelação
Quando a autocorrelação é detectada nos resíduos de um modelo, sugere que o modelo está mal especificado (ou seja, de certa forma, errado). Uma causa é que algumas variáveis chave ou variáveis estão em falta no modelo. Quando os dados tiverem sido recolhidos através do espaço ou do tempo, e o modelo não o contabilizar explicitamente, é provável que falte a autocorrelação. Por exemplo, se um modelo meteorológico estiver errado num subúrbio, provavelmente estará errado da mesma forma num subúrbio vizinho. A correcção é incluir as variáveis em falta, ou modelar explicitamente a autocorrelação (por exemplo, utilizando um modelo ARIMA).
A existência de autocorrelação significa que os erros padrão calculados, e consequentemente os valores p, são enganadores.
Sign Up for Displayr