Para analisar uma série (temporal) de dados, assumimos que estes podem ser representados como tendência mais ruído:
y t = a t + b + e t {\t}=at+b+e_{t},}
onde a {\i1}displaystyle a}
e b {\i>displaystyle b}
são constantes desconhecidas e o e {\i>displaystyle e
‘s são erros distribuídos aleatoriamente. Se se pode rejeitar a hipótese nula de que os erros são não-estacionários, então a série não-estacionária {yt } é chamada estacionária de tendência. O método dos mínimos quadrados pressupõe que os erros sejam distribuídos independentemente com uma distribuição normal. Se não for este o caso, os testes de hipótese sobre os parâmetros desconhecidos a e b podem ser imprecisos. É mais simples se o e {\displaystyle e}
‘s têm todos a mesma distribuição, mas se não (se alguns tiverem maior variância, o que significa que esses pontos de dados são efectivamente menos certos) então isto pode ser tido em conta durante o ajuste dos mínimos quadrados, ponderando cada ponto pelo inverso da variância desse ponto. a maioria dos casos, onde só existe uma única série temporal para ser analisada, a variância do e {\i1}displaystyle e
‘s é estimado ajustando uma tendência para obter os valores estimados do parâmetro a ^ ^ ^ que ^ div> e b ^ , {\a}isplaystyle {\a},}
a ser subtraído dos dados ao estilo y_{\i}{\i}displaystyle y_{t}
(detrending the data) and leaving the residuals e ^ t ^ t ^displaystyle {e}_{t}}
como os dados detrendidos, e estimando a variância do e_t e_displaystyle e_{t}}
‘s dos resíduos – esta é muitas vezes a única forma de estimar a variação do e_{\i}{t}
Após conhecermos o “ruído” da série, podemos então avaliar o significado da tendência, fazendo a hipótese nula de que a tendência, um {\displaystyle a}
, não é diferente de 0. A partir da discussão acima referida de tendências em dados aleatórios com variância conhecida, sabemos a distribuição de tendências calculadas a esperar a partir de dados aleatórios (sem tendências). Se a tendência estimada, um ^ estilo de exibição ^ que ^a}}}
, é maior do que o valor crítico para um determinado nível de significância, então a tendência estimada é considerada significativamente diferente de zero a esse nível de significância, e a hipótese nula de zero subjacente à tendência é rejeitada.
A utilização de uma linha de tendência linear tem sido objecto de críticas, levando a uma procura de abordagens alternativas para evitar a sua utilização na estimativa do modelo. Uma das abordagens alternativas envolve testes de raiz unitários e a técnica de cointegração em estudos econométricos.
O coeficiente estimado associado a uma variável de tendência linear como o tempo é interpretado como uma medida do impacto de um número de factores desconhecidos ou conhecidos mas não mensuráveis sobre a variável dependente ao longo de uma unidade de tempo. Estritamente falando, essa interpretação é aplicável apenas para o período de tempo estimado. Fora desse período de tempo, não se sabe como esses factores incomensuráveis se comportam tanto qualitativa como quantitativamente. Além disso, a linearidade da tendência temporal coloca muitas questões:
(i) Porque deveria ser linear?
(ii) Se a tendência é não linear, em que condições é que a sua inclusão influencia a magnitude, bem como o significado estatístico das estimativas de outros parâmetros no modelo?
(iii) A inclusão de uma tendência temporal linear num modelo exclui por hipótese a presença de flutuações nas tendências da variável dependente ao longo do tempo; isto é necessariamente válido num contexto particular?
(iv) E, existe uma relação espúria no modelo porque uma variável causal subjacente é ela própria uma tendência temporal?
Resultados de investigação de matemáticos, estatísticos, economistas e economistas foram publicados em resposta a essas questões. Por exemplo, notas detalhadas sobre o significado das tendências de tempo linear no modelo de regressão são dadas em Cameron (2005); Granger, Engle e muitos outros economistas escreveram sobre estacionaridade, teste de raiz unitária, co-integração e questões relacionadas (um resumo de alguns dos trabalhos nesta área pode ser encontrado num documento informativo da Real Academia Sueca de Ciências (2003); e Ho-Trieu & Tucker (1990) escreveram sobre tendências logarítmicas do tempo com resultados que indicam tendências lineares do tempo são casos especiais de ciclos.
Exemplo: série temporal ruidosaEdit
É mais difícil ver uma tendência numa série temporal ruidosa. Por exemplo, se a série verdadeira for 0, 1, 2, 3 tudo mais algum “ruído” independente normalmente distribuído e de desvio padrão E, e temos uma série de amostra de comprimento 50, então se E = 0,1 a tendência será óbvia; se E = 100 a tendência será provavelmente visível; mas se E = 10000 a tendência será enterrada no ruído.
Se considerarmos um exemplo concreto, o registo da temperatura global da superfície dos últimos 140 anos, tal como apresentado pelo IPCC: então a variação interanual é de cerca de 0,2 °C e a tendência de cerca de 0,6 °C durante 140 anos, com limites de confiança de 95% de 0,2 °C (por coincidência, aproximadamente o mesmo valor que a variação interanual). Assim, a tendência é estatisticamente diferente de 0. No entanto, como já foi referido noutra parte, esta série temporal não está em conformidade com os pressupostos necessários para que os mínimos quadrados sejam válidos.