Articles

Estimativa de tendência linear

Posted on

Para analisar uma série (temporal) de dados, assumimos que estes podem ser representados como tendência mais ruído:

y t = a t + b + e t {\t}=at+b+e_{t},}

y_{t}=at+b+e_{t}{t}=at+b+e_{t}},

onde a {\i1}displaystyle a}

a

e b {\i>displaystyle b}

b

são constantes desconhecidas e o e {\i>displaystyle e

e

‘s são erros distribuídos aleatoriamente. Se se pode rejeitar a hipótese nula de que os erros são não-estacionários, então a série não-estacionária {yt } é chamada estacionária de tendência. O método dos mínimos quadrados pressupõe que os erros sejam distribuídos independentemente com uma distribuição normal. Se não for este o caso, os testes de hipótese sobre os parâmetros desconhecidos a e b podem ser imprecisos. É mais simples se o e {\displaystyle e}

e

‘s têm todos a mesma distribuição, mas se não (se alguns tiverem maior variância, o que significa que esses pontos de dados são efectivamente menos certos) então isto pode ser tido em conta durante o ajuste dos mínimos quadrados, ponderando cada ponto pelo inverso da variância desse ponto. a maioria dos casos, onde só existe uma única série temporal para ser analisada, a variância do e {\i1}displaystyle e

e

‘s é estimado ajustando uma tendência para obter os valores estimados do parâmetro a ^ ^ ^ que ^ div>{\a} e b ^ , {\a}isplaystyle {\a},}

{\a}displaystyle {\a}{\a}Div>/div> permitindo assim que os valores previstos y ^ = a ^ t + b ^displaystyle ^={\a}={\a}t+{\a ^b}}{\i1}{\i1}displaystyle {\i}={\i+{\i}t+{\i}div>/div>

a ser subtraído dos dados ao estilo y_{\i}{\i}displaystyle y_{t}

y_{t}

(detrending the data) and leaving the residuals e ^ t ^ t ^displaystyle {e}_{t}}

{\i1}_displaystyle {\i}_div>

como os dados detrendidos, e estimando a variância do e_t e_displaystyle e_{t}}

e_t

‘s dos resíduos – esta é muitas vezes a única forma de estimar a variação do e_{\i}{t}

e_t ‘s.

Após conhecermos o “ruído” da série, podemos então avaliar o significado da tendência, fazendo a hipótese nula de que a tendência, um {\displaystyle a}

a

, não é diferente de 0. A partir da discussão acima referida de tendências em dados aleatórios com variância conhecida, sabemos a distribuição de tendências calculadas a esperar a partir de dados aleatórios (sem tendências). Se a tendência estimada, um ^ estilo de exibição ^ que ^a}}}

{\a}}

, é maior do que o valor crítico para um determinado nível de significância, então a tendência estimada é considerada significativamente diferente de zero a esse nível de significância, e a hipótese nula de zero subjacente à tendência é rejeitada.

A utilização de uma linha de tendência linear tem sido objecto de críticas, levando a uma procura de abordagens alternativas para evitar a sua utilização na estimativa do modelo. Uma das abordagens alternativas envolve testes de raiz unitários e a técnica de cointegração em estudos econométricos.

O coeficiente estimado associado a uma variável de tendência linear como o tempo é interpretado como uma medida do impacto de um número de factores desconhecidos ou conhecidos mas não mensuráveis sobre a variável dependente ao longo de uma unidade de tempo. Estritamente falando, essa interpretação é aplicável apenas para o período de tempo estimado. Fora desse período de tempo, não se sabe como esses factores incomensuráveis se comportam tanto qualitativa como quantitativamente. Além disso, a linearidade da tendência temporal coloca muitas questões:

(i) Porque deveria ser linear?

(ii) Se a tendência é não linear, em que condições é que a sua inclusão influencia a magnitude, bem como o significado estatístico das estimativas de outros parâmetros no modelo?

(iii) A inclusão de uma tendência temporal linear num modelo exclui por hipótese a presença de flutuações nas tendências da variável dependente ao longo do tempo; isto é necessariamente válido num contexto particular?

(iv) E, existe uma relação espúria no modelo porque uma variável causal subjacente é ela própria uma tendência temporal?

Resultados de investigação de matemáticos, estatísticos, economistas e economistas foram publicados em resposta a essas questões. Por exemplo, notas detalhadas sobre o significado das tendências de tempo linear no modelo de regressão são dadas em Cameron (2005); Granger, Engle e muitos outros economistas escreveram sobre estacionaridade, teste de raiz unitária, co-integração e questões relacionadas (um resumo de alguns dos trabalhos nesta área pode ser encontrado num documento informativo da Real Academia Sueca de Ciências (2003); e Ho-Trieu & Tucker (1990) escreveram sobre tendências logarítmicas do tempo com resultados que indicam tendências lineares do tempo são casos especiais de ciclos.

Exemplo: série temporal ruidosaEdit

É mais difícil ver uma tendência numa série temporal ruidosa. Por exemplo, se a série verdadeira for 0, 1, 2, 3 tudo mais algum “ruído” independente normalmente distribuído e de desvio padrão E, e temos uma série de amostra de comprimento 50, então se E = 0,1 a tendência será óbvia; se E = 100 a tendência será provavelmente visível; mas se E = 10000 a tendência será enterrada no ruído.

Se considerarmos um exemplo concreto, o registo da temperatura global da superfície dos últimos 140 anos, tal como apresentado pelo IPCC: então a variação interanual é de cerca de 0,2 °C e a tendência de cerca de 0,6 °C durante 140 anos, com limites de confiança de 95% de 0,2 °C (por coincidência, aproximadamente o mesmo valor que a variação interanual). Assim, a tendência é estatisticamente diferente de 0. No entanto, como já foi referido noutra parte, esta série temporal não está em conformidade com os pressupostos necessários para que os mínimos quadrados sejam válidos.

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *