Articles

Estimación de la tendencia lineal

Posted on

Para analizar una serie (temporal) de datos, suponemos que puede representarse como tendencia más ruido:

y t = a t + b + e t {\displaystyle y_{t}=at+b+e_{t}\},

y_{t}=at+b+e_{t}\},

donde a {\displaystyle a}

a

y b {\displaystyle b}

b

son constantes desconocidas y la e {\displaystyle e}

e

‘s son errores distribuidos aleatoriamente. Si se puede rechazar la hipótesis nula de que los errores son no estacionarios, entonces la serie no estacionaria {yt } se llama estacionaria de tendencia. El método de los mínimos cuadrados supone que los errores se distribuyen independientemente con una distribución normal. Si no es así, las pruebas de hipótesis sobre los parámetros desconocidos a y b pueden ser inexactas. Lo más sencillo es que los e {\displaystyle e}

e

‘s tienen todos la misma distribución, pero si no es así (si algunos tienen una varianza más alta, lo que significa que esos puntos de datos son efectivamente menos seguros) entonces esto se puede tener en cuenta durante el ajuste de mínimos cuadrados, ponderando cada punto por la inversa de la varianza de ese punto.

En la mayoría de los casos, en los que sólo existe una única serie temporal a analizar, la varianza del e

e

‘s se estima ajustando una tendencia para obtener los valores de los parámetros estimados a ^ {\displaystyle {\hat {a}}

{\a}

y b ^ , {\a},

{\a},

permitiendo así que los valores predichos y ^ = a ^ t + b ^ {\displaystyle {\hat {y}}={hat {a}}t+{hat {b}}

{displaystyle {\hat {y}={hat {a}}t+{hat {b}}

para restar de los datos y t {displaystyle y_{t}}

y_{t}
(por lo que se desvirtúan los datos) y se dejan los residuos e ^ t {\displaystyle {\hat {e}}_{t}

{displaystyle {\hat {e}}_{t}

como los datos sin tendencia, y estimando la varianza de e t {displaystyle e_{t}}

e_t

‘s de los residuos – esto es a menudo la única manera de estimar la varianza de la e t {displaystyle e_{t}}

e_t

‘s.

Una vez que conocemos el «ruido» de la serie, podemos evaluar la significación de la tendencia haciendo la hipótesis nula de que la tendencia, a {\displaystyle a}

a

, no es diferente de 0. A partir de la discusión anterior de las tendencias en datos aleatorios con varianza conocida, conocemos la distribución de las tendencias calculadas que se esperan de los datos aleatorios (sin tendencia). Si la tendencia estimada, a ^ {\displaystyle {\hat {a}}

{hat {a}}

, es mayor que el valor crítico para un determinado nivel de significación, entonces se considera que la tendencia estimada es significativamente diferente de cero a ese nivel de significación, y se rechaza la hipótesis nula de tendencia subyacente cero.

El uso de una línea de tendencia lineal ha sido objeto de críticas, lo que ha llevado a la búsqueda de enfoques alternativos para evitar su uso en la estimación del modelo. Uno de los enfoques alternativos implica las pruebas de raíz unitaria y la técnica de cointegración en los estudios econométricos.

El coeficiente estimado asociado a una variable de tendencia lineal como el tiempo se interpreta como una medida del impacto de una serie de factores desconocidos o conocidos pero no medibles sobre la variable dependiente en una unidad de tiempo. En sentido estricto, esta interpretación sólo es aplicable al marco temporal de la estimación. Fuera de ese marco temporal, no se sabe cómo se comportan esos factores no medibles, tanto cualitativa como cuantitativamente. Además, la linealidad de la tendencia temporal plantea muchas preguntas:

(i) ¿Por qué debería ser lineal?

(ii) Si la tendencia no es lineal, entonces, ¿en qué condiciones su inclusión influye en la magnitud así como en la significación estadística de las estimaciones de otros parámetros del modelo?

(iii) La inclusión de una tendencia temporal lineal en un modelo excluye por supuesto la presencia de fluctuaciones en las tendencias de la variable dependiente a lo largo del tiempo; ¿es esto necesariamente válido en un contexto particular?

(iv) Y, ¿existe una relación espuria en el modelo porque una variable causal subyacente tiene a su vez una tendencia temporal?

En respuesta a estas preguntas se han publicado resultados de investigación de matemáticos, estadísticos, econometristas y economistas. Por ejemplo, en Cameron (2005) se ofrecen notas detalladas sobre el significado de las tendencias temporales lineales en el modelo de regresión; Granger, Engle y muchos otros econometristas han escrito sobre la estacionariedad, las pruebas de raíces unitarias, la cointegración y otras cuestiones relacionadas (en un documento informativo de la Real Academia Sueca de Ciencias (2003) se puede encontrar un resumen de algunos de los trabajos en este ámbito; y Ho-Trieu & Tucker (1990) han escrito sobre tendencias temporales logarítmicas con resultados que indican que las tendencias temporales lineales son casos especiales de ciclos.

Ejemplo: series temporales ruidosasEditar

Es más difícil ver una tendencia en una serie temporal ruidosa. Por ejemplo, si la serie verdadera es 0, 1, 2, 3 todo más algún «ruido» independiente normalmente distribuido e de desviación estándar E, y tenemos una serie de muestra de longitud 50, entonces si E = 0,1 la tendencia será obvia; si E = 100 la tendencia será probablemente visible; pero si E = 10000 la tendencia quedará enterrada en el ruido.

Si consideramos un ejemplo concreto, el registro de la temperatura global de la superficie de los últimos 140 años tal y como lo presenta el IPCC: entonces la variación interanual es de unos 0,2 °C y la tendencia de unos 0,6 °C a lo largo de 140 años, con límites de confianza del 95% de 0,2 °C (por coincidencia, aproximadamente el mismo valor que la variación interanual). Por lo tanto, la tendencia es estadísticamente diferente de 0. Sin embargo, como se ha señalado en otro lugar, esta serie temporal no se ajusta a los supuestos necesarios para que los mínimos cuadrados sean válidos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *