Articles

Estymacja trendu liniowego

Posted on

Aby przeanalizować szereg danych (czasowy) zakładamy, że można go przedstawić jako trend plus szum:

y t = a t + b + e t {{displaystyle y_{t}=at+b+e_{t}},}

y_{t}=at+b+e_{t}},

gdzie a {displaystyle a}

a

i b {displaystyle b}

b

są nieznanymi stałymi, a e {displaystyle e}

e

są błędami o losowym rozkładzie. Jeżeli można odrzucić hipotezę zerową, że błędy są niestacjonarne, to szereg niestacjonarny {yt } nazywamy trendem-stacjonarnym. W metodzie najmniejszych kwadratów zakłada się, że błędy są rozłożone niezależnie i mają rozkład normalny. Jeżeli tak nie jest, to testy hipotez o nieznanych parametrach a i b mogą być niedokładne. Najprościej jest, jeśli e {{displaystyle e}

e

's wszystkie mają taki sam rozkład, ale jeśli nie (jeśli niektóre mają wyższą wariancję, co oznacza, że te punkty danych są efektywnie mniej pewne), wtedy można to uwzględnić podczas dopasowania najmniejszych kwadratów, ważąc każdy punkt przez odwrotność wariancji tego punktu.

W większości przypadków, gdy istnieje tylko jeden szereg czasowy do przeanalizowania, wariancja e {{displaystyle e}}

e

's jest szacowana poprzez dopasowanie trendu w celu uzyskania szacunkowych wartości parametrów a ^ {displaystyle {a}}

{displaystyle {a}}

oraz b ^ , {{displaystyle {b}},}

{displaystyle {b}}}

pozwalając tym samym na uzyskanie przewidywanych wartości y ^ = a ^ t + b ^ {{displaystyle {{displaystyle {{hat {}}}={{hat {a}}t+{{hat {b}}}

{displaystyle {{hat}}={hat {a}}t+{hat {b}}}

do odjęcia od danych y t {{displaystyle y_{t}}

y_{t}}

(tym samym detrendując dane) i pozostawiając resztę e ^ t {{displaystyle {{e}}}_{t}}

{displaystyle {{hat {{t}}}

jako dane zdetrendowane, i szacując wariancję reszt e t {{t}}}

e_t

's z reszt – jest to często jedyny sposób oszacowania wariancji e t {displaystyle e_{t}}

e_t

's.

Gdy znamy już „szum” szeregu, możemy następnie ocenić istotność trendu, stawiając hipotezę zerową, że trend, a {displaystyle a}

a

, nie jest różny od 0. Z powyższego omówienia trendów w danych losowych o znanej wariancji znamy rozkład obliczonych trendów, jakich należy się spodziewać po danych losowych (bez trendu). Jeśli oszacowany trend, a ^ {{displaystyle {{a}}}

{{hat {a}}

, jest większy niż wartość krytyczna dla pewnego poziomu istotności, wówczas szacowany trend uznaje się za znacząco różny od zera na tym poziomie istotności, a hipotezę zerową o zerowym trendzie odrzucamy.

Użycie liniowej linii trendu było przedmiotem krytyki, co doprowadziło do poszukiwania alternatywnych podejść, aby uniknąć jej użycia w estymacji modelu. Jednym z alternatywnych podejść są testy pierwiastków jednostkowych oraz technika kointegracji w badaniach ekonometrycznych.

Oszacowany współczynnik związany ze zmienną o trendzie liniowym, taką jak czas, jest interpretowany jako miara wpływu szeregu nieznanych lub znanych, ale niemierzalnych czynników na zmienną zależną w ciągu jednej jednostki czasu. Ściśle mówiąc, interpretacja ta ma zastosowanie tylko do ram czasowych estymacji. Poza tymi ramami czasowymi nie wiadomo, jak te niemierzalne czynniki zachowują się zarówno pod względem jakościowym, jak i ilościowym. Ponadto, liniowość trendu czasowego rodzi wiele pytań:

(i) Dlaczego powinien być liniowy?

(ii) Jeśli trend jest nieliniowy, to pod jakimi warunkami jego uwzględnienie wpływa na wielkość, a także na statystyczną istotność oszacowań innych parametrów w modelu?

(iii) Włączenie liniowego trendu czasowego do modelu z założenia wyklucza obecność fluktuacji w tendencjach zmiennej zależnej w czasie; czy jest to koniecznie ważne w konkretnym kontekście?

(iv) I czy w modelu istnieje fałszywy związek, ponieważ leżąca u jego podstaw zmienna sprawcza sama jest zmienna z trendem czasowym?

W odpowiedzi na te pytania opublikowano wyniki badań matematyków, statystyków, ekonometryków i ekonomistów. Na przykład, szczegółowe uwagi na temat znaczenia liniowych trendów czasowych w modelu regresji są podane w Cameron (2005); Granger, Engle i wielu innych ekonometryków pisało na temat stacjonarności, testowania pierwiastka jednostkowego, kointegracji i pokrewnych zagadnień (podsumowanie niektórych prac w tym obszarze można znaleźć w dokumencie informacyjnym Królewskiej Szwedzkiej Akademii Nauk (2003); i Ho-Trieu & Tucker (1990) napisali o logarytmicznych trendach czasowych z wynikami wskazującymi, że liniowe trendy czasowe są szczególnymi przypadkami cykli.

Przykład: zaszumione szeregi czasoweEdit

Trudniej jest zobaczyć trend w zaszumionym szeregu czasowym. Na przykład, jeśli prawdziwy szereg to 0, 1, 2, 3 wszystkie plus jakiś niezależny normalnie rozłożony „szum” e o odchyleniu standardowym E, i mamy przykładowy szereg o długości 50, wtedy jeśli E = 0.1 trend będzie oczywisty; jeśli E = 100 trend będzie prawdopodobnie widoczny; ale jeśli E = 10000 trend będzie zagrzebany w szumie.

Jeśli weźmiemy pod uwagę konkretny przykład, zapis globalnej temperatury powierzchni ziemi z ostatnich 140 lat przedstawiony przez IPCC: wtedy zmienność międzyroczna wynosi około 0,2 °C, a trend około 0,6 °C w ciągu 140 lat, z 95% granicami ufności 0,2 °C (przez przypadek, mniej więcej taka sama wartość jak zmienność międzyroczna). Stąd trend jest statystycznie różny od 0. Jednak, jak zauważono w innym miejscu, ten szereg czasowy nie jest zgodny z założeniami niezbędnymi do tego, aby najmniejsze kwadraty były ważne.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *