Articles

Stima della tendenza lineare

Posted on

Per analizzare una serie (temporale) di dati, assumiamo che essa possa essere rappresentata come tendenza più rumore:

y t = a t + b + e t {displaystyle y_{t}=at+b+e_{t},}

y_{t}=at+b+e_{t},

dove a {displaystyle a}

a

e b {displaystyle b}

b

sono costanti sconosciute e la e {displaystyle e}

e

sono errori distribuiti casualmente. Se si può rifiutare l’ipotesi nulla che gli errori siano non stazionari, allora la serie non stazionaria {yt } è detta trend-stazionaria. Il metodo dei minimi quadrati presuppone che gli errori siano distribuiti in modo indipendente con una distribuzione normale. Se questo non è il caso, i test di ipotesi sui parametri sconosciuti a e b possono essere imprecisi. È più semplice se la e {displaystyle e}

e

hanno tutti la stessa distribuzione, ma se non è così (se alcuni hanno una varianza più alta, il che significa che quei punti di dati sono effettivamente meno certi) allora questo può essere preso in considerazione durante l’adattamento ai minimi quadrati, pesando ogni punto per l’inverso della varianza di quel punto.

Nella maggior parte dei casi, dove esiste solo una singola serie temporale da analizzare, la varianza della e {\displaystyle e}

e

è stimata adattando un trend per ottenere i valori dei parametri stimati a ^ {\displaystyle {\hat {a}}}

{{displaystyle {\hat {a}}

e b ^ , {displaystyle {\hat {b},}

{displaystyle {\hat {b},permettendo così i valori previsti y ^ = a ^ t + b ^ {displaystyle {y}={hat {a}t+{hat {b}}}{{displaystyle {\hat {y}={hat {a}t+{hat {b}}}

da sottrarre ai dati y t {displaystyle y_{t}}

y_{t}

(detrendendo così i dati) e lasciando i residui e ^ t {displaystyle {\hat {e}}_{t}}

{{displaystyle {\hat {e}}_{t}

come dati detrended, e stimando la varianza di e t {displaystyle e_{t}}

e_t

dai residui – questo è spesso l’unico modo di stimare la varianza delle e t {displaystyle e_{t}}

e_t

‘s.

Una volta che conosciamo il “rumore” della serie, possiamo quindi valutare la significatività del trend facendo l’ipotesi nulla che il trend, a {\displaystyle a}

a

, non sia diverso da 0. Dalla precedente discussione sui trend in dati casuali con varianza nota, conosciamo la distribuzione dei trend calcolati che ci si aspetta da dati casuali (senza trend). Se il trend stimato, a ^ {\displaystyle {\hat {a}}}

{\hat {a}}

, è maggiore del valore critico per un certo livello di significatività, allora il trend stimato è considerato significativamente diverso da zero a quel livello di significatività, e l’ipotesi nulla di un trend sottostante nullo è respinta.

L’uso di una linea di tendenza lineare è stato oggetto di critiche, portando alla ricerca di approcci alternativi per evitare il suo uso nella stima del modello. Uno degli approcci alternativi coinvolge i test delle radici unitarie e la tecnica di cointegrazione negli studi econometrici.

Il coefficiente stimato associato a una variabile di tendenza lineare come il tempo viene interpretato come una misura dell’impatto di una serie di fattori sconosciuti o noti ma non misurabili sulla variabile dipendente in un’unità di tempo. In senso stretto, questa interpretazione è applicabile solo per l’intervallo di tempo della stima. Al di fuori di questo lasso di tempo, non si sa come questi fattori non misurabili si comportano sia qualitativamente che quantitativamente. Inoltre, la linearità del trend temporale pone molte domande:

(i) Perché dovrebbe essere lineare?

(ii) Se il trend è non lineare, in quali condizioni la sua inclusione influenza la grandezza e la significatività statistica delle stime degli altri parametri del modello?

(iii) L’inclusione di un trend temporale lineare in un modello preclude per ipotesi la presenza di fluttuazioni nelle tendenze della variabile dipendente nel tempo; questo è necessariamente valido in un particolare contesto?

(iv) E, esiste una relazione spuria nel modello perché una variabile causale sottostante è essa stessa time-trending?

In risposta a queste domande sono stati pubblicati risultati di ricerca di matematici, statistici, econometrici ed economisti. Per esempio, note dettagliate sul significato delle tendenze temporali lineari nel modello di regressione sono fornite in Cameron (2005); Granger, Engle e molti altri econometrici hanno scritto su stazionarietà, test delle radici unitarie, cointegrazione e questioni correlate (un riassunto di alcuni lavori in quest’area può essere trovato in un documento informativo della Royal Swedish Academy of Sciences (2003); e Ho-Trieu & Tucker (1990) hanno scritto sulle tendenze temporali logaritmiche con risultati che indicano che le tendenze temporali lineari sono casi speciali di cicli.

Esempio: serie temporali rumoroseModifica

È più difficile vedere una tendenza in una serie temporale rumorosa. Per esempio, se la serie vera è 0, 1, 2, 3 tutte più qualche “rumore” indipendente normalmente distribuito e di deviazione standard E, e abbiamo una serie campione di lunghezza 50, allora se E = 0,1 la tendenza sarà evidente; se E = 100 la tendenza sarà probabilmente visibile; ma se E = 10000 la tendenza sarà sepolta nel rumore.

Se consideriamo un esempio concreto, il record della temperatura superficiale globale degli ultimi 140 anni come presentato dall’IPCC: allora la variazione interannuale è di circa 0,2 °C e il trend di circa 0,6 °C su 140 anni, con limiti di confidenza al 95% di 0,2 °C (per coincidenza, circa lo stesso valore della variazione interannuale). Quindi il trend è statisticamente diverso da 0. Tuttavia, come notato altrove questa serie temporale non è conforme alle ipotesi necessarie per la validità dei minimi quadrati.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *