Pour analyser une série (temporelle) de données, on suppose qu’elle peut être représentée comme une tendance plus du bruit :
y t = a t + b + e t {\displaystyle y_{t}=at+b+e_{t}\,}
où a {\displaystyle a}
et b {\displaystyle b}
sont des constantes inconnues et le e {\displaystyle e}
‘s sont des erreurs distribuées aléatoirement. Si on peut rejeter l’hypothèse nulle que les erreurs ne sont pas stationnaires, alors la série non stationnaire {yt } est dite tendance-stationnaire. La méthode des moindres carrés suppose que les erreurs sont distribuées indépendamment avec une distribution normale. Si ce n’est pas le cas, les tests d’hypothèse sur les paramètres inconnus a et b peuvent être inexacts. Le plus simple est que l’e {\displaystyle e}
‘s ont tous la même distribution, mais si ce n’est pas le cas (si certains ont une variance plus élevée, ce qui signifie que ces points de données sont effectivement moins certains), on peut en tenir compte lors de l’ajustement par les moindres carrés, en pondérant chaque point par l’inverse de la variance de ce point.
Dans la plupart des cas, lorsqu’il n’existe qu’une seule série temporelle à analyser, la variance de l’e {\displaystyle e}.
‘s est estimée en ajustant une tendance pour obtenir les valeurs estimées des paramètres a ^ {\displaystyle {\hat {a}}}.
et b ^ , {\displaystyle {\hat {b}},}
autorisant ainsi les valeurs prédites y ^ = a ^ t + b ^ {\displaystyle {\hat {y}}={\hat {a}}t+{\hat {b}}}
à soustraire des données y t {\displaystyle y_{t}}.
(on détend ainsi les données) et on laisse les résidus e ^ t {\displaystyle {\hat {e}}_{t}}}.
comme données détendues, et en estimant la variance de l’e t {\displaystyle e_{t}}.
‘s à partir des résidus – c’est souvent la seule façon d’estimer la variance des e t {\displaystyle e_{t}}.
‘s.
, n’est pas différente de 0. D’après la discussion ci-dessus sur les tendances des données aléatoires avec une variance connue, nous connaissons la distribution des tendances calculées à attendre des données aléatoires (sans tendance). Si la tendance estimée, a ^ {\displaystyle {\hat {a}}}
, est supérieure à la valeur critique pour un certain niveau de signification, alors la tendance estimée est jugée significativement différente de zéro à ce niveau de signification, et l’hypothèse nulle de tendance sous-jacente nulle est rejetée.
L’utilisation d’une ligne de tendance linéaire a fait l’objet de critiques, ce qui a conduit à la recherche d’approches alternatives pour éviter son utilisation dans l’estimation du modèle. L’une des approches alternatives implique les tests de racine unitaire et la technique de cointégration dans les études économétriques.
Le coefficient estimé associé à une variable de tendance linéaire telle que le temps est interprété comme une mesure de l’impact d’un certain nombre de facteurs inconnus ou connus mais non mesurables sur la variable dépendante sur une unité de temps. Strictement parlant, cette interprétation n’est applicable que pour la période d’estimation. En dehors de cette période, on ne sait pas comment ces facteurs non mesurables se comportent qualitativement et quantitativement. Par ailleurs, la linéarité de la tendance temporelle pose de nombreuses questions :
(i) Pourquoi devrait-elle être linéaire ?
(ii) Si la tendance est non linéaire, alors dans quelles conditions son inclusion influence-t-elle l’ampleur ainsi que la signification statistique des estimations des autres paramètres du modèle ?
(iii) L’inclusion d’une tendance temporelle linéaire dans un modèle exclut par hypothèse la présence de fluctuations dans les tendances de la variable dépendante au fil du temps ; cela est-il nécessairement valable dans un contexte particulier ?
(iv) Et, une relation fallacieuse existe-t-elle dans le modèle parce qu’une variable causale sous-jacente présente elle-même une tendance temporelle ?
Des résultats de recherche de mathématiciens, statisticiens, économètres et économistes ont été publiés en réponse à ces questions. Par exemple, des notes détaillées sur la signification des tendances temporelles linéaires dans le modèle de régression sont données dans Cameron (2005) ; Granger, Engle et beaucoup d’autres économétriciens ont écrit sur la stationnarité, le test de racine unitaire, la co-intégration et des questions connexes (un résumé de certains des travaux dans ce domaine peut être trouvé dans un document d’information de l’Académie royale suédoise des sciences (2003) ; et Ho-Trieu & Tucker (1990) ont écrit sur les tendances temporelles logarithmiques avec des résultats indiquant que les tendances temporelles linéaires sont des cas particuliers de cycles.
Exemple : série temporelle bruyanteEdit
Il est plus difficile de voir une tendance dans une série temporelle bruyante. Par exemple, si la vraie série est 0, 1, 2, 3 tous plus un certain « bruit » indépendant normalement distribué e d’écart type E, et que nous avons une série d’échantillons de longueur 50, alors si E = 0,1 la tendance sera évidente ; si E = 100 la tendance sera probablement visible ; mais si E = 10000 la tendance sera enterrée dans le bruit.
Si nous considérons un exemple concret, l’enregistrement de la température globale de surface des 140 dernières années tel que présenté par le GIEC : alors la variation interannuelle est d’environ 0,2 °C et la tendance d’environ 0,6 °C sur 140 ans, avec des limites de confiance à 95% de 0,2 °C (par coïncidence, à peu près la même valeur que la variation interannuelle). Par conséquent, la tendance est statistiquement différente de 0. Cependant, comme on l’a noté ailleurs, cette série chronologique ne se conforme pas aux hypothèses nécessaires pour que les moindres carrés soient valides.