時系列データを分析するために、トレンド+ノイズとして表現できると仮定します。
y t = a t + b + e t {\displaystyle y_{t}=at+b+e_{t},}
ここで、a{{displaystyle a}}
とb{{displaystyle b}
は未知の定数であり、e{{displaystyle e}}は
‘sはランダムに分布する誤差である。 誤差が非定常であるという帰無仮説を棄却することができれば、非定常系列{yt }はトレンド定常と呼ばれる。 最小二乗法では、誤差が独立に正規分布していると仮定する。 もしそうでなければ,未知のパラメータaとbに関する仮説検定は不正確になる可能性がある。 一番簡単なのは,誤差が正規分布で独立に分布している場合です.
‘sがすべて同じ分布を持っている場合が最も簡単ですが、そうでない場合(一部のデータがより高い分散を持っている場合、それらのデータポイントは実質的にあまり確実ではないことを意味します)は、各ポイントをそのポイントの分散の逆数で重み付けすることにより、最小二乗法によるフィッティングの際にこれを考慮することができます。
ほとんどの場合、分析対象となる時系列が1つしかない場合、e {displaystyle e}の分散が考慮されます。
‘sは、推定パラメータ値a ^ {displaystyle {\{a}}}を得るために、トレンドをフィッティングすることで推定されます。
and b ^ , {\\\{b}},}
したがって、予測値 y ^ = a ^ t + b ^
データy t {\{y_{t}}}から差し引くことができる。
(このようにしてデータのトレンドを外し)、残差e ^ t {displaystyle {\hat {e}}_{t}}を残します。
をトレンド除去されたデータとして残し,e t {displaystyle e_{t}}の分散を推定する。
‘sを残差から推定する – これがe t {displaystyle e_{t}}の分散を推定する唯一の方法であることが多い。
‘s。
シリーズの “ノイズ “がわかったら、トレンドの有意性を評価するために、トレンドのa ^ {displaystyle a}
が0から異ならないという帰無仮説を立てることができます。上述の、既知の分散を持つランダムなデータのトレンドに関する議論から、ランダムな(トレンドのない)データから期待される計算されたトレンドの分布がわかります。 推定されたトレンドが a ^ {displaystyle {hat {a}}} であれば
がある有意水準の臨界値より大きい場合、その有意水準では推定されたトレンドはゼロと有意に異なると判断され、トレンドがゼロであるという帰無仮説は棄却されます。
線形トレンドラインの使用は批判の対象となっており、モデルの推定において線形トレンドラインの使用を避けるための代替アプローチが模索されています。
時間のような線形トレンド変数に関連する推定係数は、1つの単位時間における従属変数への多数の未知または既知だが測定不可能な要因の影響の尺度として解釈されます。 厳密に言えば、この解釈は推定の時間枠にのみ適用されます。 その時間枠の外では、それらの測定不可能な要因が質的にも量的にもどのように振る舞うかはわかりません。
(i) なぜ線形でなければならないのか
(ii) トレンドが非線形である場合、どのような条件でそれを含めると、モデル内の他のパラメータの推定値の大きさや統計的有意性に影響するのか。
(iii) 線形タイムトレンドをモデルに含めると、従属変数の傾向に時間的な変動があることを前提として排除されますが、これは特定の文脈では必ずしも有効なのでしょうか。
(iv) また、根本的な原因変数がタイムトレンドであるために、モデル内に偽の関係が存在することはないのでしょうか。
これらの疑問に対して、数学者、統計学者、計量経済学者、経済学者の研究成果が発表されています。 例えば、回帰モデルにおける線形時間トレンドの意味については、Cameron (2005)に詳細なメモがあります。また、Granger、Engleをはじめとする多くの計量経済学者が、定常性、単位根検定、共統合などの問題について執筆しています(この分野の研究の一部は、スウェーデン王立科学アカデミーの情報論文(2003)にまとめられています。 や Ho-Trieu & Tucker (1990) は、対数の時間トレンドについて書いており、線形の時間トレンドがサイクルの特別なケースであることを示す結果を示しています。
Example: noisy time seriesEdit
ノイズの多い時系列ではトレンドを見ることは困難です。 例えば、真の時系列が 0, 1, 2, 3 で、それに加えて標準偏差 E の独立した正規分布の「ノイズ」e があり、長さ 50 のサンプル時系列があるとすると、E = 0.1 の場合はトレンドが明らかになり、E = 100 の場合はおそらくトレンドが見えますが、E = 10000 の場合はトレンドはノイズの中に埋もれてしまいます。
具体的な例として、IPCCが発表した過去140年間の世界の地表面温度の記録を考えてみましょう。この140年間の経年変動は約0.2 °C、トレンドは約0.6 °Cで、95%信頼限界は0.2 °Cです(偶然にも、経年変動とほぼ同じ値です)。 しかし、別の場所で述べたように、この時系列は最小二乗法が有効であるために必要な仮定に適合していません。