Articles

Was ist Autokorrelation?

Posted on

Autokorrelation ist eine Eigenschaft von Daten, die den Grad der Ähnlichkeit zwischen den Werten der gleichen Variablen über aufeinanderfolgende Zeitintervalle zeigt. In diesem Beitrag wird erklärt, was Autokorrelation ist, welche Arten von Autokorrelation es gibt – positive und negative Autokorrelation – und wie man Autokorrelation diagnostiziert und testet.

Wenn Sie eine Reihe von Zahlen haben und es ein solches Muster gibt, dass Werte in der Reihe auf der Grundlage vorhergehender Werte in der Reihe vorhergesagt werden können, sagt man, dass die Reihe von Zahlen Autokorrelation aufweist. Dies wird auch als serielle Korrelation und serielle Abhängigkeit bezeichnet. Das Vorhandensein von Autokorrelation in den Residuen eines Modells ist ein Zeichen dafür, dass das Modell möglicherweise nicht solide ist. Autokorrelation wird mit Hilfe eines Korrelationsdiagramms (ACF-Plot) diagnostiziert und kann mit dem Durbin-Watson-Test getestet werden.

Der Auto-Teil von Autokorrelation kommt aus dem Griechischen und bedeutet, dass Daten mit sich selbst korreliert sind, im Gegensatz zu Daten, die mit anderen Daten korreliert sind. Betrachten Sie die neun Werte von Y unten. Die Spalte auf der rechten Seite zeigt die letzten acht dieser Werte, die um eine Zeile nach oben verschoben wurden, wobei der erste Wert gelöscht wurde. Wenn wir diese beiden Datenspalten miteinander korrelieren, ohne die letzte Beobachtung, die fehlende Werte aufweist, beträgt die Korrelation 0,64. Das bedeutet, dass die Daten mit sich selbst korreliert sind (d. h., wir haben eine Autokorrelation/Serienkorrelation).

Positive und negative Autokorrelation

Das obige Beispiel zeigt eine positive Autokorrelation erster Ordnung, wobei erste Ordnung bedeutet, dass Beobachtungen, die um eins auseinander liegen, korreliert sind, und positiv bedeutet, dass die Korrelation zwischen den Beobachtungen positiv ist. Wenn Daten, die eine positive Korrelation erster Ordnung aufweisen, aufgetragen werden, erscheinen die Punkte in einer glatten, schlangenartigen Kurve, wie links dargestellt. Bei negativer Korrelation erster Ordnung bilden die Punkte ein Zickzack-Muster, wenn sie miteinander verbunden sind, wie auf der rechten Seite dargestellt.

Positive und negative Autokorrelation

Positive und negative Autokorrelation

Diagnose der Autokorrelation mit Hilfe eines Korrelationsdiagramms

Ein Korrelationsdiagramm zeigt die Korrelation einer Reihe von Daten mit sich selbst; Es ist auch als Autokorrelationsdiagramm und ACF-Diagramm bekannt. Das Korrelationsdiagramm ist für die oben gezeigten Daten. Die Verzögerung bezieht sich auf die Reihenfolge der Korrelation. Wir können in diesem Diagramm sehen, dass bei einer Verzögerung von 0 die Korrelation 1 ist, da die Daten mit sich selbst korreliert sind. Bei einem Lag von 1 ist die Korrelation etwa 0,5 (dies unterscheidet sich von der oben berechneten Korrelation, da das Korrelationsdiagramm eine etwas andere Formel verwendet). Wir können auch sehen, dass wir negative Korrelationen haben, wenn die Punkte 3, 4 und 5 voneinander entfernt sind.

Diagnose von Autokorrelation mit Hilfe eines Korrelationsdiagramms

Diagnose von Autokorrelation mit Hilfe eines Korrelationsdiagramms

Testen auf Autokorrelation

Alleine aufgrund des Stichprobenfehlers wird man typischerweise eine gewisse Autokorrelation in jedem Datensatz sehen, Daher ist ein statistischer Test erforderlich, um die Möglichkeit auszuschließen, dass Stichprobenfehler die Autokorrelation verursachen. Der Standardtest hierfür ist der Durbin-Watson-Test. Dieser Test testet nur explizit die Korrelation erster Ordnung, aber in der Praxis neigt er dazu, die meisten gängigen Formen der Autokorrelation zu erkennen, da die meisten Formen der Autokorrelation ein gewisses Maß an Korrelation erster Ordnung aufweisen.

Die Implikationen der Autokorrelation

Wenn Autokorrelation in den Residuen eines Modells erkannt wird, deutet dies darauf hin, dass das Modell falsch spezifiziert ist (d.h. in gewisser Weise falsch). Eine Ursache ist, dass einige Schlüsselvariable oder -variablen im Modell fehlen. Wenn die Daten über Raum oder Zeit hinweg gesammelt wurden und das Modell dies nicht explizit berücksichtigt, ist eine Autokorrelation wahrscheinlich. Wenn z. B. ein Wettermodell in einem Vorort falsch ist, wird es wahrscheinlich in einem benachbarten Vorort auf die gleiche Weise falsch sein. Die Lösung besteht darin, entweder die fehlenden Variablen einzubeziehen oder die Autokorrelation explizit zu modellieren (z. B. mit einem ARIMA-Modell).

Das Vorhandensein von Autokorrelation bedeutet, dass berechnete Standardfehler und folglich p-Werte irreführend sind.

Für Displayr anmelden

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.