Autokorelacja jest cechą danych, która pokazuje stopień podobieństwa pomiędzy wartościami tych samych zmiennych w następujących po sobie przedziałach czasu. Ten post wyjaśnia co to jest autokorelacja, rodzaje autokorelacji – pozytywna i negatywna, jak również jak diagnozować i testować autokorelację.
Gdy masz serię liczb i istnieje wzór taki, że wartości w serii mogą być przewidywane w oparciu o poprzednie wartości w serii, mówi się, że seria liczb wykazuje autokorelację. Jest to również znane jako korelacja seryjna i zależność seryjna. Występowanie autokorelacji w resztach modelu jest oznaką, że model może być nieuzasadniony. Autokorelacja jest diagnozowana za pomocą korelogramu (wykres ACF) i może być testowana za pomocą testu Durbina-Watsona.
Część auto w autokorelacji pochodzi od greckiego słowa oznaczającego „ja”, a autokorelacja oznacza dane, które są skorelowane z samymi sobą, w przeciwieństwie do bycia skorelowanymi z innymi danymi. Rozważmy dziewięć wartości Y poniżej. Kolumna po prawej stronie pokazuje ostatnie osiem z tych wartości, przesunięte „w górę” o jeden rząd, z usuniętą pierwszą wartością. Kiedy skorelujemy te dwie kolumny danych, wyłączając ostatnią obserwację, która ma brakujące wartości, korelacja wynosi 0,64. Oznacza to, że dane są skorelowane z samymi sobą (tzn, mamy autokorelację/korelację szeregową).
Dodatnia i ujemna autokorelacja
Powyższy przykład pokazuje dodatnią autokorelację pierwszego rzędu, gdzie pierwszy rząd oznacza, że obserwacje oddalone od siebie o jeden są skorelowane, a dodatni oznacza, że korelacja między obserwacjami jest dodatnia. Gdy dane wykazujące dodatnią korelację pierwszego rzędu są wykreślone, punkty pojawiają się w postaci gładkiej krzywej przypominającej węża, jak po lewej stronie. W przypadku ujemnej korelacji pierwszego rzędu, punkty tworzą zygzakowaty wzór, jeśli są połączone, jak pokazano po prawej stronie.
Diagnozowanie autokorelacji za pomocą korelogramu
Korelogram pokazuje korelację serii danych z samą sobą; Jest on również znany jako wykres autokorelacji i wykres ACF. Korelogram jest dla danych pokazanych powyżej. Opóźnienie odnosi się do kolejności korelacji. Widzimy na tym wykresie, że przy opóźnieniu 0 korelacja wynosi 1, ponieważ dane są skorelowane z samymi sobą. Przy opóźnieniu 1, korelacja wynosi około 0,5 (jest to inna korelacja niż obliczona powyżej, ponieważ korelogram używa nieco innego wzoru). Widzimy również, że mamy ujemne korelacje, gdy punkty są oddalone od siebie o 3, 4 i 5.
Testowanie autokorelacji
Sam błąd próbkowania oznacza, że zazwyczaj zobaczymy pewną autokorelację w każdym zestawie danych, więc test statystyczny jest wymagany, aby wykluczyć możliwość, że błąd próbkowania jest przyczyną autokorelacji. Standardowym testem do tego celu jest test Durbina-Watsona. Ten test tylko wyraźnie testuje korelację pierwszego rzędu, ale w praktyce ma tendencję do wykrywania najbardziej powszechnych form autokorelacji, ponieważ większość form autokorelacji wykazuje pewien stopień korelacji pierwszego rzędu.
Implikacje autokorelacji
Gdy autokorelacja jest wykrywana w resztach z modelu, sugeruje to, że model jest źle określony (tj. w pewnym sensie błędny). Przyczyną jest brak jakiejś kluczowej zmiennej lub zmiennych w modelu. Jeżeli dane zostały zebrane w przestrzeni lub czasie, a model nie uwzględnia tego w sposób wyraźny, prawdopodobna jest autokorelacja. Na przykład, jeśli model pogodowy jest błędny na jednym przedmieściu, prawdopodobnie będzie błędny w ten sam sposób na sąsiednim przedmieściu. Poprawką jest albo uwzględnienie brakujących zmiennych, albo wyraźne modelowanie autokorelacji (np. za pomocą modelu ARIMA).
Istnienie autokorelacji oznacza, że obliczone błędy standardowe, a w konsekwencji wartości p, są mylące.
Zaloguj się, aby wyświetlićr
Zapisz się, aby wyświetlićr