Articles

Multikollinearität: Definition, Ursachen, Beispiele

Posted on
Share on

Statistik Definitionen > Multikollinearität

Was ist Multikollinearität?

Multikollinearität

Multikollinearität kann Ihre Regressionsergebnisse negativ beeinflussen.

Multikollinearität tritt im Allgemeinen auf, wenn hohe Korrelationen zwischen zwei oder mehr Prädiktorvariablen bestehen. Mit anderen Worten: Eine Prädiktorvariable kann zur Vorhersage der anderen verwendet werden. Dadurch entstehen redundante Informationen, die die Ergebnisse in einem Regressionsmodell verzerren. Beispiele für korrelierte Prädiktorvariablen (auch multikollineare Prädiktoren genannt) sind: Größe und Gewicht einer Person, Alter und Verkaufspreis eines Autos oder Ausbildungsjahre und Jahreseinkommen.

Eine einfache Möglichkeit, Multikollinearität zu erkennen, ist die Berechnung von Korrelationskoeffizienten für alle Paare von Prädiktorvariablen. Wenn der Korrelationskoeffizient, r, genau +1 oder -1 ist, spricht man von perfekter Multikollinearität. Wenn r nahe oder genau -1 oder +1 ist, sollte eine der Variablen aus dem Modell entfernt werden, wenn dies möglich ist.


Multikollinearität tritt häufiger bei Beobachtungsstudien auf; bei experimentellen Daten ist sie weniger häufig. Wenn diese Bedingung vorhanden ist, kann sie zu instabilen und unzuverlässigen Regressionsschätzungen führen. Mehrere andere Probleme können die Analyse der Ergebnisse beeinträchtigen, einschließlich:

  • Die t-Statistik wird im Allgemeinen sehr klein sein und die Konfidenzintervalle der Koeffizienten werden sehr breit sein. Das bedeutet, dass es schwieriger ist, die Nullhypothese zurückzuweisen.
  • Der partielle Regressionskoeffizient kann eine ungenaue Schätzung sein; die Standardfehler können sehr groß sein.
  • Partielle Regressionskoeffizienten können Vorzeichen- und/oder Größenänderungen aufweisen, wenn sie von Stichprobe zu Stichprobe übergehen.
  • Multikollinearität erschwert es, den Effekt der unabhängigen Variablen auf die abhängigen Variablen zu messen.

Was verursacht Multikollinearität?

Die zwei Arten sind:


  • Datenbasierte Multikollinearität: verursacht durch schlecht konzipierte Experimente, Daten, die zu 100% aus Beobachtungen bestehen, oder Datenerhebungsmethoden, die nicht manipuliert werden können. In einigen Fällen können Variablen hoch korreliert sein (meist aufgrund von Datenerhebungen aus reinen Beobachtungsstudien) und es liegt kein Fehler seitens des Forschers vor. Aus diesem Grund sollten Sie, wann immer möglich, Experimente durchführen und das Niveau der Prädiktorvariablen im Voraus festlegen.
  • Strukturelle Multikollinearität: wird dadurch verursacht, dass Sie, der Forscher, neue Prädiktorvariablen erstellen.

Ursachen für Multikollinearität können auch sein:

  • Unzureichende Daten. In einigen Fällen kann die Erhebung weiterer Daten das Problem lösen.
  • Dummy-Variablen können falsch verwendet werden. Zum Beispiel kann der Forscher es versäumen, eine Kategorie auszuschließen oder eine Dummy-Variable für jede Kategorie hinzuzufügen (z.B. Frühling, Sommer, Herbst, Winter).
  • Einschluss einer Variable in die Regression, die eigentlich eine Kombination aus zwei anderen Variablen ist. Zum Beispiel, Einbeziehung von „Gesamteinkommen aus Kapitalanlagen“, wenn Gesamteinkommen aus Kapitalanlagen = Einkommen aus Aktien und Anleihen + Einkommen aus Sparzinsen.
  • Einbeziehung von zwei identischen (oder fast identischen) Variablen. Zum Beispiel Gewicht in Pfund und Gewicht in Kilo, oder Kapitalerträge und Spar-/Anleiheerträge.
  • Nächster Punkt: Variance Inflation Factors.

    Beyer, W. H. CRC Standard Mathematical Tables, 31st ed. Boca Raton, FL: CRC Press, S. 536 und 571, 2002.
    Dodge, Y. (2008). The Concise Encyclopedia of Statistics. Springer.
    Klein, G. (2013). The Cartoon Introduction to Statistics. Hill & Wamg.
    Vogt, W.P. (2005). Wörterbuch der Statistik& Methodik: A Nontechnical Guide for the Social Sciences. SAGE.

    ZITIEREN SIE DAS ALS:
    Stephanie Glen. „Multikollinearität: Definition, Causes, Examples“ von StatisticsHowTo.com: Elementare Statistik für den Rest von uns! https://www.statisticshowto.com/multicollinearity/

    ——————————————————————————

    Brauchen Sie Hilfe bei einer Hausaufgabe oder einer Prüfungsfrage? Mit Chegg Study können Sie Schritt-für-Schritt-Lösungen zu Ihren Fragen von einem Experten auf dem Gebiet erhalten. Ihre ersten 30 Minuten mit einem Chegg Tutor sind kostenlos!

    Kommentare? Möchten Sie eine Korrektur posten? Bitte posten Sie einen Kommentar auf unserer Facebook-Seite.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.