Articles

Multicollineariteit: Definitie, Oorzaken, Voorbeelden

Posted on
Deel op

Statistiek Definities > Multicollineariteit

Wat is Multicollineariteit?

multicollineariteit

Multicollineariteit kan uw regressieresultaten negatief beïnvloeden.

Multicollineariteit treedt in het algemeen op wanneer er hoge correlaties bestaan tussen twee of meer voorspellende variabelen. Met andere woorden, de ene voorspellende variabele kan worden gebruikt om de andere te voorspellen. Hierdoor ontstaat overbodige informatie, die de resultaten in een regressiemodel vertekent. Voorbeelden van gecorreleerde voorspellende variabelen (ook wel multicollineaire voorspellers genoemd) zijn: de lengte en het gewicht van een persoon, de leeftijd en de verkoopprijs van een auto, of het aantal jaren opleiding en het jaarinkomen.

Een gemakkelijke manier om multicollineariteit te detecteren is het berekenen van correlatiecoëfficiënten voor alle paren van voorspellende variabelen. Als de correlatiecoëfficiënt, r, precies +1 of -1 is, is er sprake van perfecte multicollineariteit. Als r dicht bij of precies -1 of +1 is, moet een van de variabelen zo mogelijk uit het model worden verwijderd.


Het komt vaker voor dat multicollineariteit de kop opsteekt bij observationele studies; bij experimentele gegevens is dat minder vaak het geval. Als deze aandoening zich voordoet, kan dat leiden tot onstabiele en onbetrouwbare regressieschattingen. Verscheidene andere problemen kunnen de analyse van de resultaten bemoeilijken, waaronder:

  • De t-statistiek zal in het algemeen zeer klein zijn en de betrouwbaarheidsintervallen van de coëfficiënten zullen zeer breed zijn. Dit betekent dat het moeilijker is de nulhypothese te verwerpen.
  • De partiële regressiecoëfficiënt kan een onnauwkeurige schatting zijn; de standaardfouten kunnen zeer groot zijn.
  • Partiële regressiecoëfficiënten kunnen teken- en/of grootteveranderingen vertonen naarmate ze van steekproef tot steekproef overgaan.
  • Multicollineariteit maakt het moeilijk het effect van onafhankelijke variabelen op afhankelijke variabelen te peilen.

Waardoor ontstaat multicollineariteit?

De twee typen zijn:


  • Gegevensgerelateerde multicollineariteit: veroorzaakt door slecht ontworpen experimenten, gegevens die voor 100% observationeel zijn, of methoden van gegevensverzameling die niet kunnen worden gemanipuleerd. In sommige gevallen kunnen variabelen sterk gecorreleerd zijn (meestal als gevolg van het verzamelen van gegevens uit louter observationele studies) en is er geen sprake van een fout van de kant van de onderzoeker. Daarom moet je waar mogelijk experimenten uitvoeren, waarbij je het niveau van de voorspellende variabelen van tevoren vaststelt.
  • Structurele multicollineariteit: veroorzaakt doordat jij, de onderzoeker, nieuwe voorspellende variabelen creëert.

Oorzaken voor multicollineariteit kunnen ook zijn:

  • Onvoldoende gegevens. In sommige gevallen kan het probleem worden opgelost door meer gegevens te verzamelen.
  • Dummy-variabelen kunnen onjuist zijn gebruikt. De onderzoeker kan bijvoorbeeld nalaten een categorie uit te sluiten, of voor elke categorie een dummy-variabele toevoegen (bijv. lente, zomer, herfst, winter).
  • Inclusie van een variabele in de regressie die eigenlijk een combinatie is van twee andere variabelen. Bijvoorbeeld het opnemen van “totaal beleggingsinkomen” wanneer totaal beleggingsinkomen = inkomen uit aandelen en obligaties + inkomen uit spaarrente.
  • Het opnemen van twee identieke (of bijna identieke) variabelen. Bijvoorbeeld, gewicht in ponden en gewicht in kilo’s, of inkomen uit beleggingen en inkomen uit sparen/obligaties.
  • Volgende: Variantie-inflatiefactoren.

    Beyer, W. H. CRC Standard Mathematical Tables, 31st ed. Boca Raton, FL: CRC Press, pp. 536 en 571, 2002.
    Dodge, Y. (2008). De Beknopte Encyclopedie van de Statistiek. Springer.
    Klein, G. (2013). De strip Inleiding tot de Statistiek. Hill & Wamg.
    Vogt, W.P. (2005). Woordenboek van de Statistiek & Methodologie: A Nontechnical Guide for the Social Sciences. SAGE.

    CITE THIS AS:
    Stephanie Glen. “Multicollineariteit: Definition, Causes, Examples” Van StatisticsHowTo.com: Elementaire Statistiek voor de rest van ons! https://www.statisticshowto.com/multicollinearity/

    ——————————————————————————

    Heb je hulp nodig bij een huiswerk of toetsvraag? Met Chegg Study kunt u stap-voor-stap oplossingen voor uw vragen krijgen van een expert op dit gebied. Uw eerste 30 minuten met een Chegg-leraar zijn gratis!

    Commentaar? Wilt u een correctie plaatsen? Plaats een opmerking op onze Facebook-pagina.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *