Articles

Multicollinearità: Definizione, cause, esempi

Posted on
Condividi su

Definizioni di statistica > Multicollinearità

Cos’è la multicollinearità?

multicollinearità

La multicollinearità può influenzare negativamente i risultati della regressione. In altre parole, una variabile predittiva può essere usata per predire l’altra. Questo crea informazioni ridondanti, alterando i risultati in un modello di regressione. Esempi di variabili predittive correlate (chiamate anche predittori multicollineari) sono: l’altezza e il peso di una persona, l’età e il prezzo di vendita di un’auto, o gli anni di istruzione e il reddito annuale.

Un modo semplice per rilevare la multicollinearità è calcolare i coefficienti di correlazione per tutte le coppie di variabili predittive. Se il coefficiente di correlazione, r, è esattamente +1 o -1, si parla di multicollinearità perfetta. Se r è vicino o esattamente -1 o +1, una delle variabili dovrebbe essere rimossa dal modello, se possibile.


È più comune che la multicollinearità si manifesti in studi osservazionali; è meno comune nei dati sperimentali. Quando la condizione è presente, può risultare in stime di regressione instabili e inaffidabili. Molti altri problemi possono interferire con l’analisi dei risultati, tra cui:

  • La statistica t sarà generalmente molto piccola e gli intervalli di confidenza dei coefficienti saranno molto ampi. Questo significa che è più difficile rifiutare l’ipotesi nulla.
  • Il coefficiente di regressione parziale può essere una stima imprecisa; gli errori standard possono essere molto grandi.
  • I coefficienti di regressione parziale possono avere cambiamenti di segno e/o di grandezza nel passaggio da un campione all’altro.
  • La multicollinearità rende difficile valutare l’effetto delle variabili indipendenti sulle variabili dipendenti.

Cosa causa la multicollinearità?

I due tipi sono:


  • Multicollinearità basata sui dati: causata da esperimenti mal progettati, dati che sono al 100% osservazionali, o metodi di raccolta dati che non possono essere manipolati. In alcuni casi, le variabili possono essere altamente correlate (di solito a causa della raccolta di dati da studi puramente osservazionali) e non c’è alcun errore da parte del ricercatore. Per questo motivo, dovreste condurre esperimenti quando possibile, impostando in anticipo il livello delle variabili predittrici.
  • Multicollinearità strutturale: causata da voi, il ricercatore, che create nuove variabili predittrici.

Le cause di multicollinearità possono anche includere:

  • Dati insufficienti. In alcuni casi, raccogliere più dati può risolvere il problema.
  • Le variabili dummy possono essere usate in modo errato. Per esempio, il ricercatore potrebbe non riuscire ad escludere una categoria, o aggiungere una variabile dummy per ogni categoria (ad esempio, primavera, estate, autunno, inverno).
  • Includere una variabile nella regressione che è in realtà una combinazione di altre due variabili. Per esempio, includendo “reddito totale da investimento” quando il reddito totale da investimento = reddito da azioni e obbligazioni + reddito da interessi di risparmio.
  • Includendo due variabili identiche (o quasi identiche). Per esempio, peso in libbre e peso in chili, o reddito da investimento e reddito da risparmio/obbligazioni.
  • Prossimo: Fattori di inflazione della varianza.

    Beyer, W. H. CRC Standard Mathematical Tables, 31st ed. Boca Raton, FL: CRC Press, pp. 536 e 571, 2002.
    Dodge, Y. (2008). The Concise Encyclopedia of Statistics. Springer.
    Klein, G. (2013). The Cartoon Introduction to Statistics. Hill & Wamg.
    Vogt, W.P. (2005). Dizionario di statistica & Metodologia: A Nontechnical Guide for the Social Sciences. SAGE.

    CITA QUESTO COME:
    Stephanie Glen. “Multicollinearità: Definizione, cause, esempi” da StatisticsHowTo.com: Statistica elementare per il resto di noi! https://www.statisticshowto.com/multicollinearity/

    ——————————————————————————

    Hai bisogno di aiuto per un compito a casa o per un test? Con Chegg Study, puoi ottenere soluzioni passo dopo passo alle tue domande da un esperto del settore. I tuoi primi 30 minuti con un tutor Chegg sono gratuiti!

    Commenti? Hai bisogno di pubblicare una correzione? Pubblica un commento sulla nostra pagina Facebook.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *