Definizioni di statistica > Multicollinearità
Cos’è la multicollinearità?
La multicollinearità può influenzare negativamente i risultati della regressione. In altre parole, una variabile predittiva può essere usata per predire l’altra. Questo crea informazioni ridondanti, alterando i risultati in un modello di regressione. Esempi di variabili predittive correlate (chiamate anche predittori multicollineari) sono: l’altezza e il peso di una persona, l’età e il prezzo di vendita di un’auto, o gli anni di istruzione e il reddito annuale.
Un modo semplice per rilevare la multicollinearità è calcolare i coefficienti di correlazione per tutte le coppie di variabili predittive. Se il coefficiente di correlazione, r, è esattamente +1 o -1, si parla di multicollinearità perfetta. Se r è vicino o esattamente -1 o +1, una delle variabili dovrebbe essere rimossa dal modello, se possibile.
È più comune che la multicollinearità si manifesti in studi osservazionali; è meno comune nei dati sperimentali. Quando la condizione è presente, può risultare in stime di regressione instabili e inaffidabili. Molti altri problemi possono interferire con l’analisi dei risultati, tra cui:
- La statistica t sarà generalmente molto piccola e gli intervalli di confidenza dei coefficienti saranno molto ampi. Questo significa che è più difficile rifiutare l’ipotesi nulla.
- Il coefficiente di regressione parziale può essere una stima imprecisa; gli errori standard possono essere molto grandi.
- I coefficienti di regressione parziale possono avere cambiamenti di segno e/o di grandezza nel passaggio da un campione all’altro.
- La multicollinearità rende difficile valutare l’effetto delle variabili indipendenti sulle variabili dipendenti.
Cosa causa la multicollinearità?
I due tipi sono:
- Multicollinearità basata sui dati: causata da esperimenti mal progettati, dati che sono al 100% osservazionali, o metodi di raccolta dati che non possono essere manipolati. In alcuni casi, le variabili possono essere altamente correlate (di solito a causa della raccolta di dati da studi puramente osservazionali) e non c’è alcun errore da parte del ricercatore. Per questo motivo, dovreste condurre esperimenti quando possibile, impostando in anticipo il livello delle variabili predittrici.
- Multicollinearità strutturale: causata da voi, il ricercatore, che create nuove variabili predittrici.
Le cause di multicollinearità possono anche includere:
- Dati insufficienti. In alcuni casi, raccogliere più dati può risolvere il problema.
- Le variabili dummy possono essere usate in modo errato. Per esempio, il ricercatore potrebbe non riuscire ad escludere una categoria, o aggiungere una variabile dummy per ogni categoria (ad esempio, primavera, estate, autunno, inverno).
- Includere una variabile nella regressione che è in realtà una combinazione di altre due variabili. Per esempio, includendo “reddito totale da investimento” quando il reddito totale da investimento = reddito da azioni e obbligazioni + reddito da interessi di risparmio.
- Includendo due variabili identiche (o quasi identiche). Per esempio, peso in libbre e peso in chili, o reddito da investimento e reddito da risparmio/obbligazioni.
Prossimo: Fattori di inflazione della varianza.
Beyer, W. H. CRC Standard Mathematical Tables, 31st ed. Boca Raton, FL: CRC Press, pp. 536 e 571, 2002.
Dodge, Y. (2008). The Concise Encyclopedia of Statistics. Springer.
Klein, G. (2013). The Cartoon Introduction to Statistics. Hill & Wamg.
Vogt, W.P. (2005). Dizionario di statistica & Metodologia: A Nontechnical Guide for the Social Sciences. SAGE.
Stephanie Glen. “Multicollinearità: Definizione, cause, esempi” da StatisticsHowTo.com: Statistica elementare per il resto di noi! https://www.statisticshowto.com/multicollinearity/
——————————————————————————
Hai bisogno di aiuto per un compito a casa o per un test? Con Chegg Study, puoi ottenere soluzioni passo dopo passo alle tue domande da un esperto del settore. I tuoi primi 30 minuti con un tutor Chegg sono gratuiti!
Commenti? Hai bisogno di pubblicare una correzione? Pubblica un commento sulla nostra pagina Facebook.