Definiciones de Estadística > Multicolinealidad
¿Qué es la Multicolinealidad?
La multicolinealidad puede afectar negativamente a los resultados de la regresión.
Una forma fácil de detectar la multicolinealidad es calcular los coeficientes de correlación para todos los pares de variables predictoras. Si el coeficiente de correlación, r, es exactamente +1 o -1, esto se llama multicolinealidad perfecta. Si r está cerca o es exactamente -1 o +1, una de las variables debe ser eliminada del modelo si es posible.
Es más común que la multicolinealidad haga acto de presencia en los estudios observacionales; es menos común con los datos experimentales. Cuando esta condición está presente, puede dar lugar a estimaciones de regresión inestables y poco fiables. Varios otros problemas pueden interferir con el análisis de los resultados, incluyendo:
- El estadístico t será generalmente muy pequeño y los intervalos de confianza del coeficiente serán muy amplios. Esto significa que es más difícil rechazar la hipótesis nula.
- El coeficiente de regresión parcial puede ser una estimación imprecisa; los errores estándar pueden ser muy grandes.
- Los coeficientes de regresión parcial pueden tener cambios de signo y/o magnitud al pasar de una muestra a otra.
- La multicolinealidad dificulta la medición del efecto de las variables independientes sobre las variables dependientes.
¿Qué causa la multicolinealidad?
Los dos tipos son:
- Multicolinealidad basada en los datos: causada por experimentos mal diseñados, datos que son 100% observacionales o métodos de recogida de datos que no pueden ser manipulados. En algunos casos, las variables pueden estar muy correlacionadas (normalmente debido a la recogida de datos de estudios puramente observacionales) y no hay ningún error por parte del investigador. Por esta razón, debe realizar experimentos siempre que sea posible, fijando el nivel de las variables predictoras de antemano.
- Multicolinealidad estructural: causada por usted, el investigador, al crear nuevas variables predictoras.
- Datos insuficientes. En algunos casos, la recopilación de más datos puede resolver el problema.
- Las variables ficticias pueden utilizarse incorrectamente. Por ejemplo, el investigador puede no excluir una categoría, o añadir una variable ficticia para cada categoría (por ejemplo, primavera, verano, otoño, invierno).
- Incluir una variable en la regresión que en realidad es una combinación de otras dos variables. Por ejemplo, incluir «ingresos totales de inversión» cuando los ingresos totales de inversión = ingresos de acciones y bonos + ingresos de intereses de ahorro.
- Incluir dos variables idénticas (o casi idénticas). Por ejemplo, el peso en libras y el peso en kilos, o las rentas de inversión y las rentas del ahorro/bonos.
- Siguiente: Factores de inflación de la varianza.
Beyer, W. H. CRC Standard Mathematical Tables, 31st ed. Boca Ratón, FL: CRC Press, pp. 536 y 571, 2002.
Dodge, Y. (2008). The Concise Encyclopedia of Statistics. Springer.
Klein, G. (2013). La introducción de dibujos animados a la estadística. Hill & Wamg.
Vogt, W.P. (2005). Diccionario de estadística & Metodología: Una guía no técnica para las ciencias sociales. SAGE.Cite esto como:
Stephanie Glen. «Multicollinearity: Definition, Causes, Examples» From StatisticsHowTo.com: ¡Estadística elemental para el resto de nosotros! https://www.statisticshowto.com/multicollinearity/——————————————————————————
¿Necesitas ayuda con los deberes o con un examen? Con Chegg Study, puedes obtener soluciones paso a paso a tus preguntas de un experto en la materia. ¡Tus primeros 30 minutos con un tutor de Chegg son gratis!
¿Comentarios? Necesitas publicar una corrección? Publica un comentario en nuestra página de Facebook.
Las causas de la multicolinealidad también pueden incluir: