- p>Definições estatísticas > Multicolinearidade
O que é a Multicolinearidade?
p>br>Multicolinearidade pode afectar negativamente os seus resultados de regressão.br>Multicolinearidade ocorre geralmente quando existem correlações elevadas entre duas ou mais variáveis preditoras. Por outras palavras, uma variável preditora pode ser usada para prever a outra. Isto cria informação redundante, enviesando os resultados para um modelo de regressão. Exemplos de variáveis preditoras correlacionadas (também chamadas preditores multicolineares) são: altura e peso de uma pessoa, idade e preço de venda de um carro, ou anos de escolaridade e rendimento anual.
Uma forma fácil de detectar a multicolinearidade é calcular coeficientes de correlação para todos os pares de variáveis preditoras. Se o coeficiente de correlação, r, for exactamente +1 ou -1, chama-se a isto multicolinearidade perfeita. Se r for próximo ou exactamente -1 ou +1, uma das variáveis deve ser retirada do modelo, se possível.
É mais comum que a multicolinearidade recue em estudos observacionais; é menos comum com dados experimentais. Quando a condição está presente, pode resultar em estimativas de regressão instáveis e pouco fiáveis. Vários outros problemas podem interferir com a análise dos resultados, incluindo:
- A estatística t será geralmente muito pequena e os intervalos de confiança dos coeficientes serão muito amplos. Isto significa que é mais difícil rejeitar a hipótese nula.
- O coeficiente de regressão parcial pode ser uma estimativa imprecisa; os erros padrão podem ser muito grandes.
- Coeficientes de regressão parcial podem ter alterações de sinal e/ou magnitude à medida que passam de amostra para amostra.
- Multicolinearidade torna difícil medir o efeito de variáveis independentes sobre variáveis dependentes.
O que causa a multicolinearidade?
Os dois tipos são:
ul> - Multicolinearidade baseada em dados: causada por experiências mal concebidas, dados que são 100% observacionais, ou métodos de recolha de dados que não podem ser manipulados. Em alguns casos, as variáveis podem estar altamente correlacionadas (geralmente devido à recolha de dados de estudos puramente observacionais) e não há erro da parte do investigador. Por esta razão, deve realizar experiências sempre que possível, definindo antecipadamente o nível das variáveis preditoras.
- Multicolinearidade estrutural: causada por si, o investigador, criando novas variáveis preditoras.
As causas da multicolinearidade também podem incluir:
- Dados insuficientes. Em alguns casos, a recolha de mais dados pode resolver o problema.
- Variáveis fictícias podem ser utilizadas incorrectamente. Por exemplo, o investigador pode não excluir uma categoria, ou adicionar uma variável fictícia para cada categoria (por exemplo, Primavera, Verão, Outono, Inverno).
- Incluindo uma variável na regressão que é na realidade uma combinação de duas outras variáveis. Por exemplo, incluindo “rendimento total do investimento” quando rendimento total do investimento = rendimento de acções e obrigações + rendimento de juros da poupança.
- Incluindo duas variáveis idênticas (ou quase idênticas). Por exemplo, peso em libras e peso em quilos, ou rendimentos de investimento e rendimentos de poupança/obrigações.
P>Próximo: Factores de Inflação de Variação.
Beyer, W. H. CRC Standard Mathematical Tables, 31st ed. Boca Raton, FL: CRC Press, pp. 536 e 571, 2002.
Dodge, Y. (2008). The Concise Encyclopedia of Statistics (Enciclopédia Concisa de Estatística). Springer.
Klein, G. (2013). The Cartoon Introduction to Statistics (Introdução à Estatística). Hill & Wamg.
Vogt, W.P. (2005). Dicionário de Estatística & Metodologia: Um Guia Não Técnico para as Ciências Sociais. SAGE.
Stephanie Glen. “Multicolinearidade: Definição, Causas, Exemplos” de StatisticsHowTo.com: Estatística elementar para o resto de nós! https://www.statisticshowto.com/multicollinearity/
——————————————————————————
p>Need help with a homework or test question? Com o Chegg Study, pode obter soluções passo a passo para as suas perguntas de um especialista na matéria. Os seus primeiros 30 minutos com um tutor do Chegg são gratuitos!
Comentários? Precisa de colocar uma correcção? Por favor, publique um comentário na nossa página do Facebook.