Een regressie beoordeelt of variabelen die voorspellend zijn, variabiliteit in een afhankelijke variabele verklaren. Op deze pagina wordt een beschrijving gegeven van voorbeeldonderzoeksvragen voor regressieanalyse, aannames voor regressie, de evaluatie van het R-kwadraat (determinatiecoëfficiënt), de F-toets, de interpretatie van de bètacoëfficiënt(en), en de regressievergelijking.
Voorbeeldvragen beantwoord door een regressieanalyse:
Voorspellen leeftijd en geslacht de houding ten opzichte van wapenbezit?
Beïnvloeden de vijf facetten van mindfulness de peace of mind scores?
Aannames:
Eerst, regressieanalyse is gevoelig voor uitschieters. Uitschieters kunnen worden geïdentificeerd door de scores te standaardiseren en de gestandaardiseerde scores te controleren op absolute waarden hoger dan 3,29. Dergelijke waarden kunnen als uitbijters worden beschouwd en moeten uit de gegevens worden verwijderd.
Ten tweede zijn de belangrijkste aannamen voor regressie: normaliteit, homoscedasticiteit en afwezigheid van multicollineariteit. Normaliteit kan worden beoordeeld door een normale P-P-plot te onderzoeken. Indien de gegevens een rechte lijn vormen langs de diagonaal, dan kan normaliteit worden aangenomen. Om de homoscedasticiteit te beoordelen, kan de onderzoeker een scatterplot maken van gestandaardiseerde residuen versus gestandaardiseerde voorspelde waarden. Als de grafiek een willekeurige spreiding vertoont, is aan de aanname voldaan. Als de spreiding echter een kegelvorm heeft, dan is niet aan de aanname voldaan. Multicollineariteit kan worden beoordeeld aan de hand van berekende variantie-inflatiefactoren (VIF’s). VIF-waarden hoger dan 10 geven aan dat multicollineariteit een probleem kan zijn.
F-test
Wanneer de regressie wordt uitgevoerd, wordt een F-waarde berekend, en het significantieniveau van die F-waarde. Als de F-waarde statistisch significant is (meestal p < .05), verklaart het model een significante hoeveelheid variantie in de uitkomstvariabele.
Evaluatie van de R-Square
Wanneer de regressie wordt uitgevoerd, wordt een R2-statistiek (determinatiecoëfficiënt) berekend. De R2 kan worden geïnterpreteerd als het percentage variantie in de uitkomstvariabele dat wordt verklaard door de reeks voorspellende variabelen.
Evaluatie van de aangepaste R-Square
De aangepaste R2-waarde is een berekening van de R2 die is aangepast op basis van het aantal voorspellende variabelen in het model.
Bètacoëfficiënten
Na de evaluatie van de F-waarde en de R2 is het van belang de regressie-bètacoëfficiënten te evalueren. De bètacoëfficiënten kunnen negatief of positief zijn, en hebben een t-waarde en de significantie van de t-waarde die aan elk ervan zijn verbonden. De bètacoëfficiënt is de mate van verandering in de uitkomstvariabele voor elke verandering van 1 eenheid in de voorspellende variabele. Met de t-toets wordt nagegaan of de bètacoëfficiënt significant verschillend is van nul. Als de bètacoëfficiënt niet statistisch significant is (d.w.z. de t-waarde is niet significant), voorspelt de variabele de uitkomst niet significant. Als de bètacoëfficiënt significant is, onderzoekt u het teken van de bèta. Als de bètacoëfficiënt positief is, is de interpretatie dat voor elke toename van 1 eenheid in de voorspellende variabele, de uitkomstvariabele zal toenemen met de waarde van de bètacoëfficiënt. Als de bètacoëfficiënt negatief is, is de interpretatie dat voor elke toename van 1 eenheid in de voorspellende variabele, de uitkomstvariabele zal afnemen met de waarde van de bètacoëfficiënt. Als de bètacoëfficiënt bijvoorbeeld .80 is en ik statistisch significant, dan zal voor elke toename van 1 eenheid in de voorspellende variabele, de uitkomstvariabele toenemen met .80 eenheden.
Equation
Als de bètacoëfficiënt eenmaal is bepaald, kan een regressievergelijking worden geschreven. Met behulp van het voorbeeld en de bètacoëfficiënt hierboven kan de vergelijking als volgt worden geschreven:
y= 0,80x + c, waarbij y de uitkomstvariabele is, x de voorspellende variabele, 0,80 de bètacoëfficiënt, en c een constante.
*Voor hulp bij het uitvoeren van regressies of andere kwantitatieve analyses klik hier.
Gerelateerde pagina’s:
Lineaire regressie
Meervoudige lineaire regressie
Logistische regressie
Ordinale regressie