Le variabili di confondimento sono comuni nella ricerca e possono influenzare il risultato del vostro studio. Questo perché l’influenza esterna della variabile di confondimento o del terzo fattore può rovinare il risultato della tua ricerca e produrre risultati inutili suggerendo una connessione inesistente tra le variabili.
Per controllare le variabili di confondimento nella ricerca, è importante sapere come identificare chiaramente questi terzi fattori e sapere come influenzano il risultato della ricerca. Comprendere e controllare le variabili di confondimento vi aiuterà ad ottenere risultati più accurati nella vostra ricerca.
Che cos’è la variabile di confondimento?
Una variabile di confondimento, in termini semplici, si riferisce a una variabile che non viene considerata in un esperimento. Essa agisce come un’influenza esterna che può cambiare rapidamente l’effetto delle variabili di ricerca dipendenti e indipendenti; spesso producendo risultati estremamente diversi da quelli reali.
Nella ricerca correlazionale, le variabili di confondimento possono influenzare la relazione percepita tra le 2 variabili in esame; sia essa positiva, negativa o nulla. Una variabile confondente può anche essere definita come un fattore che un ricercatore non è stato in grado di controllare o rimuovere, e può distorcere la validità del lavoro di ricerca.
Come identificare le variabili di confondimento
Ci sono diversi metodi di ricerca usati per identificare le variabili di confondimento. Il metodo più comune è quello di osservare la misura in cui la rimozione di un fattore nella ricerca fa cambiare il coefficiente di altre variabili indipendenti nella ricerca.
In questo senso, il ricercatore osserva e misura il livello stimato di associazione tra le variabili indipendenti e dipendenti, sia prima che dopo aver fatto gli aggiustamenti. Se la differenza tra i 2 parametri di misurazione è superiore al 10%, allora è presente una variabile confondente.
Un altro metodo per identificare una variabile confondente è quello di determinare se la variabile può essere collegata sia con l’esposizione di interesse che con il risultato di interesse nella ricerca. Se c’è una connessione significativa e misurabile tra la variabile e il fattore di rischio e, tra la variabile e l’esito, allora tale variabile è confondente.
Ci sono diversi metodi di test ipotetici e formali per identificare le variabili di confondimento. Il modello di base, il modello biologico e i modelli di regressione logistica binaria e multivariata sono alcuni dei comuni metodi ipotetici di ricerca utilizzati per identificare le variabili di confondimento.
Le variabili confondenti possono anche essere identificate usando vari test di co-linearità come la misurazione dei fattori di inflazione della varianza. Potete calcolare il fattore di inflazione della varianza per tutte le variabili della vostra ricerca per vedere se questo indicatore è alto per qualsiasi variabile, indicando così un confondente.
Le variabili confondenti sono spesso associate sia al fattore di rischio di interesse che al suo risultato. Di solito sono distribuite in modo ineguale tra le variabili indipendenti e dipendenti nella ricerca e le variabili di confondimento non si trovano tra l’interesse e l’esito della ricerca.
Una variabile confondente può funzionare in 3 modi possibili nella ricerca: come fattore di rischio, come fattore preventivo o come variabile surrogata o marcatore. Le formule comuni per calcolare l’entità del confondimento nella ricerca sono:
- Grado di confusione = (RRcrude – RRadjusted)/RRcrude
- Grado di confusione = (RRcrude – RRadjusted)/RRadjusted
Esempi di variabili di confondimento
Le variabili di confondimento attraversano diversi campi di studio, specialmente la statistica, la metodologia della ricerca e la psicologia. In tutti questi campi, questi fattori terzi mantengono la loro caratteristica primaria di influenzare estremamente i risultati della ricerca delle variabili dipendenti e indipendenti dall’esterno dell’ambiente controllato.
Esempio di variabili confondenti nella ricerca
- La carriera di una madre
La ricerca è condotta per determinare il grado di correlazione tra l’alimentazione con formula per bambini e l’intelligenza nei neonati. Sembrerebbe logico che i bambini allattati con il latte artificiale possano essere meno intelligenti perché non ricevono i nutrienti, le vitamine e i minerali contenuti nel latte materno.
Tuttavia, i fatti possono essere che i bambini allattati con il latte artificiale possono essere anche più intelligenti dei bambini allattati al seno. Il latte artificiale contiene effettivamente nutrienti, vitamine e minerali che possono contribuire ad aumentare l’intelligenza del bambino e a proteggerlo dalle infezioni.
Una variabile confondente in questo caso può essere la carriera della madre, cioè se la madre è una casalinga o una madre operaia. Quando si considera questo terzo fattore, si scoprirebbe che le madri operaie sono più propense a scegliere l’allattamento artificiale perché il loro lavoro potrebbe non permettere loro di allattare sempre al seno i loro bambini.
- Meteo
Si fa una ricerca per determinare il grado di correlazione tra il denaro e la vendita del gelato. La logica può suggerire che c’è una correlazione positiva tra queste 2 variabili; cioè, la gente compra più gelato quando ha più soldi.
Una variabile confondente in questa ricerca può essere il tempo atmosferico, per cui è chiaramente possibile che il tempo sia il fattore causale correlativo. Così, quando il tempo è freddo, le persone lavorano meno e hanno meno soldi per comprare il gelato e, quando il tempo è caldo, le persone lavorano di più e hanno più soldi per il gelato.
In questo esempio, la variabile che causa la relazione tra denaro e gelato è il tempo.
Esempi di Variabili Confondenti in Statistica
- Piano inclinato
Statisticamente, una variabile confondente può entrare in gioco nel caso della relazione tra la forza applicata per lanciare una palla e la distanza che la palla percorre. Logicamente, si presume che più forza si esercita su una palla; più lontano viaggerà.
La variabile confondente, tuttavia, sarebbe la direzione in cui la palla viaggia su una tavola inclinata. Se la palla viaggia verso l’alto, potrebbe viaggiare più lentamente indipendentemente dalla forza e, se viaggia verso il basso, viaggerebbe più velocemente con poco sforzo di forza.
- Abitudini alimentari
Una variabile confondente può anche essere responsabile della correlazione tra esercizio fisico e perdita di peso. La logica naturale potrebbe essere che più si fa esercizio fisico, più è probabile che si perda peso, ma una variabile di confondimento in questa ricerca potrebbero essere le abitudini alimentari.
Questo significa che più la gente mangia, più aumenta di peso e viceversa.
Esempio di variabili confondenti in psicologia
- Sonno
Psicologicamente, una variabile confondente può influenzare la connessione o la relazione tra caffeina e concentrazione. Si nota che più caffeina si prende, più si è concentrati in classe; qui la concentrazione dipende dal livello di caffeina che è la variabile indipendente.
La variabile di confondimento, in questo caso, potrebbe essere il sonno; cioè, si potrebbe aver dormito meglio portando a migliori livelli di concentrazione, indipendentemente dal livello di consumo di caffeina. La variabile confondente, in questo caso, non ha nulla a che fare con la variabile indipendente della ricerca, cioè il consumo di caffeina.
In che modo le variabili di confondimento influenzano le variabili dipendenti e indipendenti?
Per comprendere correttamente l’effetto delle variabili di confondimento sulle variabili dipendenti e indipendenti nella ricerca, è necessario capire cosa sono le variabili dipendenti e indipendenti. Questo vi aiuterà a contestualizzare chiaramente entrambi questi fattori di ricerca.
Una variabile indipendente è un fattore principale che innesca un cambiamento negli altri fattori nell’ambiente di ricerca. Allo stesso modo, la variabile dipendente è il fattore su cui si agisce nella ricerca, e risulta dall’influenza di una variabile indipendente.
Una variabile confondente può influenzare il rapporto di correlazione tra le variabili indipendenti e dipendenti; spesso risulta in falsi rapporti di correlazione perché può suggerire una correlazione positiva quando non ce n’è nessuna. Può anche innescare un cambiamento estremo in una variabile dipendente e, di conseguenza, il risultato della ricerca.
In termini di variabile indipendente, una variabile confondente o confondente può influenzare questo fattore rimuovendolo dalla relazione correlazionale e dal processo di ricerca, interamente. Questo accade quando il risultato della ricerca deriva da un cambiamento innescato dalla variabile confondente piuttosto che dalla variabile indipendente
Relazione tra Confounding Bias & Variabile
Confounding bias è uno degli effetti di avere variabili confondenti o fattori terzi nella ricerca. È il risultato di una distorsione nel grado di associazione tra un’esposizione e il risultato se l’esposizione nella ricerca.
Un bias di confondimento può essere negativo o positivo in natura. In questo senso, un bias negativo sottostima i risultati della ricerca, mentre un bias di confondimento positivo sovrastima il risultato della ricerca; causando una distorsione accelerata del risultato.
Il bias di confondimento si verifica quando un set di dati di ricerca è corrotto da tecniche di raccolta inadeguate, in modo tale che l’intero processo di ricerca in sé è impostato senza controlli sufficienti. Questo permette alle variabili di confondimento di sorgere e influenzare il risultato della ricerca.
Come evitare le variabili di confondimento in statistica & Ricerca
È importante limitare o controllare l’effetto delle variabili di confondimento nel processo di ricerca. Di solito, un ricercatore può controllare o in definitiva evitare le variabili confondenti nella ricerca solo quando può identificare e misurare i possibili fattori terzi nell’ambiente di ricerca.
Ci sono 5 strategie comuni per ridurre o evitare le variabili di confondimento. Queste sono:
- Randomization
Il metodo di randomizzazione consiste nel distribuire sporadicamente i confondenti nei dati della ricerca. È usato nell’apprendimento automatico per assegnare casualmente le variabili a un gruppo di controllo nella ricerca e aiuta a prevenire qualsiasi caso di bias di selezione nel lavoro di ricerca.
La randomizzazione è solitamente adottata nella ricerca sperimentale per permettere al ricercatore di controllare queste variabili. Reindirizza l’esperimento dall’esame di un caso individuale a una raccolta di osservazioni, dove gli strumenti statistici vengono utilizzati per interpretare i risultati.
Un campione casuale è un tipo di campione in cui ogni membro del gruppo di campionamento ha un’uguale possibilità di essere campionato. È importante notare che un campione di osservazioni perfettamente casuale è difficile da raccogliere e quindi il ricercatore deve lavorare per ottenere una randomizzazione il più possibile.
- Restrizione
Questo metodo limita la ricerca allo studio delle variabili di ricerca con il controllo delle variabili confondenti e, se non è fatto con attenzione, può portare a bias di confondimento. Si tratta di restringere i dati della ricerca introducendo variabili di controllo per limitare le variabili confondenti.
- Matching
Il metodo di matching distribuisce le variabili di confondimento attraverso i dati di ricerca, in modo uniforme; usando un processo di ricerca controllato come gli esperimenti prima e dopo. Si tratta di fare osservazioni a coppie; una per ogni valore della variabile indipendente che è simile a una possibile variabile di confondimento.
Un metodo comune di abbinamento è lo studio caso-controllo che comporta l’abbinamento di variabili con caratteristiche simili con lo stesso set di controlli. Uno studio caso-controllo può avere 2 o più controlli per ogni caso, dato che questo dà più accuratezza statistica nel processo di ricerca.
- Stratificazione
La stratificazione è un metodo per controllare le attività dei confondenti distribuendo equamente questi fattori ad ogni livello dell’analisi dei dati della ricerca. Si tratta di dividere il campione di dati in gruppi più piccoli ed esaminare la relazione tra le variabili dipendenti e indipendenti in ogni gruppo.
- Analisi multivariata
Questo metodo dipende interamente dalla capacità del ricercatore di identificare e misurare tutti i terzi fattori della ricerca.
Altri suggerimenti includono il controbilanciamento introducendo diversi parametri di analisi della ricerca, dove metà del gruppo viene esaminata sotto la condizione 1 e l’altra metà viene esaminata sotto la condizione 2. È possibile utilizzare il “metodo within-subject” per testare il soggetto ogni volta, dato che i periodi intermedi possono innescare variabili confondenti.
Ci sono differenze nelle & variabili di confondimento estranee?
Anche se in qualche modo sono simili, c’è una differenza fondamentale tra una variabile di confondimento e una variabile estranea. È importante per ogni ricercatore essere in grado di riconoscere chiaramente questa differenza al fine di identificare con precisione la variabile che agisce nel risultato della ricerca.
Una variabile estranea è un tipo di variabile che può innescare un’associazione o una correlazione tra 2 variabili di ricerca che non hanno una relazione causale. Se la relazione tra le 2 variabili, A e B, è causata esclusivamente da una terza variabile, C, allora tale relazione è spuria e la variabile C è una variabile estranea.
Una variabile di confondimento, d’altra parte, influisce su 2 variabili che non sono spurie, cioè non collegate esclusivamente dal 3° fattore. In questo caso, la relazione tra la variabile A e B è già causale, cioè A causa B.
Quando la relazione causale tra la variabile A e la variabile B è influenzata anche da una terza variabile C, la variabile C è una variabile confondente. Così, l’associazione tra A e B può esagerare l’effetto causale di A su B perché l’associazione è gonfiata dall’effetto di C sia su A che su B.
Effetto delle variabili di confondimento
Le variabili di confondimento possono provocare 2 problemi di ricerca estremi che sono l’aumento della varianza e la distorsione della ricerca. Ognuno di questi effetti sarà pienamente considerato di seguito, e possono in gran parte inclinare il risultato della ricerca per essere sovrastimato o sottostimato alla fine.
- Aumento della varianza
L’aumento della varianza si riferisce a un aumento del numero di possibili variabili causali e indipendenti nella ricerca. Questo è comune con le ricerche che non hanno variabili di controllo tali che i cambiamenti nella variabile dipendente possono essere innescati da altre variabili.
Per esempio, la vostra ricerca rivela che l’aumento di peso deriva dalla mancanza di esercizio fisico. Tuttavia, poiché non ci sono variabili di controllo, non potete fidarvi del risultato della vostra ricerca perché ci sono diversi fattori che possono influenzare la variabile dipendente.
Per esempio, una delle variabili confondenti, in questo caso, possono essere i geni o i fattori genetici. Un’altra variabile di confondimento può essere l’abitudine alimentare di un individuo, quindi ci sono troppi possibili fattori causali che finiscono per distorcere i risultati.
- Confounding Bias
Un confounding bias si riferisce alla possibilità che un parametro statistico sovrastimi o sottostimi un parametro di ricerca. Un progetto d’indagine che ha chiare occorrenze di bias di confondimento potrebbe portare ad alti tassi di abbandono dell’indagine e a bias di risposta all’indagine che influenzano il risultato della ricerca.
Un bias di confondimento può essere di natura positiva o negativa e può rovinare la validità interna di un esperimento. Un bias di confondimento positivo si verifica quando l’associazione osservata è distorta dal nulla in modo tale da sovrastimare l’effetto.
D’altra parte, un bias di confondimento negativo si verifica quando l’associazione osservata è distorta verso il nulla in modo tale da sottostimare l’effetto. Il bias di confondimento negativo può portare a un falso rifiuto di un’ipotesi nulla.
- Risultati della ricerca sbagliati
Una variabile di confondimento può alterare i risultati della ricerca. Come variabile esterna, il terzo fattore può cambiare l’effetto delle variabili dipendenti e indipendenti nella ricerca, influenzando così il risultato della ricerca correlazionale o sperimentale.
Siccome una variabile di confondimento è un terzo fattore che non viene considerato in un processo di ricerca, può influenzare un esperimento producendo risultati di ricerca imprecisi. Per esempio, può suggerire una falsa relazione correlazionale tra le variabili dipendenti e indipendenti.
Conclusione
Anche se i terzi fattori sono di solito considerati come variabili non valide in un processo di ricerca, possono cambiare il corso di una ricerca riflettendo false relazioni correlazionali tra le variabili. Quindi, è necessario controllare sempre l’ambiente di ricerca per ridurre gli effetti delle variabili confondenti.
In questo articolo, abbiamo evidenziato 5 semplici e comuni metodi di controllo per le variabili di confondimento, tra cui la randomizzazione, la corrispondenza, la stratificazione e la restrizione. Queste strategie vi aiuteranno a gestire meglio i risultati della vostra ricerca limitando gli effetti di fattori terzi.