Les variables confusionnelles sont courantes dans la recherche et peuvent affecter le résultat de votre étude. En effet, l’influence externe de la variable ou du troisième facteur de confusion peut ruiner le résultat de votre recherche et produire des résultats inutiles en suggérant une connexion inexistante entre les variables.
Afin de contrôler les variables confusionnelles dans la recherche, il est important de savoir comment identifier clairement ces tiers facteurs, et de savoir comment ils influencent le résultat de votre recherche. Comprendre et contrôler les variables confusionnelles vous aidera à obtenir des résultats plus précis dans votre recherche.
Qu’est-ce qu’une variable confondante ?
Une variable confondante, en termes simples, désigne une variable qui n’est pas prise en compte dans une expérience. Elle agit comme une influence externe qui peut rapidement modifier l’effet des variables de recherche dépendantes et indépendantes ; produisant souvent des résultats extrêmement différents de ce qui est le cas.
Dans la recherche corrélationnelle, les variables confondantes peuvent affecter la relation perçue entre les 2 variables considérées ; qu’elle soit positive, négative ou nulle. Une variable confondante peut également être définie comme un facteur que le chercheur n’a pas pu contrôler ou supprimer, et elle peut fausser la validité du travail de recherche.
Comment identifier les variables confondantes
Il existe plusieurs méthodes de recherche utilisées pour identifier les variables confondantes. La méthode la plus courante consiste à observer dans quelle mesure la suppression d’un facteur dans la recherche entraîne une modification du coefficient des autres variables indépendantes de la recherche.
En ce sens, le chercheur observe et mesure le niveau estimé d’association entre les variables indépendantes et dépendantes, avant et après avoir effectué des ajustements. Si la différence entre les 2 paramètres de mesure est supérieure à 10%, alors une variable confondante est présente.
Une autre méthode pour identifier une variable confondante consiste à déterminer si la variable peut être liée à la fois à l’exposition d’intérêt et au résultat d’intérêt de la recherche. S’il existe un lien significatif et mesurable entre la variable et le facteur de risque et, entre la variable et le résultat, alors cette variable est confondante.
Il existe plusieurs méthodes de test hypothétiques et formelles pour identifier les variables de confusion. Le modèle de base, le modèle biologique et les modèles de régression logistique binaire et logistique multivariée sont quelques-unes des méthodes hypothétiques de recherche courantes utilisées pour identifier les variables confusionnelles.
Les variables confusionnelles peuvent également être identifiées à l’aide de divers tests de colinéarité tels que la mesure des facteurs d’inflation de la variance. Vous pouvez calculer le facteur d’inflation de la variance pour toutes les variables de votre recherche afin de voir si cet indicateur est élevé pour l’une des variables ; d’où l’indication d’un facteur de confusion.
Les variables confusionnelles sont souvent associées à la fois au facteur de risque d’intérêt et à son résultat. Elles sont généralement distribuées de manière inégale parmi les variables indépendantes et dépendantes de la recherche et, les variables confusionnelles ne se situent pas entre l’intérêt et le résultat de la recherche.
Une variable de confusion peut fonctionner de 3 façons possibles dans la recherche : comme facteur de risque, comme facteur de prévention ou comme variable de substitution ou marqueur. Les formules courantes pour calculer l’ampleur de la confusion dans la recherche sont :
- Degree of Confounding = (RRcrude – RRadjusted)/RRcrude
- Degree of Confounding = (RRcrude – RRadjusted)/RRadjusted
Exemples de variables confusionnelles
Les variables confusionnelles recoupent plusieurs domaines d’étude notamment la statistique, la méthodologie de recherche et la psychologie. Dans tous ces domaines, ces tiers facteurs conservent leurs caractéristiques premières d’influencer extrêmement les résultats de la recherche des variables dépendantes et indépendantes depuis l’extérieur de l’environnement contrôlé.
Exemple de variables confondantes dans la recherche
- La carrière d’une mère
Des recherches sont menées pour déterminer le degré de corrélation entre le lait maternisé pour les bébés et l’intelligence des nourrissons. Il semblerait logique que les enfants nourris au lait maternisé soient moins intelligents car ils ne reçoivent pas les nutriments, les vitamines et les minéraux contenus dans le lait maternel.
Cependant, dans les faits, il se peut que les enfants nourris au lait maternisé soient encore plus intelligents que ceux qui sont nourris au sein. Les préparations pour nourrissons contiennent en fait des nutriments, des vitamines et des minéraux qui peuvent aider à stimuler l’intelligence de l’enfant et à le protéger des infections.
Une variable confondante dans ce cas peut être la carrière de la mère, c’est-à-dire si la mère est une femme au foyer ou une mère ouvrière. Lorsque ce 3ème facteur est pris en compte, on s’apercevrait que les mères de la classe ouvrière sont plus susceptibles de choisir l’alimentation au lait maternisé car leur travail ne leur permet pas toujours d’allaiter leur enfant.
- Météo
Des recherches sont menées pour déterminer le degré de corrélation entre l’argent et la vente de glaces. La logique peut suggérer qu’il existe une corrélation positive entre ces 2 variables, c’est-à-dire que les gens achètent plus de glaces lorsqu’ils ont plus d’argent.
Une variable confondante dans cette recherche peut être la météo, de sorte qu’il est nettement possible que la météo soit le facteur causal corrélatif. Ainsi, lorsqu’il fait froid, les gens travaillent moins et ont moins d’argent pour acheter des glaces et, lorsqu’il fait chaud, les gens travaillent plus et ont plus d’argent pour acheter des glaces.
Dans cet exemple, la variable causant la relation entre l’argent et la glace est le temps.
Exemples de variables confondantes en statistique
- Planche glissante
Sur le plan statistique, une variable confondante peut entrer en jeu dans le cas de la relation entre la force appliquée pour lancer une balle et la distance parcourue par cette dernière. Logiquement, on suppose que plus la force exercée sur une balle est importante ; plus elle se déplace loin.
La variable confondante, cependant, serait la direction dans laquelle la balle se déplace sur une planche inclinée. Si la balle se déplace vers le haut, elle pourrait se déplacer plus lentement, quelle que soit la force, et, si elle se déplace vers le bas, elle se déplacerait plus rapidement avec un faible effort de force.
- Habitudes alimentaires
Une variable confondante peut également être responsable de la corrélation entre l’exercice et la perte de poids. La logique naturelle peut être que plus vous faites de l’exercice, plus vous êtes susceptible de perdre du poids, mais une variable confondante dans cette recherche peut être les habitudes alimentaires.
Cela signifie que plus les gens mangent, plus ils prennent du poids et vice versa.
Exemple de variables confusionnelles en psychologie
- Sommeil
Psychologiquement, une variable confusionnelle peut influencer le lien ou la relation entre la caféine et la concentration. Vous remarquez que plus vous prenez de caféine, plus vous êtes concentré en classe ; ici, la concentration dépend du niveau de caféine qui est la variable indépendante.
La variable confondante, dans ce cas, pourrait être le sommeil ; c’est-à-dire que vous avez pu avoir un meilleur sommeil entraînant un meilleur niveau de concentration, indépendamment du niveau de consommation de caféine. La variable confondante, dans ce cas, n’a rien à voir avec la variable indépendante de la recherche ; c’est-à-dire la consommation de caféine.
Comment les variables confusionnelles affectent-elles les variables dépendantes et indépendantes ?
Pour bien comprendre l’effet des variables confusionnelles sur les variables dépendantes et indépendantes de la recherche, il est nécessaire de comprendre ce que sont les variables dépendantes et indépendantes. Cela vous aidera à contextualiser clairement ces deux facteurs de recherche.
Une variable indépendante est un facteur principal qui déclenche un changement dans les autres facteurs de l’environnement de recherche. Dans la même veine, la variable dépendante est le facteur sur lequel on agit dans la recherche, et elle résulte de l’influence d’une variable indépendante.
Une variable confondante peut affecter la relation corrélationnelle entre les variables indépendantes et dépendantes ; ce qui entraîne souvent de fausses relations corrélationnelles car elle peut suggérer une corrélation positive alors qu’il n’y en a pas. Elle peut également déclencher un changement extrême dans une variable dépendante et par conséquent, le résultat de la recherche.
En ce qui concerne la variable indépendante, une variable confondante ou confounder peut affecter ce facteur en le retirant de la relation corrélationnelle et du processus de recherche, entièrement. Cela se produit lorsque le résultat de la recherche résulte d’un changement déclenché par le facteur de confusion plutôt que par la variable indépendante de la recherche
Relation entre le biais de confusion & Variable
Le biais de confusion est l’un des effets de la présence de variables de confusion ou de tiers facteurs dans votre recherche. C’est le résultat d’une distorsion du degré d’association entre une exposition et le résultat si exposition dans la recherche.
Un biais de confusion peut être de nature négative ou positive. En ce sens, un biais négatif sous-estime les résultats de la recherche tandis qu’un biais de confusion positif surestime les résultats de la recherche ; provoquant une distorsion accélérée des résultats.
Le biais de confusion se produit lorsqu’un ensemble de données de recherche est corrompu par de mauvaises techniques de collecte, de sorte que l’ensemble du processus de recherche en lui-même est mis en place sans suffisamment de contrôles. Cela permet aux variables confusionnelles de survenir et d’affecter les résultats de la recherche.
Comment éviter les variables confusionnelles en statistique & Recherche
Il est important de limiter ou de contrôler l’effet des variables confusionnelles ou des facteurs de confusion dans le processus de recherche. Habituellement, un chercheur ne peut contrôler ou finalement éviter les variables confondantes dans la recherche que lorsqu’il peut identifier et mesurer les éventuels tiers facteurs dans l’environnement de recherche.
Il existe 5 stratégies courantes pour réduire ou éviter les variables confondantes. Ce sont :
- Randomisation
La méthode de randomisation consiste à distribuer les facteurs de confusion sur vos données de recherche de manière sporadique. Elle est utilisée dans l’apprentissage automatique pour affecter de manière aléatoire des variables à un groupe de contrôle dans la recherche et elle permet d’éviter tout cas de biais de sélection dans les travaux de recherche.
La randomisation est généralement adoptée dans la recherche expérimentale pour permettre au chercheur de contrôler ces variables. Elle redirige l’expérience de l’examen d’un cas individuel vers une collection d’observations, où les outils statistiques sont utilisés pour interpréter les résultats.
Un échantillon aléatoire est un type d’échantillon dans lequel chaque membre du groupe d’échantillonnage a une chance égale d’être échantillonné. Il est important de noter qu’un échantillon d’observations parfaitement aléatoire est difficile à collecter et que, par conséquent, le chercheur doit s’efforcer d’obtenir une randomisation aussi proche que possible.
- Restriction
Cette méthode limite la recherche à l’étude des variables de recherche avec un contrôle des variables confondantes et, si elle n’est pas effectuée avec soin, elle peut entraîner un biais de confusion. Elle consiste à restreindre les données de la recherche en introduisant des variables de contrôle pour limiter les variables confondantes.
- L’appariement
La méthode d’appariement distribue les variables confondantes à travers les données de recherche, de manière égale ; en utilisant un processus de recherche contrôlé comme les expériences avant et après. Elle consiste à faire des observations par paires ; une pour chaque valeur de la variable indépendante qui est similaire à une éventuelle variable confondante.
Une méthode courante d’appariement est l’étude cas-témoins qui consiste à apparier des variables de caractéristiques similaires avec le même ensemble de contrôles. Une étude cas-témoins peut avoir 2 contrôles ou plus pour chaque cas, car cela donne plus de précision statistique dans votre processus de recherche.
- Stratification
La stratification est une méthode de vérification des activités des facteurs de confusion en distribuant ces facteurs de manière égale à chaque niveau de l’analyse des données de recherche. Elle consiste à diviser l’échantillon de données en groupes plus petits et à examiner la relation entre les variables dépendantes et indépendantes dans chaque groupe.
- Analyse multivariée
Cette méthode dépend entièrement de la capacité du chercheur à identifier et à mesurer tous les tiers facteurs de la recherche.
Les autres astuces comprennent le contrebalancement en introduisant différents paramètres d’analyse de la recherche, où la moitié du groupe est examinée sous la condition 1 et l’autre moitié est examinée sous la condition 2. Vous pouvez utiliser la « méthode intra-sujet » pour tester le sujet à chaque fois, car les périodes intermédiaires peuvent déclencher des variables confondantes.
Y a-t-il des différences entre les & variables confusionnelles ?
Bien que quelque peu similaires, il existe une différence fondamentale entre une variable confusionnelle et une variable étrangère. Il est important pour tout chercheur de pouvoir reconnaître clairement cette différence afin d’identifier avec précision la variable agissant dans un résultat de recherche.
Une variable étrangère est un type de variable qui peut déclencher une association ou une corrélation entre 2 variables de recherche qui n’ont pas de relation causale. Si la relation entre les 2 variables ; A et B, est causée uniquement par une 3e variable ; C, alors une telle relation est fallacieuse et la variable C est une variable étrangère.
Une variable confondante, en revanche, affecte 2 variables qui ne sont pas faussement liées, c’est-à-dire qui ne sont pas uniquement liées par le 3e facteur. Dans ce cas, la relation entre la variable A et B est déjà causale, c’est-à-dire que A provoque B.
Lorsque la relation causale entre la variable A et la variable B est également influencée par une troisième variable C, la variable C est une variable confondante. Ainsi, l’association entre A et B peut exagérer l’effet causal de A sur B parce que l’association est gonflée par l’effet de C à la fois sur A et B.
Effet des variables confondantes
Les variables confondantes peuvent entraîner 2 problèmes de recherche extrêmes qui sont l’augmentation de la variance et le biais de recherche. Chacun de ces effets sera entièrement considéré ci-dessous, et ils peuvent largement faire pencher votre résultat de recherche pour qu’il soit surestimé ou sous-estimé au final.
- Variance accrue
La variance accrue fait référence à une escalade du nombre de variables causales et indépendantes possibles dans la recherche. Ce phénomène est courant dans les recherches qui n’ont pas de variables de contrôle, de sorte que les changements de la variable dépendante peuvent être déclenchés par d’autres variables.
Par exemple, votre recherche révèle que l’augmentation de la prise de poids résulte d’un manque d’exercice. Cependant, comme il n’y a pas de variables de contrôle, vous ne pouvez pas vous fier aux résultats de votre recherche car il existe un certain nombre de facteurs qui peuvent affecter la variable dépendante.
Par exemple, l’une des variables confusionnelles, dans ce cas, peut être les gènes ou les facteurs génétiques. Une autre variable de confusion peut être les habitudes alimentaires d’un individu, il y a donc trop de facteurs de causalité possibles qui finissent par fausser les résultats .
- Biais de confusion
Un biais de confusion fait référence aux chances qu’un paramètre statistique surestime ou sous-estime un paramètre de recherche. Un plan d’enquête qui présente des occurrences évidentes de biais de confusion pourrait entraîner des taux élevés d’abandon de l’enquête et un biais de réponse à l’enquête qui affecte les résultats de la recherche.
Un biais de confusion peut être de nature positive ou négative et peut ruiner la validité interne d’une expérience. Un biais de confusion positif se produit lorsque l’association observée est biaisée à l’écart de la valeur nulle de telle sorte qu’elle surestime l’effet.
En revanche, un biais de confusion négatif se produit lorsque l’association observée est biaisée vers la valeur nulle de telle sorte qu’elle sous-estime l’effet. Le biais de confusion négatif peut conduire à un faux rejet d’une hypothèse nulle.
- Mauvais résultats de la recherche
Une variable confondante peut modifier les résultats de la recherche. En tant que variable externe, le troisième facteur peut modifier l’effet des variables dépendantes et indépendantes dans la recherche ; influençant ainsi les résultats de la recherche corrélationnelle ou expérimentale.
Puisqu’une variable confondante est un 3e facteur qui n’est pas pris en compte dans un processus de recherche, elle peut affecter une expérience en produisant des résultats de recherche inexacts. Par exemple, elle peut suggérer une fausse relation corrélationnelle entre les variables dépendantes et indépendantes.
Conclusion
Bien que les tiers facteurs soient généralement considérés comme des variables invalides dans un processus de recherche, ils peuvent changer le cours d’une recherche en reflétant une fausse relation corrélationnelle entre les variables. Par conséquent, il est nécessaire de toujours contrôler votre environnement de recherche afin de réduire les effets des variables confondantes.
Dans cet article, nous avons mis en évidence 5 méthodes simples et courantes de contrôle des variables confondantes, notamment la randomisation, l’appariement, la stratification et la restriction. Ces stratégies vous permettraient de mieux gérer les résultats de vos recherches en limitant les effets des facteurs tiers.