Articles

Échantillon

Posted on

Qu’est-ce qu’un échantillon ?

Un échantillon fait référence à une version plus petite et gérable d’un groupe plus important. C’est un sous-ensemble contenant les caractéristiques d’une population plus importante. Les échantillons sont utilisés dans les tests statistiques lorsque la taille des populations est trop importante pour que le test puisse inclure tous les membres ou observations possibles. Un échantillon doit représenter la population dans son ensemble et ne pas refléter de biais vers un attribut spécifique.

Key Takeaways

  • Un échantillon désigne une version plus petite et gérable d’un groupe plus important ou d’un sous-ensemble d’une population plus vaste.
  • L’utilisation d’échantillons permet aux chercheurs de mener leurs études facilement et en temps opportun.
  • Pour obtenir un échantillon non biaisé, la sélection doit être aléatoire afin que chaque personne de la population ait une chance égale et probable d’être ajoutée au groupe échantillon.
  • Dans l’échantillonnage aléatoire simple, chaque entité de la population est identique, tandis que l’échantillonnage aléatoire stratifié divise la population globale en groupes plus petits.

Comprendre les échantillons

Un échantillon est un nombre non biaisé d’observations prélevées dans une population. En termes de base, une population est le nombre total d’individus, d’animaux, d’éléments, d’observations, de données, etc. d’un sujet donné. L’échantillon, en d’autres termes, est donc une portion, une partie ou une fraction de l’ensemble du groupe, et agit comme un sous-ensemble de la population. Les échantillons sont utilisés dans une variété de contextes où des recherches sont menées. Les scientifiques, les spécialistes du marketing, les agences gouvernementales, les économistes et les groupes de recherche sont parmi ceux qui utilisent des échantillons pour leurs études et leurs mesures.

Utiliser des populations entières pour la recherche comporte des défis, c’est pourquoi les échantillons sont utilisés. Les chercheurs peuvent avoir des problèmes pour avoir un accès facile à des populations entières. Et en raison de la nature de certaines études, les chercheurs peuvent avoir des difficultés à obtenir les résultats dont ils ont besoin en temps voulu. C’est pourquoi les personnes qui mènent des études utilisent des échantillons. L’utilisation d’un plus petit nombre de personnes qui représentent l’ensemble de la population peut tout de même produire des résultats valides tout en réduisant le temps et les ressources.

Les échantillons utilisés par les chercheurs doivent ressembler étroitement à la population. Tous les participants de l’échantillon doivent partager les mêmes caractéristiques et qualités. Ainsi, si l’étude porte sur les étudiants de première année de collège de sexe masculin, l’échantillon devrait être constitué d’un petit pourcentage d’hommes qui correspondent à cette description. De même, si un groupe de recherche mène une étude sur les habitudes de sommeil des femmes célibataires de plus de 50 ans, l’échantillon ne doit comprendre que des femmes appartenant à ce groupe démographique.

Pensez à une équipe de chercheurs universitaires qui veulent savoir combien d’étudiants ont étudié pendant moins de 40 heures pour l’examen CFA et ont tout de même réussi. Étant donné que plus de 200 000 personnes passent l’examen dans le monde chaque année, contacter chaque participant à l’examen peut être extrêmement fastidieux et long.

En fait, le temps que les données de la population soient collectées et analysées, quelques années se seraient écoulées, rendant l’analyse sans valeur puisqu’une nouvelle population serait apparue. Ce que les chercheurs peuvent faire à la place, c’est prendre un échantillon de la population et obtenir des données à partir de cet échantillon.

Pour obtenir un échantillon non biaisé, la sélection doit être aléatoire afin que chaque personne de la population ait une chance égale d’être ajoutée au groupe.

Pour obtenir un échantillon non biaisé, la sélection doit être aléatoire afin que chaque personne de la population ait une chance égale et probable d’être ajoutée au groupe échantillon. Cela s’apparente à un tirage au sort et constitue la base de l’échantillonnage aléatoire simple.

Types d’échantillonnage

Échantillonnage aléatoire simple

L’échantillonnage aléatoire simple est idéal si chaque entité de la population est identique. Si les chercheurs ne se soucient pas de savoir si les sujets de leur échantillon sont tous des hommes ou toutes des femmes ou une combinaison des deux sexes sous une forme ou une autre, l’échantillonnage aléatoire simple peut être une bonne technique de sélection.

Disons qu’il y avait 200 000 candidats qui se sont présentés à l’examen CFA en 2016, dont 40 % de femmes et 60 % d’hommes. L’échantillon aléatoire tiré de la population devrait donc comporter 400 femmes et 600 hommes, pour un total de 1 000 candidats.

Mais qu’en est-il des cas où il est important de connaître le rapport entre les hommes et les femmes ayant réussi un examen après avoir étudié pendant moins de 40 heures ? Ici, un échantillon aléatoire stratifié serait préférable à un échantillon aléatoire simple.

Échantillonnage aléatoire stratifié

Ce type d’échantillonnage, également appelé échantillonnage aléatoire proportionnel ou échantillonnage aléatoire par quotas, divise la population globale en groupes plus petits. Ces derniers sont connus sous le nom de strates. Les personnes au sein des strates partagent des caractéristiques similaires.

Et si l’âge était un facteur important que les chercheurs aimeraient inclure dans leurs données ? En utilisant la technique d’échantillonnage aléatoire stratifié, ils pourraient créer des couches ou des strates pour chaque groupe d’âge. La sélection dans chaque strate devrait être aléatoire afin que chaque personne de la tranche ait une chance probable d’être incluse dans l’échantillon. Par exemple, deux participants, Alex et David, ont respectivement 22 et 24 ans. La sélection de l’échantillon ne peut pas choisir l’un plutôt que l’autre en fonction d’un quelconque mécanisme préférentiel. Ils doivent tous deux avoir une chance égale d’être sélectionnés dans leur groupe d’âge. Les strates pourraient ressembler à ceci :

Strata (Age) Nombre de personnes dans la population Nombre à inclure dans l’échantillon
20-24 30,000 150
25-29 70 000 350
30-34 40,000 200
35-39 30 000 150
40-44 20 000 100
>44 10,000 50
Total 200 000 1 000

À partir du tableau, la population a été divisée en groupes d’âge. Par exemple, 30 000 personnes dans la tranche d’âge de 20 à 24 ans ont passé l’examen du CFA en 2016. En utilisant cette même proportion, le groupe échantillon aura (30 000 ÷ 200 000) x 1 000 = 150 candidats à l’examen qui font partie de ce groupe. Alex ou David – ou les deux ou ni l’un ni l’autre – peuvent être inclus parmi les 150 participants à l’examen aléatoire de l’échantillon.

Il existe de nombreuses autres strates qui pourraient être compilées au moment de décider de la taille d’un échantillon. Certains chercheurs pourraient peupler les fonctions professionnelles, les pays, l’état civil, etc. des participants à l’examen lorsqu’ils décident de la façon de créer l’échantillon.

Exemples d’échantillons

En 2017, la population mondiale était de 7,5 milliards d’habitants, dont 49,6 % de femmes et 50,4 % d’hommes. Le nombre total de personnes dans un pays donné peut également constituer une taille de population. Le nombre total d’étudiants dans une ville peut être considéré comme une population, et le nombre total de chiens dans une ville est également une taille de population. Des échantillons peuvent être prélevés dans ces populations à des fins de recherche.

Suivant notre exemple d’examen CFA, les chercheurs pourraient prélever un échantillon de 1 000 participants à l’examen CFA sur le total de 200 000 candidats – la population – et exécuter les données requises sur ce nombre. La moyenne de cet échantillon serait prise pour estimer la moyenne des candidats à l’examen CFA qui ont réussi même s’ils n’ont étudié que pendant moins de 40 heures.

Le groupe échantillon pris ne doit pas être biaisé. Cela signifie que si la moyenne de l’échantillon des 1 000 participants à l’examen CFA est de 50, la moyenne de la population des 200 000 candidats à l’examen devrait également être d’environ 50.

.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *