Cos’è un campione?
Un campione si riferisce a una versione più piccola e gestibile di un gruppo più grande. È un sottoinsieme che contiene le caratteristiche di una popolazione più grande. I campioni sono usati nei test statistici quando le dimensioni della popolazione sono troppo grandi perché il test includa tutti i possibili membri o osservazioni. Un campione dovrebbe rappresentare la popolazione nel suo insieme e non riflettere alcun pregiudizio verso un attributo specifico.
Punti chiave
- Un campione si riferisce a una versione più piccola e gestibile di un gruppo più grande o a un sottoinsieme di una popolazione più ampia.
- L’uso di campioni permette ai ricercatori di condurre i loro studi in modo semplice e tempestivo.
- Per ottenere un campione imparziale, la selezione deve essere casuale in modo che ogni persona della popolazione abbia una uguale e probabile possibilità di essere aggiunta al gruppo campione.
- Nel campionamento casuale semplice, ogni entità della popolazione è identica, mentre il campionamento casuale stratificato divide la popolazione complessiva in gruppi più piccoli.
Capire i campioni
Un campione è un numero imparziale di osservazioni prese da una popolazione. In termini di base, una popolazione è il numero totale di individui, animali, oggetti, osservazioni, dati, ecc. di qualsiasi soggetto. Quindi il campione, in altre parole, è una porzione, una parte o una frazione dell’intero gruppo, e agisce come un sottoinsieme della popolazione. I campioni sono utilizzati in una varietà di contesti in cui viene condotta la ricerca. Scienziati, commercianti, agenzie governative, economisti e gruppi di ricerca sono tra coloro che usano i campioni per i loro studi e misurazioni.
Utilizzare popolazioni intere per la ricerca comporta delle sfide, ed è per questo che si usano i campioni. I ricercatori possono avere problemi a ottenere un accesso immediato a intere popolazioni. E a causa della natura di alcuni studi, i ricercatori possono avere difficoltà a ottenere i risultati di cui hanno bisogno in modo tempestivo. Questo è il motivo per cui le persone che conducono studi usano dei campioni. Usare un numero più piccolo di persone che rappresentano l’intera popolazione può ancora produrre risultati validi riducendo il tempo e le risorse.
I campioni usati dai ricercatori dovrebbero assomigliare strettamente alla popolazione. Tutti i partecipanti al campione dovrebbero condividere le stesse caratteristiche e qualità. Quindi, se lo studio riguarda le matricole del college, il campione dovrebbe essere una piccola percentuale di maschi che corrispondono a questa descrizione. Allo stesso modo, se un gruppo di ricerca conduce uno studio sui modelli di sonno delle donne single oltre i 50 anni, il campione dovrebbe includere solo donne che rientrano in questa fascia demografica.
Considera un team di ricercatori accademici che vuole sapere quanti studenti hanno studiato meno di 40 ore per l’esame CFA e l’hanno comunque superato. Dal momento che più di 200.000 persone sostengono l’esame ogni anno a livello globale, raggiungere ogni singolo partecipante all’esame potrebbe essere estremamente noioso e dispendioso in termini di tempo.
In effetti, quando i dati della popolazione saranno stati raccolti e analizzati, saranno passati un paio d’anni, rendendo l’analisi inutile dal momento che sarà emersa una nuova popolazione. Quello che i ricercatori possono fare, invece, è prendere un campione della popolazione e ottenere dati da questo campione.
Per ottenere un campione imparziale, la selezione deve essere casuale in modo che tutti nella popolazione abbiano le stesse possibilità di essere aggiunti al gruppo.
Per ottenere un campione imparziale, la selezione deve essere casuale in modo che tutti nella popolazione abbiano una uguale e probabile possibilità di essere aggiunti al gruppo campione. Questo è simile a un sorteggio ed è la base del campionamento casuale semplice.
Tipi di campionamento
Campionamento casuale semplice
Il campionamento casuale semplice è ideale se ogni entità della popolazione è identica. Se ai ricercatori non interessa se i soggetti del loro campione sono tutti maschi o tutte femmine o una combinazione di entrambi i sessi in qualche forma, il campionamento casuale semplice può essere una buona tecnica di selezione.
Diciamo che c’erano 200.000 persone che hanno sostenuto l’esame CFA nel 2016, di cui il 40% erano donne e il 60% uomini. Il campione casuale estratto dalla popolazione dovrebbe quindi avere 400 donne e 600 uomini per un totale di 1.000 partecipanti all’esame.
Ma che dire dei casi in cui è importante conoscere il rapporto tra uomini e donne che hanno superato un esame dopo aver studiato per meno di 40 ore? Qui, un campione casuale stratificato sarebbe preferibile a un campione casuale semplice.
Campionamento casuale stratificato
Questo tipo di campionamento, chiamato anche campionamento casuale proporzionale o campionamento casuale per quote, divide la popolazione complessiva in gruppi più piccoli. Questi sono conosciuti come strati. Le persone all’interno degli strati condividono caratteristiche simili.
E se l’età fosse un fattore importante che i ricercatori vorrebbero includere nei loro dati? Usando la tecnica di campionamento casuale stratificato, potrebbero creare strati o strati per ogni gruppo di età. La selezione da ogni strato dovrebbe essere casuale, in modo che tutti gli appartenenti alla fascia abbiano una probabile possibilità di essere inclusi nel campione. Per esempio, due partecipanti, Alex e David, hanno rispettivamente 22 e 24 anni. La selezione del campione non può sceglierne uno rispetto all’altro sulla base di qualche meccanismo preferenziale. Entrambi dovrebbero avere la stessa probabilità di essere selezionati dal loro gruppo di età. Gli strati potrebbero assomigliare a questo:
Strata (Età) | Numero di persone nella popolazione | Numero da includere nel campione |
20-24 | 30,000 | 150 |
25-29 | 70.000 | 350 |
30-34 | 40,000 | 200 |
35-39 | 30.000 | 150 |
40-44 | 20.000 | 100 |
>44 | 10,000 | 50 |
Totale | 200.000 | 1.000 |
Dalla tabella, la popolazione è stata divisa in gruppi di età. Per esempio, 30.000 persone nella fascia d’età dai 20 ai 24 anni hanno sostenuto l’esame CFA nel 2016. Usando questa stessa proporzione, il gruppo campione avrà (30.000 ÷ 200.000) x 1.000 = 150 persone che rientrano in questo gruppo. Alex o David – o entrambi o nessuno – possono essere inclusi tra i 150 partecipanti casuali all’esame del campione.
Ci sono molti altri strati che potrebbero essere compilati quando si decide la dimensione del campione. Alcuni ricercatori potrebbero popolare le funzioni lavorative, i paesi, lo stato civile, ecc. dei partecipanti al test quando decidono come creare il campione.
Esempi di campioni
Al 2017, la popolazione mondiale era di 7,5 miliardi, di cui il 49,6% erano donne e il 50,4% uomini. Il numero totale di persone in un dato paese può anche essere una dimensione della popolazione. Il numero totale di studenti in una città può essere preso come una popolazione, e il numero totale di cani in una città è anche una dimensione della popolazione. Si possono prendere dei campioni da queste popolazioni per scopi di ricerca.
Seguendo il nostro esempio dell’esame CFA, i ricercatori potrebbero prendere un campione di 1.000 partecipanti al CFA dal totale di 200.000 partecipanti all’esame – la popolazione – ed eseguire i dati richiesti su questo numero. La media di questo campione verrebbe presa per stimare la media dei partecipanti all’esame CFA che sono passati anche se hanno studiato solo per meno di 40 ore.
Il gruppo campione preso non dovrebbe essere distorto. Questo significa che se la media del campione di 1.000 partecipanti all’esame CFA è 50, anche la media della popolazione di 200.000 partecipanti all’esame dovrebbe essere circa 50.