Co to jest próbka?
Próba odnosi się do mniejszej, możliwej do zarządzania wersji większej grupy. Jest to podzbiór zawierający charakterystykę większej populacji. Próbki są używane w testach statystycznych, gdy rozmiary populacji są zbyt duże, aby test mógł objąć wszystkich możliwych członków lub obserwacje. Próbka powinna reprezentować populację jako całość i nie odzwierciedlać żadnej tendencyjności w kierunku określonej cechy.
Key Takeaways
- Próbka odnosi się do mniejszej, możliwej do zarządzania wersji większej grupy lub podzbioru większej populacji.
- Używanie próbek pozwala badaczom na prowadzenie badań w sposób łatwy i terminowy.
- W celu osiągnięcia bezstronnej próbki, wybór musi być losowy, więc każdy z populacji ma równe i prawdopodobne szanse na dodanie do grupy próbnej.
- W prostym losowym próbkowaniu, każda jednostka w populacji jest identyczna, podczas gdy warstwowe losowe próbkowanie dzieli ogólną populację na mniejsze grupy.
Zrozumienie Próbek
Próbka jest nieobiektywną liczbą obserwacji pobranych z populacji. W podstawowym ujęciu populacja to całkowita liczba osobników, zwierząt, przedmiotów, obserwacji, danych itp. dowolnego podmiotu. Tak więc próbka, innymi słowy, jest porcją, częścią lub ułamkiem całej grupy i działa jako podzbiór populacji. Próbki są używane w różnych miejscach, gdzie badania są prowadzone. Naukowcy, marketerzy, agencje rządowe, ekonomiści i grupy badawcze są wśród tych, którzy używają próbek do swoich badań i pomiarów.
Używanie całych populacji do badań wiąże się z wyzwaniami, dlatego też próbki są używane. Naukowcy mogą mieć problemy z uzyskaniem dostępu do całych populacji. Ze względu na charakter niektórych badań, badacze mogą mieć trudności z uzyskaniem potrzebnych im wyników w odpowiednim czasie. Dlatego właśnie osoby prowadzące badania wykorzystują próbki. Wykorzystanie mniejszej liczby osób, które reprezentują całą populację, może nadal dawać wiarygodne wyniki przy jednoczesnym ograniczeniu czasu i zasobów.
Próby używane przez badaczy powinny ściśle przypominać populację. Wszyscy uczestnicy w próbie powinni mieć te same cechy i właściwości. Tak więc, jeśli badanie dotyczy świeżo upieczonych studentów, próbka powinna stanowić niewielki procent mężczyzn, którzy pasują do tego opisu. Podobnie, jeśli grupa badawcza przeprowadza badanie na temat wzorców snu samotnych kobiet po 50 roku życia, próba powinna obejmować tylko kobiety z tej grupy demograficznej.
Rozważmy zespół badaczy akademickich, którzy chcą się dowiedzieć, ilu studentów uczyło się mniej niż 40 godzin do egzaminu CFA i mimo to zdało go. Ponieważ każdego roku ponad 200 000 osób przystępuje do tego egzaminu na całym świecie, dotarcie do każdego uczestnika egzaminu może być niezwykle żmudne i czasochłonne.
W rzeczywistości, zanim dane z populacji zostaną zebrane i przeanalizowane, minie kilka lat, co sprawi, że analiza będzie bezwartościowa, ponieważ pojawi się nowa populacja. Tym, co badacze mogą zrobić zamiast tego, jest pobranie próbki populacji i uzyskanie danych z tej próbki.
Aby uzyskać bezstronną próbkę, wybór musi być losowy, więc każdy z populacji ma równe szanse na dołączenie do grupy.
Aby osiągnąć bezstronną próbkę, wybór musi być losowy, więc każdy z populacji ma równe i prawdopodobne szanse na dołączenie do grupy próbnej. Jest to podobne do losowania na loterii i jest podstawą prostego losowego doboru próby.
Rodzaje doboru próby
Proste losowe dobranie próby
Proste losowe dobranie próby jest idealne, jeśli każda jednostka w populacji jest identyczna. Jeśli badacze nie dbają o to, czy ich obiekty próbne są wszystkimi mężczyznami czy wszystkimi kobietami lub kombinacją obu płci w jakiejś formie, prosty losowy dobór próby może być dobrą techniką selekcji.
Powiedzmy, że było 200 000 testerów, którzy zasiedli do egzaminu CFA w 2016 roku, z czego 40% stanowiły kobiety, a 60% mężczyźni. Próba losowa wylosowana z populacji powinna zatem liczyć 400 kobiet i 600 mężczyzn, co daje w sumie 1000 testujących.
Ale co z przypadkami, w których istotna jest znajomość stosunku mężczyzn do kobiet, którzy zdali egzamin po studiowaniu przez mniej niż 40 godzin? Tutaj, warstwowa próba losowa byłaby lepsza niż zwykła próba losowa.
Stratyfikowana próba losowa
Ten typ próbkowania, zwany również proporcjonalnym próbkowaniem losowym lub kwotowym próbkowaniem losowym, dzieli ogólną populację na mniejsze grupy. Są one nazywane warstwami. Ludzie w obrębie warstw mają podobne cechy.
A co jeśli wiek jest ważnym czynnikiem, który badacze chcieliby uwzględnić w swoich danych? Używając techniki losowania warstwowego, mogliby oni stworzyć warstwy dla każdej grupy wiekowej. Proszę spojrzeć na to z perspektywy czasu i zastanowić się nad tym, jak można to zrobić. Na przykład, dwóch uczestników, Alex i David, mają odpowiednio 22 i 24 lata. Dobór próby nie może wybrać jednego nad drugim w oparciu o jakiś mechanizm preferencyjny. Obaj powinni mieć równe szanse bycia wybranymi ze swojej grupy wiekowej. Warstwy mogłyby wyglądać mniej więcej tak:
Strata. (Wiek) | Liczba osób w populacji | Liczba osób, które należy uwzględnić w próbie | |
20-24 | 30,000 | 150 | |
25-29 | 70,000 | 350 | |
30-34 | 40,000 | 200 | |
35-39 | 30,000 | 150 | |
40-44 | 20,000 | 100 | |
> | 44 | 10,000 | 50 |
Total | 200,000 | 1,000 |
Z tabeli wynika, że populacja została podzielona na grupy wiekowe. Na przykład, 30 000 osób w przedziale wiekowym od 20 do 24 lat przystąpiło do egzaminu CFA w 2016 roku. Używając tej samej proporcji, grupa próbna będzie miała (30 000 ÷ 200 000) x 1 000 = 150 testerów, którzy mieszczą się w tej grupie. Alex lub David – lub obaj, lub żaden z nich – mogą być włączeni do 150 losowych uczestników egzaminu w próbie.
Istnieje wiele innych warstw, które mogą być skompilowane przy podejmowaniu decyzji o wielkości próby. Niektórzy badacze mogą zaludnić funkcje zawodowe, kraje, stan cywilny itp. testerów przy podejmowaniu decyzji o tym, jak stworzyć próbkę.
Przykłady próbek
W 2017 roku populacja świata wynosiła 7,5 miliarda, z czego 49,6% stanowiły kobiety, a 50,4% mężczyźni. Całkowita liczba osób w danym kraju może być również wielkością populacji. Całkowita liczba studentów w mieście może być traktowana jako populacja, a całkowita liczba psów w mieście jest również wielkość populacji. Próbki mogą być pobierane z tych populacji do celów badawczych.
Podążając za naszym przykładem egzaminu CFA, badacze mogliby pobrać próbkę 1,000 uczestników CFA z całkowitej liczby 200,000 testujących – populacji – i przeprowadzić wymagane dane na tej liczbie. Średnia z tej próbki zostałaby wzięta do oszacowania średniej osób przystępujących do egzaminu CFA, które zdały, mimo że uczyły się tylko przez mniej niż 40 godzin.
Pobrana grupa próbna nie powinna być stronnicza. Oznacza to, że jeśli średnia z próby 1 000 uczestników egzaminu CFA wynosi 50, średnia populacji 200 000 osób przystępujących do egzaminu powinna również wynosić około 50.