Articles

SAS Frequency Distribution Using SAS PROC FREQ

Posted on

Nie stań się przestarzały & dostać Pink Slip
Follow DataFlair on Google News & Wyprzedź grę

Cel

Dzisiaj przyjrzymy się jednej z najczęściej używanych procedur statystycznych w Programowaniu SAS, czyli SAS Frequency Distribution. Zobaczymy, jak utworzyć tabelę rozkładu częstości w SAS oraz wiele opcji, które można zastosować podczas tworzenia tabeli, aby uzyskać lepsze wyniki.

Zacznijmy więc od SAS Frequency Distribution przy użyciu SAS PROC FREQ.

Rozkład Częstotliwości SAS przy użyciu SAS PROC FREQ

Rozkład Częstotliwości SAS

Dla zmiennych ciągłych, statystyki opisowe, takie jak średnia i odchylenie standardowe, mogą być użyte do podsumowania danych. Ale dla zmiennych kategorycznych, te miary nie są odpowiednie. Zmienne kategoryczne można podsumować za pomocą tabeli częstości, która pokazuje liczbę i odsetek przypadków zaobserwowanych dla każdej kategorii zmiennej.

Zapoznajmy się szczegółowo z Tabulacją krzyżową w SAS

Zmienna kategoryczna (czasami nazywana zmienną nominalną) to taka, która ma dwie lub więcej kategorii, ale nie ma żadnego uporządkowania kategorii. Na przykład, płeć jest zmienną kategoryczną posiadającą dwie kategorie (mężczyzna i kobieta) i nie ma żadnego uporządkowania kategorii. Kolor włosów jest również zmienną kategoryczną posiadającą wiele kategorii (blond, brąz, brunetka, ruda, itd.) i ponownie, nie ma uzgodnionego sposobu uporządkowania ich od najwyższej do najniższej. Zmienna czysto kategoryczna to taka, która po prostu pozwala na przypisanie kategorii, ale nie można jednoznacznie uporządkować zmiennych.

Tabela rozkładu częstości SAS wygląda jak pokazana poniżej-

Przykładowy rozkład częstości SAS

Procedura SAS PROC FREQ

Procedura SAS PROC FREQ wypisuje w oknie Output wszystkie wartości danej zmiennej kategorycznej wraz z liczbą i procentem wystąpień każdej wartości. Procedura FREQ może pracować zarówno ze zmiennymi kategorycznymi łańcuchowymi (znakowymi), jak i numerycznymi.

Składnia instrukcji SAS PROC FREQ jest następująca:

PROC FREQ DATA = Dataset ;TABLES Variable1 ;BY Variable2 ;

Instrukcja PROC FREQ jest jedyną wymaganą instrukcją dla procedury FREQ.

Podstawowa tabela częstości utworzona za pomocą PROC FREQ będzie miała następujące właściwości:

  • Będzie zawierała częstość, procent, skumulowaną częstość i skumulowany procent dla każdej kategorii.
  • Jeśli istnieją przypadki z brakującymi wartościami dla zmiennej, liczba brakujących wartości jest podana poniżej tabeli.
  • Dla zmiennych łańcuchowych kategorie będą uporządkowane alfabetycznie. Dla zmiennych numerycznych, kategorie będą uporządkowane od najmniejszego do największego wskaźnika.

Podstawowe zastosowanie SAS PROC FREQ

Jest to najbardziej podstawowa forma PROC FREQ w SAS Frequency Distribution. Musimy jedynie określić nazwę zbioru danych, a nie zmiennych.

Przykład-

Proc freq data=SASHelp.cars;Run;

Powyższy kod tworzy tabelę częstości dla każdej zmiennej w zbiorze danych.

Na przykład, poniżej znajduje się tabela częstości dla zmiennej MAKE.

Podstawowe zastosowanie SAS PROC FREQ

a. SAS PROC FREQ z opcją tables (pojedyncza zmienna)

Używanie SAS Proc Freq bez żadnych opcji zazwyczaj nie jest zalecane, szczególnie jeśli mamy duży zbiór danych, który zawiera zmienne mające wiele unikalnych wartości (poziomów). W takich przypadkach stosuje się zestawienie tabelaryczne.

Zapoznaj się szczegółowo z SAS Proc Sort Data Sets

Przykład-

Proc freq data=SASHelp.cars ;Tables Origin;Run;

SAS PROC FREQ – Single Variable

b. Rozkłady częstości wielu zmiennych

Można wygenerować wiele numerów tabel dla tylu zmiennych, ile występuje w zbiorze danych.
Przykład

PROC FREQ DATA=sample;TABLE State Rank;RUN;

SAS PROC FREQ – Multiple Variable

Brakujące wartości w tabeli częstości

Nie jest konieczne, aby nasze dane zawsze miały wartości, czasami w danych brakuje wartości. Kiedy SAS tworzy tabelę rozkładu częstości, drukuje również liczbę brakujących wartości w zmiennej. Aby poznać częstotliwość, procent brakujących wartości w zmiennej kategorycznej, musimy określić je w instrukcji tables.

Poznajmy typy oprogramowania w SAS

Przykład-.

PROC FREQ DATA=sample; TABLE State Rank / MISSING;RUN;

Missing Values in Frequency Table

Ordering Values in the Table

Można użyć SAS proc freq do określenia najczęściej lub najrzadziej występujących wartości w ramach zmiennej.

Przykład-

Proc freq data=SASHelp.cars order=freq; Tables type origin;Run;

Wynikowe tabele pokazują częstość występowania każdej zmiennej posortowanej tak, aby najczęściej występująca zmienna znajdowała się na górze, a najrzadziej występująca na dole:

Ordering Values in the Table

To wszystko było w SAS Frequency Distribution Tutorial. Mamy nadzieję, że podobają się Państwu nasze wyjaśnienia.

Podsumowanie

Mamy nadzieję, że wszyscy zrozumieli, jak można użyć procedury PROC FREQ do znalezienia w SAS rozkładu częstości zmiennych kategorycznych w naszym zbiorze danych. Podsumowując, zobaczyliśmy również jak możemy utworzyć rozkłady częstości SAS dla jednej zmiennej i wielu zmiennych, częstość brakujących wartości oraz uporządkowanie wartości. Ponadto, jeśli masz jakieś pytania, nie krępuj się pytać w sekcji komentarzy.

Powiązany temat – Kompletny przewodnik po SAS PROC SQL

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *