Articles

SAS Häufigkeitsverteilung mit SAS PROC FREQ

Posted on

Veralten Sie nicht &bekommen Sie einen rosa Slip
Folgen Sie DataFlair auf Google News & Bleiben Sie am Ball

Zielsetzung

Heute werden wir uns eine der am häufigsten verwendeten statistischen Prozeduren in der SAS-Programmierung ansehen, nämlich die SAS-Häufigkeitsverteilung. Wir werden sehen, wie man eine Häufigkeitsverteilungstabelle in SAS erstellt und eine Vielzahl von Optionen, die beim Erstellen einer Tabelle angewendet werden können, um bessere Ergebnisse zu erhalten.

So, lassen Sie uns die SAS Häufigkeitsverteilung mit SAS PROC FREQ beginnen.

SAS Häufigkeitsverteilung mit SAS PROC FREQ

SAS Häufigkeitsverteilung

Für kontinuierliche Variablen können deskriptive Statistiken wie Mittelwert und Standardabweichung verwendet werden, um die Daten zusammenzufassen. Aber für kategoriale Variablen sind diese Maße nicht geeignet. Kategoriale Variablen können mit Hilfe einer Häufigkeitstabelle zusammengefasst werden, die die Anzahl und den Prozentsatz der beobachteten Fälle für jede Kategorie einer Variablen zeigt.

Lesen wir SAS Kreuztabellen im Detail

Eine kategoriale Variable (manchmal auch als nominale Variable bezeichnet) ist eine Variable, die zwei oder mehr Kategorien hat, aber es gibt keine Reihenfolge der Kategorien. Zum Beispiel ist das Geschlecht eine kategoriale Variable mit zwei Kategorien (männlich und weiblich) und es gibt keine Ordnung in den Kategorien. Die Haarfarbe ist ebenfalls eine kategoriale Variable mit einer Reihe von Kategorien (blond, braun, brünett, rot usw.), und auch hier gibt es keine vereinbarte Reihenfolge von der höchsten zur niedrigsten. Eine rein kategoriale Variable ist eine Variable, bei der Sie lediglich Kategorien zuordnen können, aber keine eindeutige Reihenfolge festlegen können.

SAS-Häufigkeitsverteilungstabelle sieht wie die unten gezeigte aus-

Beispiel SAS-Häufigkeitsverteilung

SAS PROC FREQ-Prozedur

Die SAS PROC FREQ-Prozedur gibt alle Werte einer gegebenen kategorialen Variablen im Ausgabefenster aus, zusammen mit der Anzahl und dem Prozentsatz, wie oft jeder Wert auftritt. Die FREQ-Prozedur kann sowohl mit String- (Zeichen) als auch mit numerischen kategorialen Variablen arbeiten.

Die Syntax der SAS PROC FREQ-Anweisung lautet:

PROC FREQ DATA = Dataset ;TABLES Variable1 ;BY Variable2 ;

Die PROC FREQ-Anweisung ist die einzige erforderliche Anweisung für die FREQ-Prozedur.

Eine grundlegende Häufigkeitstabelle, die mit PROC FREQ erstellt wird, hat die folgenden Eigenschaften:

  • Sie enthält die Häufigkeit, den Prozentsatz, die kumulative Häufigkeit und den kumulativen Prozentsatz für jede Kategorie.
  • Wenn es Fälle mit fehlenden Werten für die Variable gibt, wird die Anzahl der fehlenden Werte unterhalb der Tabelle angegeben.
  • Für String-Variablen werden die Kategorien alphabetisch geordnet. Bei numerischen Variablen werden die Kategorien vom kleinsten bis zum größten Indikator geordnet.

Grundlegende Verwendung von SAS PROC FREQ

Dies ist die einfachste Form eines PROC FREQ in SAS Frequency Distribution. Wir müssen nur den Namen des Datensatzes und nicht die Variablen angeben.

Beispiel-

Proc freq data=SASHelp.cars;Run;

Der obige Code erstellt eine Häufigkeitstabelle für jede der Variablen im Datensatz.

Nachfolgend sehen Sie zum Beispiel eine Häufigkeitstabelle für die Variable MAKE.

Grundlegende Verwendung von SAS PROC FREQ

a. SAS PROC FREQ mit Tabellen-Option (Einzelvariable)

Die Verwendung von SAS PROC FREQ ohne Optionen ist in der Regel nicht empfehlenswert, insbesondere wenn Sie einen großen Datensatz haben, der Variablen enthält, die viele eindeutige Werte (Level) haben. Verwenden Sie in solchen Fällen die Tabellen-Anweisung.

Lesen Sie mehr über SAS Proc Sort Data Sets im Detail

Beispiel-

Proc freq data=SASHelp.cars ;Tables Origin;Run;

SAS PROC FREQ – Einzelne Variable

b. Häufigkeitsverteilungen für mehrere Variablen

Es können beliebig viele Tabellen für so viele Variablen erzeugt werden, wie im Datensatz vorhanden sind.
Beispiel-

PROC FREQ DATA=sample;TABLE State Rank;RUN;

SAS PROC FREQ – Multiple Variable

Fehlende Werte in der Häufigkeitstabelle

Es ist nicht notwendig, dass unsere Daten immer Werte haben müssen, manchmal gibt es fehlende Werte in einem Datensatz. Wenn SAS eine Häufigkeitsverteilungstabelle erstellt, gibt es auch die Anzahl der fehlenden Werte in der Variable aus. Um die Häufigkeit, den Prozentsatz der fehlenden Werte in der kategorialen Variable zu kennen, müssen wir sie in der Tabellenanweisung angeben.

Lassen Sie uns die Arten von Software in SAS erkunden

Beispiel.

PROC FREQ DATA=sample; TABLE State Rank / MISSING;RUN;

Fehlende Werte in der Häufigkeitstabelle

Werte in der Tabelle anordnen

Sie können SAS proc freq verwenden, um die am häufigsten oder am wenigsten häufig vorkommenden Werte innerhalb einer Variablen zu ermitteln.

Beispiel-

Proc freq data=SASHelp.cars order=freq; Tables type origin;Run;

Die resultierende Tabelle zeigt die Häufigkeit jeder Variable sortiert mit der häufigsten Variable oben und der am wenigsten häufigen unten:

Sortierung der Werte in der Tabelle

Das alles war im SAS-Tutorial zur Häufigkeitsverteilung. Wir hoffen, dass Ihnen unsere Erklärungen gefallen haben.

Abschluss

Wir hoffen, Sie haben nun verstanden, wie wir die PROC FREQ-Prozedur verwenden können, um die SAS-Häufigkeitsverteilung von kategorialen Variablen in unserem Datensatz zu finden. Abschließend haben wir auch gesehen, wie wir eine SAS-Häufigkeitsverteilung für eine und mehrere Variablen, eine Häufigkeit von fehlenden Werten und eine Reihenfolge von Werten erstellen können. Wenn Sie Fragen haben, können Sie diese gerne in den Kommentaren stellen.

Verwandtes Thema – Ein kompletter PROC SQL SAS Guide

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.