Articles

SAS Frequentieverdeling met behulp van SAS PROC FREQ

Posted on

Word niet verouderd & krijg een roze slip
Volg DataFlair op Google Nieuws & Blijf het spel voor

Doel

Vandaag gaan we kijken naar een van de meest gebruikte statistische procedures in SAS Programming, dat is SAS Frequentieverdeling. We zullen zien hoe we een frequentieverdelingstabel in SAS kunnen maken en een aantal opties die kunnen worden toegepast tijdens het maken van een tabel om betere resultaten te krijgen.

Dus, laten we beginnen met SAS Frequentieverdeling met behulp van SAS PROC FREQ.

SAS Frequentieverdeling met behulp van SAS PROC FREQ

SAS Frequentieverdeling

Voor continue variabelen kunnen beschrijvende statistieken zoals gemiddelde en standaardafwijking worden gebruikt om de gegevens samen te vatten. Maar voor categorische variabelen zijn deze maatstaven niet geschikt. Categorische variabelen kunnen worden samengevat met behulp van een frequentietabel, die het aantal en het percentage van de waargenomen gevallen voor elke categorie van een variabele weergeeft.

Let’s Read SAS Cross Tabulation in detail

Een categorische variabele (soms een nominale variabele genoemd) is er een die twee of meer categorieën heeft, maar er is geen ordening in de categorieën. Bijvoorbeeld, geslacht is een categorische variabele met twee categorieën (mannelijk en vrouwelijk) en er is geen ordening in de categorieën. Haarkleur is ook een categorische variabele met een aantal categorieën (blond, bruin, brunette, rood, enz.) en ook hier is er geen overeengekomen manier om ze van hoog naar laag te ordenen. Een zuiver categorische variabele is een variabele waaraan je gewoon categorieën kunt toekennen, maar je kunt de variabelen niet duidelijk ordenen.

De SAS-frequentieverdelingstabel ziet eruit als de tabel hieronder-

Voorbeeld SAS-frequentieverdeling

SAS PROC FREQ Procedure

De SAS PROC FREQ procedure drukt alle waarden van een bepaalde categorische variabele in het uitvoervenster af, samen met het aantal en het percentage keren dat elke waarde voorkomt. De FREQ-procedure kan zowel met string (teken) als met numerieke categorische variabelen werken.

De syntaxis van het SAS PROC FREQ statement is:

PROC FREQ DATA = Dataset ;TABLES Variable1 ;BY Variable2 ;

Het PROC FREQ statement is het enige vereiste statement voor de FREQ-procedure.

Een met PROC FREQ gemaakte basisfrequentietabel heeft de volgende eigenschappen:

  • De tabel bevat de frequentie, het percentage, de cumulatieve frequentie en het cumulatieve percentage voor elke categorie.
  • Als er gevallen zijn met ontbrekende waarden voor de variabele, wordt het aantal ontbrekende waarden onder de tabel vermeld.
  • Voor tekenreeksvariabelen worden de categorieën alfabetisch gerangschikt. Voor numerieke variabelen worden de categorieën gerangschikt van de kleinste tot de grootste indicator.

Basisgebruik van SAS PROC FREQ

Dit is de meest elementaire vorm van een PROC FREQ in SAS Frequentieverdeling. We hoeven alleen de naam van de dataset op te geven en niet de variabelen.

Voorbeeld-

Proc freq data=SASHelp.cars;Run;

De bovenstaande code maakt een frequentietabel voor elk van de variabelen in de dataset.

Voorbeeld hieronder is een frequentietabel voor de variabele MAKE.

Basisgebruik van SAS PROC FREQ

a. SAS PROC FREQ met tabellenoptie (enkele variabele)

Het gebruik van SAS Proc Freq zonder opties is meestal niet aan te bevelen, vooral als u een grote dataset hebt die variabelen bevat die veel unieke waarden (niveaus) hebben. Gebruik in dergelijke gevallen tabellen.

Lees meer over SAS Proc Sort Data Sets in detail

Voorbeeld-

Proc freq data=SASHelp.cars ;Tables Origin;Run;

SAS PROC FREQ – Single Variable

b. Frequentieverdelingen voor meerdere variabelen

Er kunnen vele tabellen worden gegenereerd voor zoveel variabelen als er in de dataset aanwezig zijn.
Voorbeeld-

PROC FREQ DATA=sample;TABLE State Rank;RUN;

SAS PROC FREQ – Multiple Variable

Missing Values in Frequency Table

Het is niet noodzakelijk dat onze gegevens altijd waarden moeten hebben, soms zijn er missing values in een gegeven. Wanneer SAS frequentieverdelingstabel maakt, drukt het ook het aantal ontbrekende waarden in de variabele af. Om de frequentie, het percentage van ontbrekende waarden in de categorische variabele te kennen, moeten we het in het tabellen statement specificeren.

Let’s Explore Types of Software in SAS

Example-

PROC FREQ DATA=sample; TABLE State Rank / MISSING;RUN;

Missing Values in Frequency Table

Ordering van waarden in de tabel

U kunt SAS proc freq gebruiken om de meest of minst vaak voorkomende waarden binnen een variabele te bepalen.

Voorbeeld-

Proc freq data=SASHelp.cars order=freq; Tables type origin;Run;

De resulterende tabel toont de frequentie van elke variabele, gesorteerd met de meest voorkomende variabele bovenaan en de minst voorkomende onderaan:

Ordening van waarden in de tabel

Dit stond allemaal in de SAS Frequentie Verdeling Tutorial. Hopelijk bevalt onze uitleg u.

Conclusie

Hiermee hopen we dat u allen begrepen heeft hoe we de PROC FREQ procedure kunnen gebruiken om de SAS frequentieverdeling van categorische variabelen in onze dataset te vinden. Tot slot hebben we ook gezien hoe we een SAS-frequentieverdeling met één variabele en met meerdere variabelen kunnen maken, hoe we de frequentie van ontbrekende waarden kunnen bepalen en hoe we waarden kunnen ordenen. Verder, als u vragen hebt voel je vrij om te vragen in een commentaar sectie.

Gerelateerd onderwerp – Een complete PROC SQL SAS gids

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *