Articles

SAS Frequency Distribution Using SAS PROC FREQ

Posted on

Non diventare obsoleto & ottenere un Pink Slip
Segui DataFlair su Google News & Stai al passo con i tempi

Obiettivo

Oggi ci occuperemo di una delle procedure statistiche più utilizzate nella programmazione SAS, cioè la distribuzione di frequenza SAS. Vedremo come creare una tabella di distribuzione di frequenza in SAS e una varietà di opzioni che possono essere applicate durante la creazione di una tabella per ottenere risultati migliori.

SAS Frequency Distribution Using SAS PROC FREQ

SAS Frequency Distribution

Per le variabili continue, statistiche descrittive come media e deviazione standard possono essere utilizzate per riassumere i dati. Ma per le variabili categoriche, queste misure non sono appropriate. Le variabili categoriche possono essere riassunte usando una tabella di frequenza, che mostra il numero e la percentuale di casi osservati per ogni categoria di una variabile.

Leggiamo la tabulazione incrociata SAS in dettaglio

Una variabile categorica (a volte chiamata variabile nominale) è una che ha due o più categorie, ma non c’è un ordine delle categorie. Per esempio, il genere è una variabile categorica che ha due categorie (maschio e femmina) e non c’è un ordinamento delle categorie. Anche il colore dei capelli è una variabile categorica che ha un certo numero di categorie (bionda, marrone, bruna, rossa, ecc.) e di nuovo, non c’è un modo concordato per ordinarle dal più alto al più basso. Una variabile puramente categorica è una variabile che permette semplicemente di assegnare delle categorie ma non è possibile ordinare chiaramente le variabili.

La tabella di distribuzione di frequenza SAS assomiglia a quella mostrata qui sotto-

Esempio di distribuzione di frequenza SAS

Procedura PROC FREQ

La procedura PROC FREQ di SAS stampa tutti i valori di una data variabile categorica nella finestra di output, insieme al numero e alla percentuale di volte che ogni valore appare. La procedura FREQ può lavorare sia con variabili categoriche stringhe (caratteri) che numeriche.

La sintassi della dichiarazione PROC FREQ SAS è:

PROC FREQ DATA = Dataset ;TABLES Variable1 ;BY Variable2 ;

La dichiarazione PROC FREQ è l’unica dichiarazione richiesta per la procedura FREQ.

Una tabella di frequenza di base creata con PROC FREQ avrà le seguenti proprietà:

  • Includerà la frequenza, la percentuale, la frequenza cumulativa e la percentuale cumulativa per ogni categoria.
  • Se ci sono casi con valori mancanti per la variabile, il numero di valori mancanti è indicato sotto la tabella.
  • Per le variabili stringa, le categorie saranno ordinate alfabeticamente. Per le variabili numeriche, le categorie saranno ordinate dal più piccolo al più grande indicatore.

Uso base della PROC FREQ SAS

Questa è la forma più elementare di una PROC FREQ in SAS Frequency Distribution. Abbiamo solo bisogno di specificare il nome del dataset e non le variabili.

Esempio-

Proc freq data=SASHelp.cars;Run;

Il codice qui sopra crea una tabella di frequenza per ogni variabile del dataset.

Per esempio, di seguito è riportata una tabella di frequenza per la variabile MAKE.

Uso base della SAS PROC FREQ

a. SAS PROC FREQ con l’opzione tabelle (variabile singola)

Utilizzare SAS Proc Freq senza alcuna opzione non è solitamente consigliabile, in particolare se si dispone di un grande set di dati che contiene variabili che hanno molti valori unici (livelli). In questi casi si usano le tabelle.

Leggi in dettaglio il SAS Proc Sort Data Sets

Esempio-

Proc freq data=SASHelp.cars ;Tables Origin;Run;

SAS PROC FREQ – Variabile singola

b. Distribuzioni di frequenza di più variabili

Molti numeri di tabelle possono essere generati per altrettante variabili che sono presenti nel set di dati.
Esempio-

PROC FREQ DATA=sample;TABLE State Rank;RUN;

SAS PROC FREQ – Variabile multipla

Valori mancanti nella tabella di frequenza

Non è necessario che i nostri dati abbiano sempre valori, a volte ci sono valori mancanti in un dato. Quando SAS crea una tabella di distribuzione di frequenza, stampa anche il numero di valori mancanti nella variabile. Per conoscere la frequenza, la percentuale di valori mancanti all’interno della variabile categorica, dobbiamo specificarlo nella dichiarazione delle tabelle.

Esploriamo i tipi di software in SAS

Esempio-

PROC FREQ DATA=sample; TABLE State Rank / MISSING;RUN;

Valori mancanti nella tabella di frequenza

Ordinamento dei valori nella tabella

È possibile utilizzare SAS proc freq per determinare i valori più o meno comuni all’interno di una variabile.

Esempio-

Proc freq data=SASHelp.cars order=freq; Tables type origin;Run;

La tabella risultante mostra la frequenza di ogni variabile ordinata con la variabile più comune in alto e la meno comune in basso:

Ordinamento dei valori nella tabella

Questo era tutto nel SAS Frequency Distribution Tutorial. Spero che vi piaccia la nostra spiegazione.

Conclusione

Perciò, speriamo che tutti voi abbiate capito come possiamo usare la procedura PROC FREQ per trovare la distribuzione di frequenza SAS delle variabili categoriche nel nostro set di dati. In conclusione, abbiamo anche visto come possiamo creare una distribuzione di frequenza SAS di una variabile singola e di più variabili, una frequenza di valori mancanti e l’ordinamento dei valori. Inoltre, se avete qualche domanda, sentitevi liberi di chiedere nella sezione dei commenti.

Argomento correlato – Una guida completa PROC SQL SAS

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *