Articles

Distribución de frecuencias en SAS usando SAS PROC FREQ

Posted on

No se quede obsoleto & obtenga un Pink Slip
Siga a DataFlair en Google News & Manténgase a la vanguardia

Objetivo

Hoy vamos a ver uno de los procedimientos estadísticos más utilizados en la Programación SAS, que es la distribución de frecuencias de SAS. Veremos cómo crear una tabla de distribución de frecuencias en SAS y una variedad de opciones que se pueden aplicar mientras se crea una tabla para obtener mejores resultados.

Pues bien, vamos a empezar la Distribución de Frecuencias en SAS utilizando SAS PROC FREQ.

Distribución de frecuencias SAS utilizando SAS PROC FREQ

Distribución de frecuencias SAS

Para las variables continuas, los estadísticos descriptivos como la media y la desviación estándar se pueden utilizar para resumir los datos. Pero para las variables categóricas, estas medidas no son apropiadas. Las variables categóricas pueden resumirse utilizando una tabla de frecuencias, que muestra el número y el porcentaje de casos observados para cada categoría de una variable.

Leamos en detalle la tabulación cruzada de SAS

Una variable categórica (a veces llamada variable nominal) es aquella que tiene dos o más categorías, pero no hay un ordenamiento de las mismas. Por ejemplo, el género es una variable categórica que tiene dos categorías (hombre y mujer) y no hay un orden en las categorías. El color del pelo también es una variable categórica que tiene varias categorías (rubio, castaño, moreno, pelirrojo, etc.) y, de nuevo, no hay una forma acordada de ordenarlas de mayor a menor. Una variable puramente categórica es aquella que simplemente permite asignar categorías pero no puede ordenar claramente las variables.

La tabla de distribución de frecuencias de SAS se parece a la que se muestra a continuación-

Ejemplo de distribución de frecuencias de SAS

Procedimiento PROC FREQ de SAS

El procedimiento PROC FREQ de SAS imprime todos los valores de una variable categórica dada en la ventana de salida, junto con el número y el porcentaje de veces que aparece cada valor. El procedimiento FREQ puede trabajar tanto con variables categóricas de cadena (caracteres) como numéricas.

La sintaxis de la sentencia SAS PROC FREQ es:

PROC FREQ DATA = Dataset ;TABLES Variable1 ;BY Variable2 ;

La sentencia PROC FREQ es la única sentencia necesaria para el procedimiento FREQ.

Una tabla de frecuencias básica creada con PROC FREQ tendrá las siguientes propiedades:

  • Incluirá la frecuencia, el porcentaje, la frecuencia acumulada y el porcentaje acumulado para cada categoría.
  • Si hay casos con valores perdidos para la variable, el número de valores perdidos se da debajo de la tabla.
  • Para las variables de cadena, las categorías se ordenarán alfabéticamente. Para las variables numéricas, las categorías se ordenarán del indicador más pequeño al más grande.

Uso básico de SAS PROC FREQ

Esta es la forma más básica de un PROC FREQ en SAS Frequency Distribution. Sólo necesitamos especificar el nombre del conjunto de datos y no las variables.

Ejemplo-

Proc freq data=SASHelp.cars;Run;

El código anterior crea una tabla de frecuencias para cada una de las variables del conjunto de datos.

Por ejemplo, a continuación se muestra una tabla de frecuencias para la variable MAKE.

Uso básico de SAS PROC FREQ

a. SAS PROC FREQ con la opción de tablas ( una sola variable)

Usar SAS Proc Freq sin ninguna opción no suele ser recomendable, especialmente si se tiene un conjunto de datos grande que contiene variables que tienen muchos valores únicos (niveles). Utilice la sentencia de tablas en estos casos.

Lea sobre SAS Proc Sort Data Sets en detalle

Ejemplo-

Proc freq data=SASHelp.cars ;Tables Origin;Run;

SAS PROC FREQ – Single Variable

b. Distribuciones de frecuencia de múltiples variables

Se pueden generar muchos números de tablas para tantas variables que estén presentes en el conjunto de datos.
Ejemplo-

PROC FREQ DATA=sample;TABLE State Rank;RUN;

SAS PROC FREQ – Multiple Variable

Valores ausentes en la tabla de frecuencias

No es necesario que nuestros datos tengan siempre valores, a veces hay valores ausentes en un dato. Cuando SAS crea la tabla de distribución de frecuencias, también imprime el número de valores perdidos en la variable. Para conocer la frecuencia, porcentaje de valores perdidos dentro de la variable categórica, debemos especificarlo en la sentencia de tablas.

Exploremos los tipos de software en SAS

Ejemplo-

PROC FREQ DATA=sample; TABLE State Rank / MISSING;RUN;

Valores ausentes en la tabla de frecuencias

Ordenación de los valores en la tabla

Podemos utilizar SAS proc freq para determinar los valores más o menos frecuentes dentro de una variable.

Ejemplo-

Proc freq data=SASHelp.cars order=freq; Tables type origin;Run;

Las tablas resultantes muestran la frecuencia de cada variable ordenada con la variable más común arriba y la menos común abajo:

Ordenando los valores en la tabla

Todo esto fue en el Tutorial de Distribución de Frecuencias de SAS. Esperamos que os guste nuestra explicación.

Conclusión

Así pues, esperamos que todos hayáis entendido cómo podemos utilizar el procedimiento PROC FREQ para encontrar la distribución de frecuencias de SAS de las variables categóricas en nuestro conjunto de datos. En conclusión, también vimos cómo podemos crear distribuciones de frecuencia SAS de una sola variable y de múltiples variables, una frecuencia de valores perdidos y, valores de ordenación. Además, si tienes alguna consulta no dudes en preguntar en la sección de comentarios.

Tema relacionado – Una completa guía SAS PROC SQL

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *