Articles

Distribuição de Frequência SAS Usando SAS PROC FREQ

Posted on

Não se torne Obsoleto & obtenha um Pink Slip
Follow DataFlair no Google News & Fique à frente do jogo

Objectivo

Hoje vamos analisar um dos procedimentos estatísticos mais frequentemente utilizados na Programação SAS, ou seja, Distribuição de Frequências SAS. Veremos como criar uma tabela de distribuição de frequência em SAS e uma variedade de opções que podem ser aplicadas enquanto se cria uma tabela para obter melhores resultados.

Então, vamos começar a Distribuição de Frequência SAS usando SAS PROC FREQ.

p> Distribuição de Frequência SAS usando SAS PROC FREQ

Distribuição de Frequência SAS

Para variáveis contínuas, estatísticas descritivas como média e desvio padrão podem ser usadas para resumir os dados. Mas para as variáveis categóricas, estas medidas não são apropriadas. As variáveis categóricas podem ser resumidas usando uma tabela de frequência, que mostra o número e percentagem de casos observados para cada categoria de uma variável.

Levemos ler SAS Cross Tabulation em detalhe

Uma variável categórica (por vezes chamada variável nominal) é aquela que tem duas ou mais categorias, mas não há ordenação para as categorias. Por exemplo, o género é uma variável categórica com duas categorias (masculino e feminino) e não há ordenação das categorias. A cor do cabelo é também uma variável categórica com várias categorias (loira, castanha, morena, vermelha, etc.) e, mais uma vez, não há forma acordada de encomendar estas do mais alto para o mais baixo. Uma variável puramente categórica é aquela que simplesmente lhe permite atribuir categorias, mas não pode encomendar claramente as variáveis.

Tabela de distribuição de frequência SAS parece-se com a apresentada abaixo-

p>Exemplo de distribuição de frequência SAS

Procedimento SAS PROC FREQ

O procedimento SAS PROC FREQ imprime todos os valores de uma dada variável categórica na janela Output, juntamente com o número e percentagem de vezes que cada valor aparece. O procedimento FREQ pode funcionar com ambas as variáveis categóricas de cadeia (caracteres) ou numéricas.

A sintaxe da declaração SAS PROC FREQ é:

PROC FREQ DATA = Dataset ;TABLES Variable1 ;BY Variable2 ;

A declaração PROC FREQ é a única declaração necessária para o procedimento FREQ.

Uma tabela de frequência básica criada com PROC FREQ terá as seguintes propriedades:

  • Incluirá a frequência, percentagem, frequência acumulada, e percentagem acumulada para cada categoria.
  • Se houver casos com valores em falta para a variável, o número de valores em falta é dado abaixo da tabela.
  • Para variáveis de string, as categorias serão ordenadas alfabeticamente. Para variáveis numéricas, as categorias serão ordenadas do menor para o maior indicador.

Basic Usage of SAS PROC FREQ

Esta é a forma mais básica de um PROC FREQ na Distribuição de Frequências SAS. Só precisamos de especificar o nome do conjunto de dados e não as variáveis.

Exemplo-

Proc freq data=SASHelp.cars;Run;

O código acima cria uma tabela de frequência para cada uma das variáveis do conjunto de dados.

Por exemplo, abaixo está uma tabela de frequência para a variável MAKE.

p>Basic Usage of SAS PROC FREQ

a. SAS PROC FREQ com opção de tabelas ( variável única)

Usar SAS Proc Freq sem quaisquer opções não é normalmente recomendado, particularmente se tiver um grande conjunto de dados que contém variáveis que têm muitos valores únicos (níveis). Utilização de declaração de tabelas em tais casos.

Leia sobre SAS Proc Sort Sets de dados em detalhe

Exemplo-

Proc freq data=SASHelp.cars ;Tables Origin;Run;

SAS PROC FREQ – Variável Única

b. Distribuições de múltiplas variáveis de frequência

Muitos números de tabelas podem ser gerados para o mesmo número de variáveis que estão presentes no conjunto de dados.
Exemplo-

PROC FREQ DATA=sample;TABLE State Rank;RUN;
p>SAS PROC FREQ – Multiple Variable

Valores ausentes na Tabela de Frequência

Não é necessário que os nossos dados tenham sempre valores, por vezes há valores ausentes num dado. Quando a tabela de distribuição de frequência SAS cria, também imprime o número de valores em falta na variável. Para conhecer a frequência, percentagem de valores em falta dentro da variável categórica, temos de especificá-la na declaração da tabela.

Vamos explorar tipos de software em SAS

Exemplo-

PROC FREQ DATA=sample; TABLE State Rank / MISSING;RUN;
p>Valores ausentes na Tabela de Frequência

Valores ausentes na Tabela

Pode usar SAS proc freq para determinar os valores mais ou menos comuns dentro de uma variável.

Exemplo-

Proc freq data=SASHelp.cars order=freq; Tables type origin;Run;

br>As tabelas resultantes mostram a frequência de cada variável ordenada com a variável mais comum no topo e a menos comum no fundo:

Valores de ordenação na tabela

Esta foi tudo no Tutorial de Distribuição de Frequência SAS. Esperamos que tenham gostado da nossa explicação.

Conclusão

Hence, esperamos que todos tenham compreendido como podemos utilizar o procedimento PROC FREQ para encontrar a distribuição de frequências SAS de variáveis categóricas no nosso conjunto de dados. Em conclusão, vimos também como podemos criar uma única variável e múltiplas distribuições de frequência SAS, uma frequência de valores em falta e, ordenando valores. Além disso, se tiver alguma pergunta, sinta-se à vontade para a fazer numa secção de comentários.

Tópico relacionado – Um Guia SAS SQL PROC completo

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *