SAS - 頻數分佈



頻數分佈表顯示資料集內資料點的頻率。表中的每個條目包含特定組或區間內值出現的頻率或計數,以此方式,該表總結了樣本中值的分佈。

SAS 提供了一個名為 **PROC FREQ** 的過程來計算資料集內資料點的頻數分佈。

語法

在 SAS 中計算頻數分佈的基本語法如下:

PROC FREQ DATA = Dataset ;
TABLES Variable_1 ;
BY Variable_2 ;

以下是所用引數的描述:

  • **資料集** 是資料集的名稱。

  • **變數_1** 是需要計算其頻數分佈的資料集的變數名稱。

  • **變數_2** 是對頻數分佈結果進行分類的變數。

單變數頻數分佈

我們可以使用 **PROC FREQ** 來確定單個變數的頻數分佈。在這種情況下,結果將顯示變數每個值的頻率。結果還顯示百分比分佈、累積頻率和累積百分比。

示例

在下面的示例中,我們找到名為 **CARS1** 的資料集(從 **SASHELP.CARS** 庫建立)中 horsepower 變數的頻數分佈。我們可以看到結果分為兩類。一類是針對每種汽車品牌。

PROC SQL;
create table CARS1 as
SELECT make, model, type, invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc FREQ data = CARS1 ;
tables horsepower; 
by make;
run;

執行上述程式碼後,我們將得到以下結果:

FREQ_By2

多變數頻數分佈

我們可以找到多個變數的頻數分佈,這些變數將其分組為所有可能的組合。

示例

在下面的示例中,我們計算汽車品牌(按車型分組)的頻數分佈,以及按品牌分組的每種車型的頻數分佈。

proc FREQ data = CARS1 ;
tables make type; 
run;

執行上述程式碼後,我們將得到以下結果:

FREQ_tables1

帶權重的頻數分佈

使用權重選項,我們可以計算受變數權重影響的頻數分佈。此處,變數的值作為觀測數而不是值計數。

示例

在下面的示例中,我們計算 make 和 type 變數的頻數分佈,並將權重分配給 horsepower。

proc FREQ data = CARS1 ;
tables make type; 
weight horsepower;
run;

執行上述程式碼後,我們將得到以下結果:

FREQ_tables3
廣告