SAS - 標準差



標準差 (SD) 是衡量資料集中的資料變化程度的指標。從數學上講,它衡量每個值與資料集的平均值的距離或接近程度。接近 0 的標準差值表示資料點傾向於非常接近資料集的平均值,而較高的標準差值表示資料點分佈在較寬的值範圍內。

在 SAS 中,SD 值是使用 PROC MEAN 和 PROC SURVEYMEANS 來衡量的。

使用 PROC MEANS

要使用proc means 測量 SD,我們在 PROC 步驟中選擇 STD 選項。它會顯示資料集中每個數值變數的 SD 值。

語法

在 SAS 中計算標準差的基本語法如下:

PROC means DATA = dataset STD;

以下是所用引數的描述:

  • 資料集 - 是資料集的名稱。

示例

在下面的示例中,我們從 SASHELP 庫中的 CARS 資料集建立 CARS1 資料集。我們在 PROC MEANS 步驟中選擇 STD 選項。

PROC SQL;
create table CARS1 as
SELECT make, type, invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc means data = CARS1 STD;
run;

當我們執行以上程式碼時,它會給出以下輸出:

SD_1.JPG

使用 PROC SURVEYMEANS

此過程也用於測量 SD,以及一些高階功能,例如測量分類變數的 SD 以及提供方差估計。

語法

使用 PROC SURVEYMEANS 的語法如下:

PROC SURVEYMEANS options statistic-keywords ;
BY variables ;
CLASS variables ;
VAR variables ;

以下是所用引數的描述:

  • BY - 指示用於建立觀測組的變數。

  • CLASS - 指示用於分類變數的變數。

  • VAR - 指示將計算 SD 的變數。

示例

以下示例描述了class選項的使用,該選項為類別變數中的每個值建立統計資料。

proc surveymeans data = CARS1 STD;
class type;
var type horsepower;
ods output statistics = rectangle;
run;
proc print data = rectangle;
run;

當我們執行以上程式碼時,它會給出以下輸出:

SD_2.JPG

使用 BY 選項

以下程式碼給出了 BY 選項的示例。在其中,結果按 BY 選項中的每個值進行分組。

示例

proc surveymeans data = CARS1 STD;
var horsepower;
BY make;
ods output statistics = rectangle;
run;
proc print data = rectangle;
run;

當我們執行以上程式碼時,它會給出以下輸出:

make = "Audi" 的結果

SD_3.JPG

make = "BMW" 的結果

SD_3.JPG
廣告

© . All rights reserved.