SAS - 相關分析



相關分析處理變數之間的關係。相關係數是衡量兩個變數之間線性關聯程度的指標。相關係數的值始終介於 -1 和 +1 之間。SAS 提供 PROC CORR 過程來查詢資料集中變數對之間的相關係數。

語法

在 SAS 中應用 PROC CORR 的基本語法如下:

PROC CORR DATA = dataset options;
VAR variable;

以下是所用引數的描述:

  • 資料集 是資料集的名稱。

  • 選項 是過程的附加選項,例如繪製矩陣等。

  • 變數 是用於查詢相關性的資料集的變數名。

示例

可以透過在 VAR 語句中使用變數名來獲得資料集中變數對之間的相關係數。在下面的示例中,我們使用資料集 CARS1 並獲得結果,顯示馬力和重量之間的相關係數。

PROC SQL;
create table CARS1 as
SELECT invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc corr data = cars1 ;
VAR horsepower weight ;
BY make;
run;

執行上述程式碼後,將獲得以下結果:

corr_ana_2

所有變數之間的相關性

可以透過簡單地應用帶有資料集名稱的過程來獲得資料集中所有可用變數之間的相關係數。

示例

在下面的示例中,我們使用資料集 CARS1 並獲得結果,顯示每個變數對之間的相關係數。

proc corr data = cars1 ;
run;

執行上述程式碼後,將獲得以下結果:

corr_ana_1

相關矩陣

我們可以透過在 PROC 語句中選擇繪製矩陣選項來獲得變數之間的散點圖矩陣。

示例

在下面的示例中,我們獲得馬力和重量之間的矩陣。

proc corr data = cars1 plots = matrix ;
VAR horsepower weight ;
run;

執行上述程式碼後,將獲得以下結果:

corr_ana_3
廣告