SAS - 程式結構



SAS 程式設計首先涉及將資料集建立/讀取到記憶體中,然後對這些資料進行分析。我們需要了解編寫程式以實現此目的的流程。

SAS 程式結構

下圖顯示了按給定順序編寫的步驟,以建立 SAS 程式。

ps_flow_1

每個 SAS 程式都必須包含所有這些步驟才能完成讀取輸入資料、分析資料和提供分析輸出的過程。此外,每個步驟末尾的RUN語句都是完成該步驟執行所必需的。

DATA 步

此步驟涉及將所需資料集載入到 SAS 記憶體中並識別資料集的變數(也稱為列)。它還捕獲記錄(也稱為觀察值或主體)。DATA 語句的語法如下所示。

語法

DATA data_set_name;		#Name the data set.
INPUT var1,var2,var3; 		#Define the variables in this data set.
NEW_VAR;			#Create new variables.
LABEL;			      	#Assign labels to variables.
DATALINES;		      	#Enter the data.
RUN;

示例

以下示例顯示了一個簡單的情況,即命名資料集、定義變數、建立新變數和輸入資料。這裡字串變數末尾帶有 $,數值變數則沒有。

DATA TEMP;
INPUT ID $ NAME $ SALARY DEPARTMENT $;
comm = SALARY*0.25;
LABEL ID = 'Employee ID' comm = 'COMMISION';
DATALINES;
1 Rick 623.3 IT
2 Dan 515.2 Operations
3 Michelle 611 IT
4 Ryan 729 HR
5 Gary 843.25 Finance
6 Nina 578 IT
7 Simon 632.8 Operations
8 Guru 722.5 Finance
;
RUN;

PROC 步

此步驟涉及呼叫 SAS 內建過程來分析資料。

語法

PROC procedure_name options; #The name of the proc.
RUN;

示例

以下示例顯示了使用MEANS過程列印資料集中數值變數的平均值。

PROC MEANS;
RUN;

OUTPUT 步

資料集中的資料可以透過條件輸出語句顯示。

語法

PROC PRINT DATA = data_set;
OPTIONS;
RUN;

示例

以下示例顯示了在輸出中使用 where 子句僅從資料集中生成少數記錄。

PROC PRINT DATA = TEMP;
WHERE SALARY > 700;
RUN;

完整的 SAS 程式

以下是每個上述步驟的完整程式碼。

ps_complete_code

程式輸出

上述程式碼的輸出顯示在RESULTS選項卡中。

ps_program_output
廣告