R - 快速指南

R - 概述

R 是一種用於統計分析、圖形表示和報告的程式語言和軟體環境。R 由紐西蘭奧克蘭大學的 Ross Ihaka 和 Robert Gentleman 建立，目前由 R 開發核心團隊開發。

R 的核心是一種解釋型計算機語言，它允許分支和迴圈，以及使用函式進行模組化程式設計。為了提高效率，R 允許與用 C、C++、.Net、Python 或 FORTRAN 語言編寫的過程整合。

R 在 GNU 通用公共許可證下免費提供，並且為各種作業系統（如 Linux、Windows 和 Mac）提供了預編譯的二進位制版本。

R 是在 GNU 風格的版權宣告下分發的自由軟體，並且是稱為GNU S的 GNU 專案的正式組成部分。

R 的發展歷程

R 最初由紐西蘭奧克蘭大學統計系Ross Ihaka和Robert Gentleman編寫。R 於 1993 年首次出現。

一大批個人透過傳送程式碼和錯誤報告為 R 做出了貢獻。
自 1997 年年中以來，一直有一個核心小組（“R 核心團隊”）可以修改 R 原始碼檔案。

R 的特點

如前所述，R 是一種用於統計分析、圖形表示和報告的程式語言和軟體環境。以下是 R 的重要特性：

R 是一種完善的、簡單有效的程式語言，包括條件語句、迴圈語句、使用者定義的遞迴函式以及輸入輸出功能。
R 具有有效的資料處理和儲存功能。
R 提供了一套用於對陣列、列表、向量和矩陣進行計算的運算子。
R 提供了大量連貫且整合的用於資料分析的工具。
R 提供了用於資料分析和顯示的圖形功能，可以直接在計算機上顯示或列印到紙張上。

總之，R 是世界上使用最廣泛的統計程式語言。它是資料科學家的首選，並得到一個充滿活力且才華橫溢的貢獻者社群的支援。R 在大學中教授，並部署在關鍵業務應用程式中。本教程將透過簡單易懂的步驟，結合合適的示例，教你學習 R 程式設計。

R - 環境設定

本地環境設定

如果你仍然希望為 R 設定你的環境，你可以按照以下步驟操作。

Windows 安裝

你可以從R-3.2.2 for Windows (32/64 bit)下載 R 的 Windows 安裝程式版本，並將其儲存到本地目錄中。

因為它是一個名為“R-version-win.exe”的 Windows 安裝程式 (.exe)。你可以雙擊並執行安裝程式，接受預設設定。如果你的 Windows 是 32 位版本，它將安裝 32 位版本。但如果你的 Windows 是 64 位版本，則它將安裝 32 位和 64 位版本。

安裝後，你可以在 Windows 程式檔案下的“R\R3.2.2\bin\i386\Rgui.exe”目錄結構中找到執行程式的圖示。單擊此圖示將顯示 R-GUI，它是用於執行 R 程式設計的 R 控制檯。

Linux 安裝

R 可作為許多 Linux 版本的二進位制檔案，位於R 二進位制檔案。

安裝 Linux 的說明因發行版而異。這些步驟在上述連結中每個型別的 Linux 版本下都有說明。但是，如果你很著急，可以使用yum命令安裝 R，如下所示：

$ yum install R

以上命令將安裝 R 程式設計的核心功能以及標準包，如果你仍然需要其他包，則可以啟動 R 提示符，如下所示：

$ R
R version 3.2.0 (2015-04-16) -- "Full of  Ingredients"          
Copyright (C) 2015 The R Foundation for Statistical Computing
Platform: x86_64-redhat-linux-gnu (64-bit)

R is free software and comes with ABSOLUTELY NO WARRANTY.
You are welcome to redistribute it under certain conditions.
Type 'license()' or 'licence()' for distribution details.

R is a collaborative project with many  contributors.                    
Type 'contributors()' for more information and
'citation()' on how to cite R or R packages in publications.

Type 'demo()' for some demos, 'help()' for on-line help, or
'help.start()' for an HTML browser interface to help.
Type 'q()' to quit R.
>

現在，你可以在 R 提示符下使用 install 命令安裝所需的包。例如，以下命令將安裝plotrix包，該包是 3D 圖表所需的。

> install.packages("plotrix")

R - 基本語法

按照慣例，我們將透過編寫一個“Hello, World！”程式開始學習 R 程式設計。根據需要，你可以在 R 命令提示符下程式設計，也可以使用 R 指令碼檔案編寫程式。讓我們逐一檢查兩者。

R 命令提示符

一旦你設定了 R 環境，只需在你的命令提示符下鍵入以下命令即可輕鬆啟動 R 命令提示符：

$ R

這將啟動 R 直譯器，你將獲得一個提示符>，你可以在其中開始鍵入程式，如下所示：

> myString <- "Hello, World!"
> print ( myString)
[1] "Hello, World!"

這裡第一條語句定義了一個字串變數 myString，我們為其賦值一個字串“Hello, World！”，然後下一條語句 print() 用於列印儲存在變數 myString 中的值。

R 指令碼檔案

通常，你將透過在指令碼檔案中編寫程式來進行程式設計，然後在命令提示符下使用稱為Rscript的 R 直譯器執行這些指令碼。因此，讓我們從在名為 test.R 的文字檔案中編寫以下程式碼開始：

資料型別	示例	驗證
邏輯型	TRUE, FALSE	即時演示 v <- TRUE print(class(v)) 它會產生以下結果： [1] "logical"
數值型	12.3, 5, 999	即時演示 v <- 23.5 print(class(v)) 它會產生以下結果： [1] "numeric"
整數型	2L, 34L, 0L	即時演示 v <- 2L print(class(v)) 它會產生以下結果： [1] "integer"
複數型	3 + 2i	即時演示 v <- 2+5i print(class(v)) 它會產生以下結果： [1] "complex"
字元型	'a' , '"good", "TRUE", '23.4'	即時演示 v <- "TRUE" print(class(v)) 它會產生以下結果： [1] "character"
原始型	"Hello" 儲存為 48 65 6c 6c 6f	即時演示 v <- charToRaw("Hello") print(class(v)) 它會產生以下結果： [1] "raw"

變數名	有效性	原因
var_name2.	有效	包含字母、數字、點和下劃線
var_name%	無效	包含字元'%'。僅允許點(.)和下劃線。
2var_name	無效	以數字開頭
.var_name, var.name	有效	可以以點(.)開頭，但點(.)後面不能跟著數字。
.2var_name	無效	起始點後跟著數字，使其無效。
_var_name	無效	以_開頭，無效

運算子	描述	示例
+	將兩個向量相加	即時演示 v <- c( 2,5.5,6) t <- c(8, 3, 4) print(v+t) 它會產生以下結果： [1] 10.0 8.5 10.0
−	從第一個向量中減去第二個向量	即時演示 v <- c( 2,5.5,6) t <- c(8, 3, 4) print(v-t) 它會產生以下結果： [1] -6.0 2.5 2.0
*	將兩個向量相乘	即時演示 v <- c( 2,5.5,6) t <- c(8, 3, 4) print(v*t) 它會產生以下結果： [1] 16.0 16.5 24.0
/	將第一個向量除以第二個向量	即時演示 v <- c( 2,5.5,6) t <- c(8, 3, 4) print(v/t) 當我們執行以上程式碼時，它會產生以下結果： [1] 0.250000 1.833333 1.500000
%%	第一個向量除以第二個向量的餘數	即時演示 v <- c( 2,5.5,6) t <- c(8, 3, 4) print(v%%t) 它會產生以下結果： [1] 2.0 2.5 2.0
%/%	第一個向量除以第二個向量的結果（商）	即時演示 v <- c( 2,5.5,6) t <- c(8, 3, 4) print(v%/%t) 它會產生以下結果： [1] 0 1 1
^	第一個向量以第二個向量為指數的冪	即時演示 v <- c( 2,5.5,6) t <- c(8, 3, 4) print(v^t) 它會產生以下結果： [1] 256.000 166.375 1296.000

運算子	描述	示例
>	檢查第一個向量的每個元素是否大於第二個向量的對應元素。	即時演示 v <- c(2,5.5,6,9) t <- c(8,2.5,14,9) print(v>t) 它會產生以下結果： [1] FALSE TRUE FALSE FALSE
<	檢查第一個向量的每個元素是否小於第二個向量的對應元素。	即時演示 v <- c(2,5.5,6,9) t <- c(8,2.5,14,9) print(v < t) 它會產生以下結果： [1] TRUE FALSE TRUE FALSE
==	檢查第一個向量的每個元素是否等於第二個向量的對應元素。	即時演示 v <- c(2,5.5,6,9) t <- c(8,2.5,14,9) print(v == t) 它會產生以下結果： [1] FALSE FALSE FALSE TRUE
<=	檢查第一個向量的每個元素是否小於或等於第二個向量的對應元素。	即時演示 v <- c(2,5.5,6,9) t <- c(8,2.5,14,9) print(v<=t) 它會產生以下結果： [1] TRUE FALSE TRUE TRUE
>=	檢查第一個向量的每個元素是否大於或等於第二個向量的對應元素。	即時演示 v <- c(2,5.5,6,9) t <- c(8,2.5,14,9) print(v>=t) 它會產生以下結果： [1] FALSE TRUE FALSE TRUE
!=	檢查第一個向量的每個元素是否不等於第二個向量的對應元素。	即時演示 v <- c(2,5.5,6,9) t <- c(8,2.5,14,9) print(v!=t) 它會產生以下結果： [1] TRUE TRUE TRUE FALSE

序號	語句和描述
1	if語句 if語句由一個布林表示式後跟一個或多個語句組成。
2	if...else語句 if語句後可以跟一個可選的else語句，當布林表示式為false時執行。
3	switch語句 switch語句允許將變數與其值列表進行相等性測試。

序號	迴圈型別和描述
1	repeat迴圈多次執行一系列語句，並縮寫管理迴圈變數的程式碼。
2	while迴圈當給定條件為true時重複語句或語句組。它在執行迴圈體之前測試條件。
3	for迴圈類似於while語句，只是它在迴圈體結束時測試條件。

序號	控制語句和描述
1	break語句終止迴圈語句並將執行轉移到迴圈後的下一條語句。
2	Next語句 next語句模擬R switch的行為。

R - 快速指南

R - 概述

R 的發展歷程

R 的特點

R - 環境設定

本地環境設定

Windows 安裝

Linux 安裝

R - 基本語法

R 命令提示符

R 指令碼檔案

註釋

R - 資料型別

向量

列表

矩陣

陣列

因子

資料框

R - 變數

變數賦值

變數的資料型別

查詢變數

刪除變數

R - 運算子

運算子型別

算術運算子

關係運算符

邏輯運算子

賦值運算子

其他運算子

R - 決策

R - 迴圈

迴圈控制語句

R - 函式

函式定義

函式元件

內建函式

使用者定義函式

呼叫函式

無引數呼叫函式

帶引數值呼叫函式（按位置和按名稱）

使用預設引數呼叫函式

函式的惰性求值

R - 字串

字串構造規則

有效字串示例

無效字串示例

字串操作

連線字串 - paste() 函式

語法

示例

格式化數字和字串 - format() 函式

語法

示例

計算字串中字元的數量 - nchar() 函式

語法

示例

更改大小寫 - toupper() 和 tolower() 函式

語法

示例

提取字串的部分 - substring() 函式

語法

示例

R - 向量

向量建立

單元素向量

多元素向量

訪問向量元素

向量操作

向量算術

向量元素迴圈

向量元素排序

R - 列表

建立列表

命名列表元素

訪問列表元素

操作列表元素

合併列表

將列表轉換為向量