
- R 教程
- R - 首頁
- R - 概述
- R - 環境設定
- R - 基本語法
- R - 資料型別
- R - 變數
- R - 運算子
- R - 決策
- R - 迴圈
- R - 函式
- R - 字串
- R - 向量
- R - 列表
- R - 矩陣
- R - 陣列
- R - 因子
- R - 資料框
- R - 包
- R - 資料重塑
R - 面試問題
尊敬的讀者們,這些 R 面試問題是專門設計的,旨在讓您瞭解在 R 程式設計主題的面試中可能遇到的問題的性質。根據我的經驗,好的面試官很少會提前計劃好要問哪些具體問題,通常問題會從該主題的一些基本概念開始,然後根據進一步的討論和您的回答繼續下去。
R 是一種用於統計分析和為此目的建立圖形的程式語言。它沒有資料型別,而是使用資料物件進行計算。它被用於資料探勘、迴歸分析、機率估計等領域,並利用其中許多可用的包。
R 中有 6 種資料物件。它們是向量、列表、陣列、矩陣、資料框和表格。
有效的變數名由字母、數字和點或下劃線字元組成。變數名以字母或點開頭,後面不跟數字。
矩陣始終是二維的,因為它只有行和列。但是陣列可以是任意數量的維度,每個維度都是一個矩陣。例如,一個 3x3x2 的陣列表示兩個 3x3 維度的矩陣。
R 中的因子資料物件用於儲存和處理 R 中的分類資料。
可以使用 read.csv 函式載入 csv 檔案。R 使用此函式讀取 csv 檔案時會建立一個數據框。
命令 getwd() 會給出 R 環境中的當前工作目錄。
這是在設定 R 環境時預設載入的包。它提供 R 環境中的基本功能,例如輸入/輸出、算術計算等。
邏輯迴歸處理的是測量二元響應變數的機率。在 R 中,glm() 函式用於建立邏輯迴歸。
表示式 M[4,2] 給出第 4 行和第 2 列的元素。
當兩個不同長度的向量參與運算時,較短向量的元素會被重複使用以完成運算。這稱為元素迴圈。例如 - v1 <- c(4,1,0,6) 和 V2 <- c(2,4),則 v1*v2 給出 (8,4,0,24)。元素 2 和 4 被重複。
我們可以透過三種方式在 R 中呼叫函式。第一種方法是按引數的位置呼叫。第二種方法是使用引數的名稱呼叫,第三種方法是使用預設引數呼叫。
函式的惰性求值意味著,只有在函式體中使用引數時才會對其進行求值。如果函式體中沒有對引數的引用,則該引數將被忽略。
要在 R 中安裝包,我們使用以下命令。
install.packages("package Name")
名為“XML”的包用於讀取和處理 XML 檔案。
我們可以更新任何元素,但只能刪除列表末尾的元素。
在 R 中建立矩陣的一般表示式是 - matrix(data, nrow, ncol, byrow, dimnames)
boxplot() 函式用於在 R 中建立箱線圖。它以公式和資料框作為輸入來建立箱線圖。
頻率 6 表示時間序列資料的間隔為每小時 10 分鐘。
在 R 中,資料物件可以從一種形式轉換為另一種形式。例如,我們可以透過合併多個列表來建立一個數據框。這涉及一系列 R 命令以將資料轉換為新格式。這稱為資料重塑。
它生成 4 個介於 0 和 1 之間的隨機數。
使用命令
installed.packages()
它將向量 x 中的字串在字母 e 的位置拆分為子字串。
x <- "The quick brown fox jumps over the lazy dog" split.string <- strsplit(x, " ") extract.words <- split.string[[1]] result <- unique(tolower(extract.words)) print(result)
錯誤在 v * x[1] : 二元運算子的非數值引數
[1] 5 12 21 32
它將列表轉換為向量。
x <- pbinom(26,51,0.5) print(x)
NA
使用函式 as.data.frame()
function(x) { x[is.na(x)] <- sum(x, na.rm = TRUE); x }
它用於將相同的函式應用於陣列中的每個元素。例如,查詢每一行的平均值。
每個矩陣都可以稱為陣列,但反之則不然。矩陣始終是二維的,但陣列可以是任何維度。
?NA
sd(x, na.rm=TRUE)
setwd("路徑")
"%%" 給出第一個向量除以第二個向量的餘數,而 "%/%" 給出第一個向量除以第二個向量的商。
查詢每一行中值最大的列。
hist()
rm(x)
data(package = "MASS")
data(package = .packages(all.available = TRUE))
它用於透過瀏覽和選擇檔案來從本地目錄安裝 R 包。
15 %in% x
pairs(formula, data)
其中 formula 代表成對使用的變數序列,data 代表將從中獲取變數的資料集。
subset() 函式用於選擇變數和觀測值。sample() 函式用於從資料集中選擇大小為 n 的隨機樣本。
is.matrix(m) 應該返回 TRUE。
[1] NA
函式 t() 用於轉置矩陣。例如 - t(m),其中 m 是一個矩陣。
R 程式語言中的“next”語句在我們要跳過迴圈的當前迭代而不終止它時很有用。
接下來是什麼?
此外,您可以回顧一下您過去完成的作業,並確保您可以自信地談論它們。如果您是應屆畢業生,面試官不會期望您能回答非常複雜的問題,而是要讓您的基本概念非常紮實。
其次,如果您無法回答一些問題,這實際上並不重要,重要的是您回答的任何問題都必須充滿信心。所以在面試中要自信。我們在 tutorialspoint 祝您能遇到一位好的面試官,並祝您未來的事業一切順利。乾杯 :-)