找到 2038 篇文章 關於 R 程式設計

使用 data.table 連線 R 中的資料

Bhuwanesh Nainwal
更新於 2023年1月17日 15:06:04

2K+ 次瀏覽

在這篇文章中,我們將討論使用 data.table 包在 R 中連線資料。 “連線資料”指的是執行不同型別的連線操作,例如兩個或多個表之間的內部連線、左外連線、右外連線和全外連線。 在表之間執行連線操作的主要目的是基於某些屬性(或列)條件訪問多個表中的資料。 R 提供了 data.table 包,我們可以用它非常有效地處理表格資料(具有行和列)。 此包作為替代方案推出…… 閱讀更多

使用 purrr 進行函數語言程式設計

Bhuwanesh Nainwal
更新於 2023年1月17日 16:18:23

254 次瀏覽

函數語言程式設計是一種程式設計方法,其中我們透過構造和應用函式來構造程式。更具體地說,在程式中,我們應用順序的純函式而不是語句。純函式是一個接受輸入併產生一致值作為輸出的函式。此外,在此過程中不會修改任何引數或輸入流。此類函式能夠執行單個操作,但為了執行復雜操作,我們可以將它們組合成序列。在本教程中,我們將討論使用 purr 進行函數語言程式設計。如今,函數語言程式設計因其能夠…… 閱讀更多

防禦式 R 程式設計

Bhuwanesh Nainwal
更新於 2023年1月17日 14:54:01

338 次瀏覽

防禦式程式設計是一種軟體開發實踐,它涉及以一種預期並防止錯誤和漏洞的方式設計和實現程式碼。在 R 程式設計中,防禦式程式設計涉及使用技術和策略來確保您的 R 程式碼健壯、可靠和安全。“防禦式”一詞在防禦式程式設計中,你們大多數人可能對它是否意味著編寫根本不會失敗的程式碼感到困惑。但“防禦式程式設計”的實際定義是編寫正確失敗的程式碼。 “正確失敗”的意思是——如果程式碼失敗,則應該…… 閱讀更多

處理 R 中的缺失資料

Bhuwanesh Nainwal
更新於 2023年1月17日 16:12:22

29K+ 次瀏覽

在資料科學中,一項常見的任務是處理缺失資料。如果您的資料集中存在缺失資料,則有多種方法可以在 R 程式設計中處理它。一種方法是簡單地刪除包含缺失資料的任何行或列。處理缺失資料的另一種方法是使用統計方法估算缺失值。這意味著用基於資料集中的其他值進行估算來替換缺失值。例如,我們可以用找到缺失值的變數的平均值或中位數來替換缺失值…… 閱讀更多

使用 data.table 在 R 中進行資料操作

Bhuwanesh Nainwal
更新於 2023年1月17日 14:17:38

2K+ 次瀏覽

資料操作是資料分析過程中的一個關鍵步驟,因為它允許我們以適合特定分析或視覺化的方式準備和組織資料。資料操作工具和技術有很多種,具體取決於資料的型別和結構,以及操作的具體目標。data.table 包是一個 R 包,它提供 R 中 data.frame 類的增強版本。它的語法和功能使操作和處理大型資料集更容易、更快。date.table 是…… 閱讀更多

如何在 R 矩陣中查詢移動標準差?

Nizamuddin Siddiqui
更新於 2021年11月23日 06:52:55

318 次瀏覽

在矩陣中查詢移動標準差的方法與在資料框中的方法相同,我們只需要使用矩陣物件名稱代替資料框名稱即可。因此,我們可以為此目的使用 zoo 包的 rollapply 函式。例如,如果我們有一個名為 M 的矩陣,並且我們想找到 2 個移動標準差,那麼我們可以使用以下命令:rollapply(M,width=2,FUN=sd,fill=0,align="r")示例 1以下程式碼片段建立一個矩陣 -M1

如何在 R 中舍入摘要輸出?

Nizamuddin Siddiqui
更新於 2021年11月23日 06:49:16

4K+ 次瀏覽

要在 R 中舍入 summary 函式的輸出,我們可以在應用 summary 函式時使用 digits 引數。例如,如果我們有一個名為 df 的資料框,則要找到輸出中帶有兩位數字的彙總統計資訊,我們可以使用以下命令:summary(df, digits=2)示例 1以下程式碼片段建立一個數據框:head(iris, 20) 建立了以下資料框:Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 ... 閱讀更多

如何在 R 中查詢 n 個列的逐行總和?

Nizamuddin Siddiqui
更新於 2021年11月23日 06:36:30

3K+ 次瀏覽

可以使用 rowSums 函式以及使用單個方括號對列進行子集選擇來查詢 n 個列的逐行總和。例如,如果我們有一個名為 df 的資料框,其中包含五列,並且我們想找到最後三列的行總和,則可以使用以下命令:df$Sum_3

如何在 R 中從命名向量中提取最大值?

Nizamuddin Siddiqui
更新於 2021年11月23日 06:31:08

907 次瀏覽

要在 R 中從命名向量中提取最大值,可以使用 which.max 函式。例如,如果我們有一個名為 X 的向量,它是一個命名向量,則可以使用以下命令在 X 中查詢最大值。X[which.max(X)] 檢視以下示例以瞭解其工作原理。示例 1以下程式碼片段建立一個向量 -x1

如何在 R 中使用 ggplot2 減少 Y 軸值和刻度之間的空間?

Nizamuddin Siddiqui
更新於 2021年11月23日 06:21:07

5K+ 次瀏覽

要使用 ggplot2 減少軸值和刻度之間的空間,我們可以使用 ggplot2 包的 theme 函式並將 margin 設定為 0。例如,如果我們有一個名為 df 的資料框,其中包含兩列,例如 x 和 y,則可以透過使用以下命令建立 x 和 y 之間的散點圖,從而減少 Y 軸值和刻度之間的空間:ggplot(df,aes(x,y))+geom_point()+theme(axis.text.y=element_text(margin=margin(r=0)))示例以下程式碼片段建立一個樣本資料框 -x

廣告
© . All rights reserved.