找到 2038 篇文章 適用於 R 程式設計

使用 data.table 在 R 中連線資料

Bhuwanesh Nainwal
更新於 2023年1月17日 15:06:04

2K+ 瀏覽量

在本文中,我們將討論使用 data.table 包在 R 中連線資料。術語“連線資料”是指執行不同型別的連線操作,例如兩個或多個表之間的內部連線、左外部連線、右外部連線和全外部連線。在表之間執行連線操作的主要目的是根據某些屬性(或列)條件訪問多個表中的資料。R 為我們提供了 data.table 包,藉助該包,我們可以非常有效地處理表格資料(具有行和列)。該包作為替代方案推出... 閱讀更多

使用 purrr 進行函數語言程式設計

Bhuwanesh Nainwal
更新於 2023年1月17日 16:18:23

254 瀏覽量

函數語言程式設計是一種程式設計方法,其中我們透過構建和應用函式來構建程式。更具體地說,在程式中,我們應用順序純函式而不是語句。純函式是一個接受輸入併產生一致值作為輸出的函式。此外,在此過程中不會修改任何增強或輸入流。此類函式能夠執行單個操作,但為了執行復雜操作,我們可以將其組合成序列。在本教程中,我們將討論使用 purr 進行函數語言程式設計。如今,函數語言程式設計由於其能夠... 閱讀更多

防禦性 R 程式設計

Bhuwanesh Nainwal
更新於 2023年1月17日 14:54:01

338 瀏覽量

防禦性程式設計是一種軟體開發實踐,它涉及以一種預期和防止錯誤和漏洞的方式設計和實現程式碼。在 R 程式設計中,防禦性程式設計涉及使用技術和策略來確保您的 R 程式碼健壯、可靠和安全。對於防禦性程式設計中的“防禦性”一詞,你們中的大多數人可能會對它是否意味著編寫永遠不會失敗的程式碼感到困惑。但“防禦性程式設計”的實際定義是編寫正確失敗的程式碼。“正確失敗”是指 - 如果程式碼失敗,則應... 閱讀更多

處理 R 中的缺失資料

Bhuwanesh Nainwal
更新於 2023年1月17日 16:12:22

29K+ 瀏覽量

在資料科學中,處理缺失資料是一項常見任務之一。如果您的資料集中存在缺失資料,則有多種方法可以在 R 程式設計中處理它。一種方法是簡單地刪除包含缺失資料的任何行或列。處理缺失資料的另一種方法是使用統計方法對缺失值進行插補。這意味著使用基於資料集中其他值進行估計來替換缺失值。例如,我們可以用找到缺失值的變數的平均值或中位數來替換缺失值。... 閱讀更多

使用 data.table 在 R 中進行資料操作

Bhuwanesh Nainwal
更新於 2023年1月17日 14:17:38

2K+ 瀏覽量

資料操作是資料分析過程中的一個關鍵步驟,因為它允許我們以適合特定分析或視覺化的方式準備和組織資料。根據資料型別和結構以及操作的具體目標,有許多不同的資料操作工具和技術。data.table 包是 R 包,它提供了 R 中 data.frame 類的增強版本。它的語法和功能使操作和處理大型資料集變得更容易和更快。date.table 是一個... 閱讀更多

如何在 R 矩陣中找到移動標準差?

Nizamuddin Siddiqui
更新於 2021年11月23日 06:52:55

318 瀏覽量

在矩陣中找到移動標準差的方式與在資料框中相同,我們只需要使用矩陣物件名稱代替資料框名稱。因此,我們可以為此目的使用 zoo 包的 rollapply 函式。例如,如果我們有一個名為 M 的矩陣,並且我們想找到 2 個移動標準差,那麼我們可以使用以下命令:rollapply(M,width=2,FUN=sd,fill=0,align="r")示例 1以下程式碼段建立一個矩陣:M1

如何在 R 中舍入摘要輸出?

Nizamuddin Siddiqui
更新於 2021年11月23日 06:49:16

4K+ 瀏覽量

要舍入 R 中 summary 函式的輸出,我們可以在應用 summary 函式時使用 digits 引數。例如,如果我們有一個名為 df 的資料框,然後要找到輸出中帶有兩位數字的彙總統計資訊,我們可以使用以下命令:summary(df, digits=2)示例 1以下程式碼段建立一個數據框:head(iris, 20) 建立了以下資料框:Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 ... 閱讀更多

如何在 R 中查詢 n 個列的行總和?

Nizamuddin Siddiqui
更新於 2021年11月23日 06:36:30

3K+ 瀏覽量

可以使用 rowSums 函式以及使用單個方括號對列進行子集選擇來找到 n 個列的行總和。例如,如果我們有一個名為 df 的資料框,其中包含 5 列,並且我們想查詢最後 3 列的行總和,則可以使用以下命令:df$Sum_3

如何在 R 中從命名向量中提取最大值?

Nizamuddin Siddiqui
更新於 2021年11月23日 06:31:08

907 瀏覽量

要從 R 中的命名向量中提取最大值,我們可以使用 which.max 函式。例如,如果我們有一個名為 X 的向量,它是一個命名向量,那麼我們可以使用以下命令在 X 中查詢最大值。X[which.max(X)]檢視以下示例以瞭解其工作原理。示例 1以下程式碼段建立一個向量:x1

如何在 R 中使用 ggplot2 減少 Y 軸值和刻度之間的間距?

Nizamuddin Siddiqui
更新於 2021年11月23日 06:21:07

5K+ 瀏覽量

要使用 ggplot2 減少軸值和刻度之間的間距,我們可以使用 ggplot2 包的 theme 函式,並將 margin 設定為 0。例如,如果我們有一個名為 df 的資料框,其中包含兩列,例如 x 和 y,那麼可以透過使用以下命令建立 x 和 y 之間的散點圖,並在 Y 軸值和刻度之間減少間距:ggplot(df,aes(x,y))+geom_point()+theme(axis.text.y=element_text(margin=margin(r=0)))示例以下程式碼段建立一個樣本資料框:x

廣告

© . All rights reserved.