找到 2038 篇文章 關於 R 程式設計

如何在 R 中將用空格記錄的缺失值替換為 NA 或任何其他值?

Nizamuddin Siddiqui
更新於 2020 年 8 月 10 日 14:49:40

1K+ 次檢視

有時,當我們在 R 中讀取資料時,缺失值會被記錄為空格,並且難以用任何值替換它們。其背後的原因是我們需要知道在缺失值的位置使用了多少個空格。如果我們知道這一點,則分配任何值就變得容易了。示例考慮以下向量 x 和 y 的資料框。> x y df df x y 1 1 2 3 2 3 2 4 1 43 5 2 2 6 3 7 2 3 ... 閱讀更多

如何使用資料框的所有變數在 R 中找到相關矩陣?

Nizamuddin Siddiqui
更新於 2020 年 8 月 10 日 14:42:15

681 次檢視

相關矩陣有助於我們一次確定多個變數之間線性關係的方向和強度。因此,很容易確定哪些變數應該用於線性模型,哪些變數可以刪除。我們可以透過簡單地使用 cor 函式和資料框名稱來找到相關矩陣。示例考慮以下連續變數的資料框 -> set.seed(9) > x1 x2 x3 x4 x5 df df x1 x2 ... 閱讀更多

如何在 R 資料框中更改列的順序?

Nizamuddin Siddiqui
更新於 2020 年 8 月 10 日 14:32:20

674 次檢視

當我們想要操作資料時,可能需要對列進行排序。操作可能有多個原因,例如交叉驗證、視覺化等。我們還應該在更改原始資料中的任何內容時小心,因為這可能會影響我們的處理。要更改列的順序,我們可以使用單個方括號。示例考慮以下資料框 -> set.seed(1) > Class Grade Score df df   Class Grade Score 1   a     A     68 2   b     B     39 3   c     C      1 4   ... 閱讀更多

如何在 R 中使用 ggplot2 建立帶圖表副標題的條形圖?

Nizamuddin Siddiqui
更新於 2020 年 8 月 10 日 14:21:44

145 次檢視

有多種方法可以表達任何圖表。我們可以在圖表中提供的資訊越多越好,因為一張圖片勝過千言萬語。由於沒有人喜歡閱讀冗長的報告,因此我們應該對圖表進行更好的報告。因此,我們可以在 ggplot2 中新增圖表標題和圖表副標題來幫助讀者。示例考慮以下資料 -> set.seed(1) > x table(x) x 2 3 4 5 6 7 8 9 11 1 3 4 2 4 2 2 1 1 > df library(ggplot2)建立簡單的條形圖 -> ggplot(df, aes(x))+ + geom_bar()輸出建立 ... 閱讀更多

如何在 R 中透過一系列次數或透過固定次數建立具有重複行的數框?

Nizamuddin Siddiqui
更新於 2020 年 8 月 10 日 14:18:16

935 次檢視

有時需要資料框中的重複行,主要用於擴充套件資料大小,而不是收集原始資料。這節省了我們的時間,但肯定會有一些偏差,這是不建議的。即使不建議這樣做,但有時它也變得必要,例如,如果無法收集原始資料,那麼我們可以這樣做。如果我們這樣做,那麼我們必須在我們的分析報告中指定它。在 R 中,我們可以使用 rep 函式與 seq_len 和 nrows 來建立具有重複行的數框。示例考慮 ... 閱讀更多

如何使用 dplyr 在 R 資料框中為每個組建立最大值的數框?

Nizamuddin Siddiqui
更新於 2020 年 8 月 10 日 14:06:37

404 次檢視

在進行資料分析時,有時需要對分組最大值進行子集化,並且此資料框子集用於比較分析。主要目標是將這些最大值彼此之間或與閾值進行比較。在 R 中,我們可以使用 dplyr 包中的 group_by 和 slice 函式找到分組最大值。示例考慮以下資料框 -> x y df head(df, 20) x y 1 S1 1 2 S1 2 3 S1 3 4 S1 4 5 ... 閱讀更多

如何在 R 中使用 ggplot2 時處理警告“已刪除包含缺失值的 n 行”?

Nizamuddin Siddiqui
更新於 2020 年 8 月 10 日 12:16:43

18K+ 次檢視

當我們錯誤地指定 X 軸或 Y 軸的值範圍時,會出現警告“已刪除包含缺失值的 n 行”。我們可以使用 scale_x_continuous(limits=c(?, ?)) 為 x 軸和 scale_y_continuous(limits=c(?, ?)) 為 y 軸在 ggplot 函式中指定此範圍。如果範圍大於實際資料範圍,則不會出現警告,否則,我們將收到有關缺失值數量的警告。示例考慮以下資料框 -> set.seed(2) > x y df library(ggplot2)建立 Y 軸限制範圍為 0 到 5 的繪圖 -> ggplot(df, aes(x, y))+ + geom_point()+ + scale_y_continuous(limits=c(0, 5)) 警告訊息: ... 閱讀更多

如何在 R 中使用 plot 函式將散點圖上的點與平滑線連線?

Nizamuddin Siddiqui
更新於 2020 年 8 月 10 日 14:04:45

268 次檢視

如果分散度很高,則很難將散點圖上的點與平滑線連線起來,但我們可能希望檢視無法僅透過檢視點來理解的平滑度。它還有助於瞭解模型是否為線性模型。我們可以透過使用 plot 函式繪製帶有 loess 的模型來做到這一點。示例考慮以下資料 -> set.seed(3) > x y 模型摘要(模型)呼叫:loess(公式 = y ~ x)觀察次數:10 等效引數數:4.77 殘差標準誤差:8.608 平滑矩陣的跡:5.27(精確)控制 ... 閱讀更多

如何在 R 中找到均值的標準誤差?

Nizamuddin Siddiqui
更新於 2020 年 8 月 10 日 14:03:41

1K+ 次檢視

均值的標準誤差是標準差除以樣本大小的平方根。找到均值標準誤差的最簡單方法是使用公式來查詢其值。示例> set.seed(1)我們將使用相同的公式為正態隨機變數、從 1 到 100 的數字序列、隨機樣本、二項式隨機變數和均勻隨機變數找到標準誤差。最後,我將確認我們是否對我們在這裡考慮的所有型別的變數都使用了正確的方法。> x x [1] -0.6264538 0.1836433 -0.8356286 ... 閱讀更多

如何在 R 中找到矩陣的逆?

Nizamuddin Siddiqui
更新於 2020 年 8 月 10 日 14:02:10

7K+ 次檢視

矩陣的逆可以在 R 中使用 solve 函式計算,大多數情況下,不經常使用 R 的人會錯誤地將 inv 函式用於此目的,但在基礎 R 中沒有名為 inv 的函式來查詢矩陣的逆。示例考慮以下矩陣及其逆 -> M1 M1 M1    [, 1] [, 2] [1, ] 1 3 [2, ] 2 4 > solve(M1) [, 1] [, 2] [1, ] -2 1.5 [2, ] 1 -0.5 > M2 M2 ... 閱讀更多

廣告
© . All rights reserved.