我們為什麼應在 R 中使用 set.seed ?


set.seed 的作用是確保我們對隨機化獲得相同的結果。如果我們在 R 或者任何統計軟體中為任何任務隨機選擇一些觀測值,它將一直產生不同的值,這是由於隨機化的緣故。如果我們想保留第一次隨機選擇產生的值,那麼我們可以將它們儲存在隨機化後的物件中,或者我們可以修復隨機化過程,以便我們一直得到相同的結果。

示例

無 set.seed 的隨機化

> sample(1:10)
[1] 4 10 5 3 1 6 9 2 8 7
> sample(1:10)
[1] 1 4 2 5 8 3 7 9 6 10
> sample(1:10)
[1] 6 3 9 5 10 2 7 1 8 4

這裡我們三次建立了樣本大小為 10 的樣本,而在所有這些樣本中值都是不相同的。

帶有 set.seed 的隨機化

> set.seed(99)
> sample(1:10)
[1] 6 2 10 7 4 5 3 1 8 9
> set.seed(99)
> sample(1:10)
[1] 6 2 10 7 4 5 3 1 8 9
> set.seed(99)
> sample(1:10)
[1] 6 2 10 7 4 5 3 1 8 9

由於我們在所有三個樣本中使用了相同的 set.seed,因此我們獲得了相同的樣本值。

更新於: 2020 年 7 月 6 日

5 千+ 次瀏覽

開啟您的 職業生涯

完成課程以獲得認證

開始
廣告