統計學 - 簡單隨機抽樣



簡單隨機樣本的定義是總體中的每個元素都有相同且獨立的機會被選中。對於具有N個單元的總體,選擇n個樣本單元的機率,所有可能的NCn個樣本組合的機率由1/NCn給出,例如,如果我們有一個包含五個元素(A、B、C、D、E)的總體,即N=5,並且我們想要一個大小為n=3的樣本,那麼就有5C3=10個可能的樣本,任何單個單元成為樣本成員的機率為1/10。

簡單隨機抽樣可以透過兩種不同的方式進行,即“有放回”或“無放回”。當單元被連續選入樣本中,並在下一次抽取之前替換選中的單元時,這稱為有放回的簡單隨機樣本。如果選定的單元在下一次抽取之前沒有被替換,並且連續單元的抽取僅從總體中剩餘的單元中進行,則這稱為無放回的簡單隨機樣本。因此,在前一種方法中,一旦選定的單元可以重複出現,而在後一種方法中,一旦選定的單元不會重複出現。由於無放回的簡單隨機樣本具有更高的統計效率,因此它是首選方法。

簡單隨機樣本可以透過兩種程式中的任何一種進行抽取,即透過抽籤法或透過隨機數表。

  • 抽籤法 - 在這種方法下,單元是根據隨機抽取來選擇的。首先,總體的每個成員或元素都被分配一個唯一的數字。下一步,這些數字寫在形狀、大小、顏色等方面都相同的卡片上。然後將它們放入籃子中並徹底混合。最後一步是隨機取出紙條,而不看它們。抽取的紙條數量等於所需的樣本量。

    抽籤法有一些缺點。書寫N個數字的紙條的過程很麻煩,並且當總體規模非常大時,洗牌大量的紙條很困難。此外,在選擇紙條時可能會出現人為偏差。因此,可以使用另一種方法,即隨機數。

  • 隨機數表法 - 這些由已隨機生成的數字列組成。有許多隨機數表可用,例如Fisher和Yates表、Tippets隨機數等。下面是從Fisher & Yates表中提取的一系列兩位數隨機數

    61, 44, 65, 22, 01, 67, 76, 23, 57, 58, 54, 11, 33, 86, 07, 26, 75, 76, 64, 22, 19, 35, 74, 49, 86, 58, 69, 52, 27, 34, 91, 25, 34, 67, 76, 73, 27, 16, 53, 18, 19, 69, 32, 52, 38, 72, 38, 64, 81, 79 和 38。

    第一步是為總體的每個成員分配一個唯一的數字,例如,如果總體包含20個人,那麼所有個體都編號為01到20。如果我們要收集5個單元的樣本,那麼參考隨機數表選擇5個兩位數。例如,使用上面的表,具有以下五個數字的單元將構成一個樣本:01、11、07、19和16。如果抽樣是無放回的,並且某個隨機數重複出現,則它將不會再次被取,並且將選擇下一個符合我們標準的數字。

因此,可以使用兩種程式中的任何一種來繪製簡單隨機樣本。然而,在實踐中,人們已經發現簡單隨機樣本需要大量的時間和精力,而且不切實際。

廣告
© . All rights reserved.