統計學 - 必需樣本量



檢驗的一個關鍵部分是選擇檢驗的度量,即從總體中選擇多少單位來完成研究。對於確定最合適的樣本量,沒有明確的答案或解決方案。關於樣本量的大小存在一些誤解,例如樣本量應為總體的10%或樣本量與總體的大小成正比。但是,如前所述,這些僅僅是誤解。樣本量的大小取決於所研究總體引數的變化以及研究人員所需的估計精度。

關於樣本量的最佳大小的決策可以從兩個角度出發,即主觀和數學角度。

  1. 確定樣本量的主觀方法

  2. 確定樣本量的數學方法

確定樣本量的主觀方法

樣本量大小的選擇受以下討論的各種因素的影響

  • 總體的性質 - 同質性或異質性的水平會影響樣本量的大小。如果總體在感興趣的特徵方面是同質的,那麼即使是少量樣本也足夠了。但是,如果總體是異質的,那麼需要更大的樣本才能確保足夠的代表性。

  • 被調查者的性質 - 如果被調查者容易獲得且容易接觸,那麼可以從少量樣本中獲得所需的資料。然而,如果被調查者不合作並且預計不回覆率很高,那麼需要更大的樣本。

  • 研究的性質 - 可以使用大型樣本進行一次性研究。如果發生持續性的研究,並且需要進行深入的研究,那麼較小的樣本更合適,因為它易於管理和在較長的時間範圍內保持較小的樣本。

  • 採用的抽樣技術 - 影響樣本量大小的一個重要變數是採用的抽樣方法。首先,非機率方法需要比機率方法更大的樣本。此外,在機率抽樣中,如果使用簡單隨機抽樣,則需要比使用分層抽樣更大的樣本,在分層抽樣中,較小的樣本就足夠了。

  • 製表複雜度 - 在確定樣本量時,研究人員還應該考慮將結果彙總和分析到的類別和組的數量。已經觀察到,要生成的類別越多,樣本量就越大。由於每個類別都應有足夠的代表性,因此需要更大的樣本才能提供對最小類別的可靠度量。

  • 資源可用性 - 研究人員可用的資源和時間會影響樣本量的大小。研究是一項耗時且耗資的任務,例如工具準備、聘用和培訓外勤人員、運輸成本等會佔用大量資源。因此,如果研究人員沒有足夠的時間和資源,他將選擇較小的樣本。

  • 所需的精度和準確度 - 從我們之前的討論中可以清楚地看出,由標準誤差衡量的精度,只有當S.E較小或樣本量較大時才會較高。

此外,要獲得高水平的精度,需要更大的樣本。除了這些主觀努力之外,樣本量也可以用數學方法確定。

確定樣本量的數學方法

在確定樣本量的數學方法中,首先說明所需的估計精度,然後計算樣本量。精度可以指定為真實均值的±1,置信水平為99%。這意味著,如果樣本均值為200,則均值的真實值將在199到201之間。此精度級別由術語“c”表示。

均值的樣本量確定。

總體均值的置信區間由下式給出

${\bar x \pm Z\frac{\sigma_p}{\sqrt N}\ 或\ \bar x \pm e}$

其中 -

  • ${\bar x}$ = 樣本均值

  • ${e}$ = 可接受誤差

  • ${Z}$ = 給定置信水平下標準正態變數的值

  • ${\sigma_p}$ = 總體標準差

  • ${n}$ = 樣本量

可接受誤差'e',即${\mu}$和${\bar x}$之間的差異由下式給出

${Z.\frac{\sigma_p}{\sqrt N}}$

因此,樣本量為

${n = \frac{Z^2{\sigma_p}^2}{e^2}}$

如果樣本量相對於總體大小而言很大,則上述公式將透過有限總體乘數進行校正。

${n = \frac{Z^2.N.{\sigma_p}^2}{(N-1)e^2 + Z^2.{\sigma_p}^2}}$

其中 -

  • ${N}$ = 總體大小

比例的樣本量確定

當估計比例時確定樣本量的方法與估計均值的方法相同。總體比例${\hat p}$的置信區間由下式給出

${ p \pm Z. \sqrt{\frac{p.q}{n}}}$

其中 -

  • ${p}$ = 樣本比例

  • ${q = (1 - p)}$

  • ${Z}$ = 樣本比例的標準正態變數的值

  • ${n}$ = 樣本量

由於要估計${ \hat p}$,因此可以透過取p = 0.5(一個可接受的值)來確定p的值,從而得到一個保守的樣本量。另一種選擇是透過試點研究或根據個人判斷來估計p的值。給定p的值,可接受誤差'e'由下式給出

${ e= Z. \sqrt{\frac{p.q}{n}} \\[7pt] e^2 = Z^2\frac{p.q}{n} \\[7pt] n = \frac{Z^2.p.q}{e^2}}$

如果總體是有限的,則上述公式將透過有限總體乘數進行校正。

${n = \frac{Z^2.p.q.N}{e^2(N-1) + Z^2.p.q}}$

示例

問題陳述

一家購物商店有興趣估計擁有該商店特權會員卡的家庭的比例。以前的研究表明,59% 的家庭擁有該商店的信用卡。在置信水平為 95% 且容許誤差水平為 05 的情況下。

  1. 確定進行研究所需的樣本量。

  2. 如果目標家庭的數量已知為 1000,樣本量是多少?

解決方案

該商店擁有以下資訊

${ p = .59 \\[7pt] \Rightarrow q = (1-p) = (1-.59) =.41 \\[7pt] CL = .95 \\[7pt] 並且CL為.95的Z標準變數為1.96 \\[7pt] e = \pm .05 }$

可以透過應用以下公式確定樣本量

${n = \frac{Z^2.p.q}{e^2}}$
${n = \frac{(1.96)^2.(.59).(.41)}{(.05)^2} \\[7pt] = \frac{.9226}{.0025} \\[7pt] = 369 }$

因此,369 戶家庭的樣本足以進行研究。

由於總體,即目標家庭已知為 1000,並且上述樣本是總人口的重要部分,因此使用包含有限總體乘數的校正公式。

${n = \frac{Z^2.p.q.N}{e^2(N-1) + Z^2.p.q} \\[7pt] = \frac{(1.96)^2.(.59).(.41).(1000)}{(.05)^2 \times 999 + (1.96)^2(.59)(.41)} \\[7pt] = \frac{922.6}{2.497 + .922} \\[7pt] = 270 }$

因此,如果總體是包含1000戶家庭的有限總體,則進行該研究所需的樣本量為270。

從這個例子可以看出,如果已知總體規模,則確定的樣本量會減小。

廣告

© . All rights reserved.