- 統計學教程
- 首頁
- 調整後的R平方
- 方差分析
- 算術平均數
- 算術中位數
- 算術眾數
- 算術極差
- 條形圖
- 最佳點估計
- 貝塔分佈
- 二項分佈
- 布萊克-斯科爾斯模型
- 箱線圖
- 中心極限定理
- 切比雪夫定理
- 卡方分佈
- 卡方表
- 環形排列
- 整群抽樣
- 科恩kappa係數
- 組合
- 有放回組合
- 比較圖表
- 連續均勻分佈
- 連續數列算術平均數
- 連續數列算術中位數
- 連續數列算術眾數
- 累計頻率
- 變異係數
- 相關係數
- 累積圖
- 累積泊松分佈
- 資料收集
- 資料收集 - 問卷設計
- 資料收集 - 觀察
- 資料收集 - 案例研究方法
- 資料模式
- 十分位數統計
- 離散數列算術平均數
- 離散數列算術中位數
- 離散數列算術眾數
- 點圖
- 指數分佈
- F分佈
- F檢驗表
- 階乘
- 頻率分佈
- 伽馬分佈
- 幾何平均數
- 幾何機率分佈
- 擬合優度
- 總平均數
- Gumbel分佈
- 調和平均數
- 調和數
- 諧振頻率
- 直方圖
- 超幾何分佈
- 假設檢驗
- 個體數列算術平均數
- 個體數列算術中位數
- 個體數列算術眾數
- 區間估計
- 逆伽馬分佈
- Kolmogorov-Smirnov檢驗
- 峰度
- 拉普拉斯分佈
- 線性迴歸
- 對數伽馬分佈
- 邏輯迴歸
- 麥克尼馬爾檢驗
- 平均偏差
- 均值差異
- 多項分佈
- 負二項分佈
- 正態分佈
- 奇排列和偶排列
- 單比例Z檢驗
- 異常值函式
- 排列
- 有放回排列
- 餅圖
- 泊松分佈
- 合併方差 (r)
- 功效計算器
- 機率
- 機率加法定理
- 機率乘法定理
- 機率貝葉斯定理
- 機率密度函式
- 過程能力 (Cp) 和過程效能 (Pp)
- 過程Sigma
- 二次迴歸方程
- 定性資料與定量資料
- 四分位差
- 經驗法則
- 瑞利分佈
- 迴歸截距置信區間
- 相對標準偏差
- 信度係數
- 必需樣本量
- 殘差分析
- 殘差平方和
- 均方根
- 樣本計劃
- 抽樣方法
- 散點圖
- 夏農-維納多樣性指數
- 信噪比
- 簡單隨機抽樣
- 偏度
- 標準差
- 標準誤 (SE)
- 標準正態分佈表
- 統計顯著性
- 統計公式
- 統計符號
- 莖葉圖
- 分層抽樣
- 學生t檢驗
- 平方和
- t分佈表
- TI-83指數迴歸
- 轉換
- 截尾均值
- I型和II型錯誤
- 方差
- 維恩圖
- 大數弱定律
- Z表
- 統計學有用資源
- 統計學 - 討論
統計學 - 必需樣本量
檢驗的一個關鍵部分是選擇檢驗的度量,即從總體中選擇多少單位來完成研究。對於確定最合適的樣本量,沒有明確的答案或解決方案。關於樣本量的大小存在一些誤解,例如樣本量應為總體的10%或樣本量與總體的大小成正比。但是,如前所述,這些僅僅是誤解。樣本量的大小取決於所研究總體引數的變化以及研究人員所需的估計精度。
關於樣本量的最佳大小的決策可以從兩個角度出發,即主觀和數學角度。
確定樣本量的主觀方法
確定樣本量的數學方法
確定樣本量的主觀方法
樣本量大小的選擇受以下討論的各種因素的影響
總體的性質 - 同質性或異質性的水平會影響樣本量的大小。如果總體在感興趣的特徵方面是同質的,那麼即使是少量樣本也足夠了。但是,如果總體是異質的,那麼需要更大的樣本才能確保足夠的代表性。
被調查者的性質 - 如果被調查者容易獲得且容易接觸,那麼可以從少量樣本中獲得所需的資料。然而,如果被調查者不合作並且預計不回覆率很高,那麼需要更大的樣本。
研究的性質 - 可以使用大型樣本進行一次性研究。如果發生持續性的研究,並且需要進行深入的研究,那麼較小的樣本更合適,因為它易於管理和在較長的時間範圍內保持較小的樣本。
採用的抽樣技術 - 影響樣本量大小的一個重要變數是採用的抽樣方法。首先,非機率方法需要比機率方法更大的樣本。此外,在機率抽樣中,如果使用簡單隨機抽樣,則需要比使用分層抽樣更大的樣本,在分層抽樣中,較小的樣本就足夠了。
製表複雜度 - 在確定樣本量時,研究人員還應該考慮將結果彙總和分析到的類別和組的數量。已經觀察到,要生成的類別越多,樣本量就越大。由於每個類別都應有足夠的代表性,因此需要更大的樣本才能提供對最小類別的可靠度量。
資源可用性 - 研究人員可用的資源和時間會影響樣本量的大小。研究是一項耗時且耗資的任務,例如工具準備、聘用和培訓外勤人員、運輸成本等會佔用大量資源。因此,如果研究人員沒有足夠的時間和資源,他將選擇較小的樣本。
所需的精度和準確度 - 從我們之前的討論中可以清楚地看出,由標準誤差衡量的精度,只有當S.E較小或樣本量較大時才會較高。
此外,要獲得高水平的精度,需要更大的樣本。除了這些主觀努力之外,樣本量也可以用數學方法確定。
確定樣本量的數學方法
在確定樣本量的數學方法中,首先說明所需的估計精度,然後計算樣本量。精度可以指定為真實均值的±1,置信水平為99%。這意味著,如果樣本均值為200,則均值的真實值將在199到201之間。此精度級別由術語“c”表示。
均值的樣本量確定。
總體均值的置信區間由下式給出
${\bar x \pm Z\frac{\sigma_p}{\sqrt N}\ 或\ \bar x \pm e}$
其中 -
${\bar x}$ = 樣本均值
${e}$ = 可接受誤差
${Z}$ = 給定置信水平下標準正態變數的值
${\sigma_p}$ = 總體標準差
${n}$ = 樣本量
可接受誤差'e',即${\mu}$和${\bar x}$之間的差異由下式給出
${Z.\frac{\sigma_p}{\sqrt N}}$
因此,樣本量為
${n = \frac{Z^2{\sigma_p}^2}{e^2}}$
或
如果樣本量相對於總體大小而言很大,則上述公式將透過有限總體乘數進行校正。
${n = \frac{Z^2.N.{\sigma_p}^2}{(N-1)e^2 + Z^2.{\sigma_p}^2}}$
其中 -
${N}$ = 總體大小
比例的樣本量確定
當估計比例時確定樣本量的方法與估計均值的方法相同。總體比例${\hat p}$的置信區間由下式給出
${ p \pm Z. \sqrt{\frac{p.q}{n}}}$
其中 -
${p}$ = 樣本比例
${q = (1 - p)}$
${Z}$ = 樣本比例的標準正態變數的值
${n}$ = 樣本量
由於要估計${ \hat p}$,因此可以透過取p = 0.5(一個可接受的值)來確定p的值,從而得到一個保守的樣本量。另一種選擇是透過試點研究或根據個人判斷來估計p的值。給定p的值,可接受誤差'e'由下式給出
如果總體是有限的,則上述公式將透過有限總體乘數進行校正。
示例
問題陳述
一家購物商店有興趣估計擁有該商店特權會員卡的家庭的比例。以前的研究表明,59% 的家庭擁有該商店的信用卡。在置信水平為 95% 且容許誤差水平為 05 的情況下。
確定進行研究所需的樣本量。
如果目標家庭的數量已知為 1000,樣本量是多少?
解決方案
該商店擁有以下資訊
可以透過應用以下公式確定樣本量
因此,369 戶家庭的樣本足以進行研究。
由於總體,即目標家庭已知為 1000,並且上述樣本是總人口的重要部分,因此使用包含有限總體乘數的校正公式。
因此,如果總體是包含1000戶家庭的有限總體,則進行該研究所需的樣本量為270。
從這個例子可以看出,如果已知總體規模,則確定的樣本量會減小。