什麼是假設檢驗?
假設檢驗是將資料整合到公司決策過程的最簡單方法。假設檢驗的目的是證實或反駁預先設定的想法,它是幾乎所有資料探勘工作的組成部分。
資料探勘人員在方法之間來回切換,首先為觀察到的行為想出可能的描述,並讓這些假設決定要計算的資料。
假設檢驗是科學家和統計學家傳統上終生都在做的事情。假設是一種提出的解釋,其有效性可以透過分析資料來檢驗。此類資訊可以透過觀察輕鬆收集,或透過實驗(包括測試郵件)建立。
當假設檢驗揭示出一直指導組織在行業領域行動的假設是錯誤時,它最有價值。例如,假設一個組織的廣告依賴於關於產品或服務的目標市場以及響應特徵的幾個假設。值得檢驗這些假設是否得到實際響應的支援。
一種方法是在不同的廣告中使用不同的呼入號碼,並記錄每個回覆者撥打的號碼。然後可以將通話過程中收集的資訊與廣告旨在覆蓋的人群特徵進行比較。
產生假設的關鍵是從整個組織以及在適當情況下從組織外部獲取不同的輸入。通常,啟動想法流動所需的一切只是一個明確的問題陳述——尤其是在它以前從未被識別為問題的情況下。
問題未被識別的情況比人們想象的要多,因為它們沒有被用於評估組織績效的指標所捕獲。
如果一個組織一直根據每個月產生的多次新銷售來計算其銷售隊伍,那麼銷售人員可能從未認真考慮過新使用者保持活躍的時間或他們在與組織建立關聯期間花費了多少錢的問題。
假設檢驗當然有用,但總有它不足的時候。本書其餘部分中描述的資料探勘技術都是為了透過基於資料建立模型來學習新事物而設計的。
從最一般的意義上講,模型是對事物如何運作的解釋或描述,它能夠很好地反映現實,因此可用於對現實世界進行推斷。
廣告