機器學習中的假設是什麼?


在機器學習和資料科學專案中,假設是一個經常使用的詞。眾所周知,機器學習是世界上最強大的技術之一,它使我們能夠根據過去的經驗來預測結果。此外,資料科學家和機器學習專家進行實驗的目的是為了解決問題。這些機器學習專家和資料科學家會對如何解決問題做出初步的猜測。

假設

什麼是假設?

假設是一種基於不充分事實或假設的猜想或提出的解釋。它僅僅是基於某些已知事實的推測,這些事實尚未得到證實。一個好的假設是經過檢驗的,並且會產生真或假的結果。

讓我們來看一個例子,以便更好地理解假設。一些科學家認為,紫外線 (UV) 光會損害眼睛並導致失明。

在這種情況下,科學家只是說紫外線對眼睛有害,但人們推測它會導致失明。然而,這可能是無法實現的。因此,這類假設被稱為假設。

在機器學習中定義假設

在機器學習中,假設是一個數學函式或模型,它將輸入資料轉換為輸出預測。模型的最初信念或解釋是基於提供的證據。假設通常表示為一組描述模型行為的引數。

如果我們正在構建一個模型來預測房產的價格,基於其大小和位置。假設函式可能如下所示:

$$\mathrm{h(x)\:=\:θ0\:+\:θ1\:*\:x1\:+\:θ2\:*\:x2}$$

假設函式是 h(x),其輸入資料是 x,模型的引數是 θ0、θ1 和 θ2,特徵是 x1 和 x2。

機器學習模型的目的是找到引數 θ0 到 θ2 的最佳值,以最大限度地減少預測輸出標籤和實際輸出標籤之間的差異。

換句話說,我們正在尋找最能代表輸入和輸出資料之間潛在關係的假設函式。

機器學習中假設的型別

確定問題並獲得證據後,下一步是建立假設。假設是對基於不足資料的問題的解釋或解決方案。它作為進一步調查和實驗的跳板。假設是機器學習函式,它根據某些假設將輸入轉換為輸出。一個好的假設有助於建立準確有效的機器學習模型。一些機器學習假設如下:

1. 零假設

零假設是一個基本假設,它指出自變數和因變數之間不存在關係。換句話說,它假設自變數對因變數沒有影響。它用符號 H0 表示。如果 p 值落在顯著性水平之外 (α),則通常拒絕零假設。如果零假設成立,則確定係數是拒絕它的機率。零假設涉及到 t 檢驗和方差分析等檢驗結果。

2. 備擇假設

備擇假設是與零假設相矛盾的假設。它假設自變數和因變數之間存在關係。換句話說,它假設自變數對因變數有影響。它用 Ha 表示。如果 p 值小於顯著性水平 (α),則通常接受備擇假設。備擇假設也稱為研究假設。

3. 單尾假設

單尾檢驗是一種顯著性檢驗,其中拒絕域位於樣本分佈的一端。它表示估計的檢驗引數大於或小於臨界值,這意味著應該接受備擇假設而不是零假設。它最常用於卡方分佈,其中所有與之相關的臨界區域都放在兩個尾部中的一個。

4. 雙尾假設

雙尾檢驗是一種假設檢驗,其中拒絕域或臨界區域位於正態分佈的兩端。它確定被測樣本是否落在某個值的範圍內,如果計算值落在機率分佈的兩個尾部中的任何一個,則接受備擇假設。α 被分成兩個相等的部分,並且估計引數高於或低於假設引數,因此極值作為反對零假設的證據。

總的來說,假設在機器學習模型中起著至關重要的作用。它為模型做出預測提供了起點,並有助於指導學習過程。假設的準確性使用各種指標進行評估,例如均方誤差或準確率。

結論

假設是一個數學函式或模型,它將輸入資料轉換為輸出預測,通常表示為一組描述模型行為的引數。它是基於不足資料對問題的解釋或解決方案。一個好的假設有助於建立準確有效的機器學習模型。當沒有預先知識或理論依據來推斷聯絡的特定方向時,使用雙尾假設。

更新於:2024年10月21日

8K+ 次瀏覽

啟動您的職業生涯

完成課程後獲得認證

開始學習
廣告