基於統計的演算法有哪些型別?


基於統計的演算法主要有兩種型別,如下所示:

  • 迴歸 - 迴歸問題涉及根據輸入值評估輸出值。當用於分類時,輸入值是來自資料庫的值,輸出值定義類別。迴歸可以用來闡明分類問題,但它也用於其他應用,包括預測。迴歸的基本形式是簡單線性迴歸,它只包含一個預測變數和一個預測值。

    迴歸可以透過兩種不同的方法來實現分類,如下所示:

    • 劃分 - 資料根據類別劃分為不同的區域。

    • 預測 - 建立公式來預測輸出類別的值。

  • 貝葉斯分類 - 統計分類器用於分類。貝葉斯分類基於貝葉斯定理。貝葉斯分類器在應用於大型資料庫時,具有較高的效率和速度。

    貝葉斯定理 - 令 X 為一個數據元組。在貝葉斯方法中,X 被視為“證據”。令 H 為某個假設,包括資料元組 X 屬於特定類別 C。機率 P (H|X) 用於定義資料。此機率 P (H|X) 是在給定“證據”或觀察到的資料元組 X 的情況下,假設 H 成立的機率。

    P (H|X) 是 H 在給定 X 條件下的後驗機率。例如,假設資料元組的特徵僅限於由屬性年齡和收入定義的使用者,並且 X 是一個 30 歲的使用者,收入為 20,000 元。假設 H 是使用者將購買電腦的假設。因此,P (H|X) 反映了在知道使用者年齡和收入的情況下,使用者 X 將購買電腦的機率。

    P (H) 是 H 的先驗機率。例如,這是任何給定使用者購買電腦的機率,無論年齡、收入或其他任何資料。後驗機率 P (H|X) 基於比先驗機率 P (H) 更多的資訊,P (H) 不依賴於 X。

    同樣,P (X|H) 是 X 在給定 H 條件下的後驗機率。它是使用者 X 年齡為 30 歲且收入為 20,000 元的機率。

    P (H)、P (X|H) 和 P (X) 可以從給定的資訊中測量。貝葉斯定理提供了一種從 P (H)、P (X|H) 和 P(X) 計算後驗機率 P (H|X) 的方法。它由以下公式給出:

$$P(H|X)=\frac{P(X|H)P(H)}{P(X)}$$

更新於: 2021年11月22日

8K+ 次瀏覽

開啟您的 職業生涯

透過完成課程獲得認證

立即開始
廣告