貝葉斯信念網路是如何學習的?


貝葉斯分類器是統計分類器。它們可以預測類成員機率,包括給定樣本屬於特定類的機率。貝葉斯分類器在處理大型資料庫時也表現出很高的效率和速度。

一旦定義了類,系統應該推斷出控制分類的規則,因此係統應該能夠找到每個類的描述。這些描述僅應參考訓練集的預測屬性,以便只有正例應該滿足描述,而不是負例。如果規則的描述涵蓋了所有正例,並且沒有覆蓋任何負例,則稱該規則是正確的。

它假設所有屬性的貢獻都是獨立的,並且每個屬性對分類問題都貢獻相同,這是一種稱為樸素貝葉斯分類的簡單分類方案。透過分析每個“獨立”屬性的貢獻,確定條件機率。透過將多個屬性對預測的影響結合起來,進行分類。

樸素貝葉斯分類之所以被稱為樸素,是因為它假設類條件獨立性。屬性值對給定類的影響獨立於其他屬性的值。做出這個假設是為了降低計算成本,因此被認為是“樸素”的。

在信念網路的學習或訓練中,有多種情況可能發生。網路拓撲可以預先給出或從資訊中推斷出來。網路變數在某些訓練元組中可以是可觀察的或私有的。隱藏資料的方法定義為缺失值或不完整資訊。

存在多種演算法可以從給定的可觀察變數的訓練記錄中理解網路拓撲。問題是離散最佳化。人類專業人員通常對影響分析領域中的直接條件依賴性有很好的理解,這有助於網路設計。專家應該為執行直接依賴性的節點定義條件機率。

這些機率可用於評估其餘機率值。如果網路拓撲已知並且變數是可觀察的,則訓練網路很簡單。它包括計算 CPT 條目,這與計算樸素貝葉斯分類中涉及的機率時所做的方法類似。

當網路拓撲給出並且幾個變數被隱藏時,有多種方法可以選擇訓練信念網路。它可以定義一種有希望的梯度下降方法。對於那些沒有高階數值背景的人來說,這個定義可能看起來相當嚇人,因為它包含了充滿微積分的公式。

更新於: 2022年2月16日

314 次瀏覽

開啟你的 職業生涯

透過完成課程獲得認證

開始學習
廣告

© . All rights reserved.