樸素貝葉斯分類器的特點是什麼?
貝葉斯分類器是統計分類器。它可以預測類成員機率,例如給定樣本應用於特定類的機率。當貝葉斯分類器可以擁有大型資料庫時,它也顯示出較高的效率和速度。
由於類已定義,因此係統必須推斷出監督分類的規則,因此係統必須能夠發現每個類的描述。這些描述必須定義訓練集的預測屬性,以便只有正例項必須滿足描述,而不是負例項。如果規則的描述涵蓋所有正例,並且沒有覆蓋類的任何負例,則稱該規則是正確的。
它假設所有屬性的貢獻都是獨立的,並且每個屬性對分類問題都有同等貢獻,這是一種稱為樸素貝葉斯分類的簡單分類方案。
樸素貝葉斯分類之所以稱為樸素,是因為它假設類條件獨立性。給定類上屬性值的實現與多個屬性的值無關。做出此假設是為了降低計算成本,因此被視為樸素。
存在多種演算法可以根據給定的可觀察變數的訓練記錄來理解網路拓撲。問題是離散最佳化。人類專業人員通常對影響分析領域中的直接條件依賴性有很好的把握,這有助於網路設計。專家應為在直接依賴性中執行的節點定義條件機率。
這些機率可用於評估其餘機率值。如果網路拓撲已知且變數可觀察,則訓練網路很簡單。它包括計算 CPT 條目,這與在評估樸素貝葉斯分類中包含的機率時完成的操作類似。
樸素貝葉斯分類器有各種特點,如下所示:
它們對孤立的噪聲點具有魯棒性,因為在從資料估計條件機率時,這些點會被平均掉。它還可以透過在模型構建和分類期間刪除例項來管理缺失值。
它們對無關屬性具有魯棒性。如果 Xi 是一個不合適的屬性,則 P (Xi|Y) 變得一致分佈。Xi 的類條件機率對後驗機率的完整計算沒有影響。
相關屬性會降低樸素貝葉斯分類器的效能,因為條件獨立性假設不再適用於此類屬性。例如,考慮以下機率:
P (A=0|Y=0) =0.4, P (A=1 | Y=0) =0.6,
P (A=0|Y = 1) = 0.6, P (A= 1 | Y =1) = 0.4,
其中 A 是一個二元屬性,Y 是一個二元類變數。假設還有另一個二元屬性 B,當 Y = 0 時與 A 完全相關,但當 Y = 1 時與 A 無關。為了完整起見,考慮 B 的類條件機率與 A 相同。
資料結構
網路
關係資料庫管理系統
作業系統
Java
iOS
HTML
CSS
Android
Python
C 語言程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP