SVM 的特徵是什麼?


支援向量機(SVM)是一種分類方法,受到了廣泛的關注。這種方法源於統計學習理論,並在許多實際應用中表現出了良好的經驗結果,從手寫數字識別到文字分類。

SVM 還可以處理高維資料,並避免維度災難問題。這種方法的第二個要素是它使用訓練例項的一個子集來定義決策邊界,稱為支援向量。

SVM 可以被訓練為明確地檢視線性可分資料中的這種型別的超平面。可以透過展示如何將 SVM 方法擴充套件到非線性可分資料來實現。資料集是線性可分的;即,它可以發現一個超平面,包括所有位於超平面一側的正方形和所有位於另一側的圓形。

線性模型的容量與其邊際成反比。具有小邊際的模型具有更大的容量,因為它們是動態的並且可以擬合一些訓練集,這與具有大邊際的模型不同。根據 SRM 原則,隨著容量的增加,泛化誤差界限可能會增加。因此,期望建立最大化其決策邊界邊際的線性分類器,以確保其最壞情況下的泛化誤差減少。

線性 SVM 是一種分類器,它尋找具有最大邊際的超平面,稱為最大邊際分類器。它可以學習 SVM 如何學習這樣的邊界,它可以從對線性分類器的決策邊界和邊際的一些初步分析開始。

SVM 有多種特徵,如下所示:

SVM 學習問題可以被組織成一個凸最佳化問題,其中可以使用有效的演算法來找到目標函式的全域性最小值。存在不同的分類方法,包括基於規則的分類器和人工神經網路,它們採用基於貪婪的方法來搜尋假設空間。這些方法導致僅找到區域性最優解。

SVM 透過擴大決策邊界的邊際來實現容量控制。使用者應提供幾個引數,包括要使用的核心函式型別和用於提供每個鬆弛變數的成本函式 C。

SVM 可以透過為資料中顯示的每個分類屬性值學習虛擬變數來用於分類記錄。例如,如果婚姻狀況有三個值,例如單身、已婚、離婚,那麼它可以為每個屬性值學習一個二元變數。

更新於: 2022年2月11日

1K+ 瀏覽量

開啟你的 職業生涯

透過完成課程獲得認證

開始學習
廣告

© . All rights reserved.