什麼是SOM?


SOM代表自組織特徵對映。它是一種基於神經網路觀點的聚類和資料視覺化方法。SOM的目標是發現一組質心(在SOM術語中稱為參考向量)並將資料集中的每個物件對映到最支援該物件接近度的質心。在神經網路方法中,每個質心都對應一個神經元。

與增量K均值演算法類似,資料物件被逐個處理,最近的質心會被更新。與K均值演算法不同的是,SOM在質心上施加了一個拓撲排序,並且附近的質心也會被更新。此外,SOM不會跟蹤物件的最近聚類成員關係,並且與K均值演算法不同,如果一個物件切換聚類,則不會對舊的聚類質心進行特定更新。

舊的聚類可能位於新聚類的鄰域,因此可能會因此被更新。點的處理持續到達到某個預先確定的限制或質心不再發生太大變化為止。SOM方法的最終輸出是一組隱式表示聚類的質心。每個聚類包含最接近特定質心的點。

每個質心都生成一對座標(i, j)。有時,這種網路會用相鄰節點之間的連線繪製出來,但這可能會產生誤導,因為一個質心對另一個質心的影響是一個用座標表示的鄰域,而不是連線。有幾種型別的SOM神經網路,但我們可以將討論限制在具有矩形或六邊形質心組織的二維SOM上。

SOM中使用的質心具有預先確定的拓撲排序關係。在訓練過程中,SOM需要每個資料點來更新最近的質心以及在拓撲排序中附近的質心。透過這種方式,SOM為任何給定的資料集生成一個有序的質心集。

換句話說,在SOM網格中彼此靠近的質心比距離較遠的質心彼此更密切相關。由於此約束,二維SOM的質心可以被認為位於一個二維曲面上,該曲面試圖儘可能地擬合n維資料。

更新於: 2022年2月14日

237 次瀏覽

開啟你的 職業生涯

透過完成課程獲得認證

立即開始
廣告

© . All rights reserved.