ROCK 代表使用連結的魯棒聚類 (Robust Clustering using links)。它是一種層次聚類演算法,分析具有分類屬性的資料的連結概念(兩個物件之間的公共鄰居數量)。它顯示這種距離資料在對分類資訊進行聚類時無法產生高質量的聚類。此外,大多數聚類演算法在聚類時只建立點之間的相似性,即在每一步中,將組合成單個聚類的點。這種“區域性”方法容易出現錯誤。例如,兩個不同的聚類可能有一些靠近的點或異常值;因此,依靠點之間的相似性來…… 閱讀更多
K-means 演算法建立輸入引數 k,並將一組 n 個物件劃分為 k 個聚類,以便生成的類內相似性很大,但類間相似性很低。聚類相似性是根據聚類中物件的平均值計算的,這可以看作是聚類的質心或重心。K-means 演算法如下所示。首先,它可以隨機選擇 k 個物件,每個物件最初定義一個聚類均值或中心。對於其餘每個物件,建立一個物件到它所屬的聚類…… 閱讀更多
廣義線性模型定義了線性迴歸可用於對分類響應變數建模的理論基礎。在廣義線性模型中,響應變數 y 的方差是 y 的均值的函式,這與線性迴歸不同,線上性迴歸中,y 的方差是常數。廣義線性模型 (GLM) 是傳統線性模型的擴充套件。該演算法透過最大化對數似然函式來擬合資訊中的廣義線性模型。彈性網路懲罰可用於引數正則化。模型擬合計算是並行的,非常快,並且對於具有……的模型來說非常有效地擴充套件 閱讀更多