什麼是資料探勘圖和網路?


圖定義了一類比集合、序列、格和樹更通用的機制。在網際網路和社交網路、資料網路、生物網路、生物資訊學、化學資訊學、計算機視覺以及多媒體和內容檢索等方面,有著廣泛的圖應用。挖掘圖和網路的應用如下:

圖模式挖掘 - 它是在一個或一組圖中挖掘頻繁子圖。挖掘圖模式的方法多種多樣,可以分為基於 Apriori 的方法和基於模式增長的方法。

它可以挖掘閉合圖的集合,如果不存在合適的超圖 g' 產生與 g 相同的支援計數,則圖 g 是閉合的。此外,還有幾種變體圖模式,例如近似頻繁圖、連貫圖和密集圖。使用者定義的約束可以深入到圖模式挖掘階段以提高挖掘效率。

網路的統計建模 - 網路包括一組節點,每個節點等價於與一組屬性相關的物件,以及一組連線這些節點的邊(或連結),描述物件之間的關係。

如果某些節點和連結屬於相同的型別,則網路是同質的,包括朋友網路、合著者網路或網際網路頁面網路。如果節點和連線屬於不同的型別,則網路是異質的,包括出版物網路(連線作者、會議、論文和文字)和醫療保健網路(連線醫生、護士、患者、疾病和治療方法)。

透過資訊網路分析進行資料清洗、整合和驗證 - 在大型網路中相互關聯的資料的多個元素之間可能存在資訊冗餘。可以透過分析此類網路中的資訊冗餘,利用網路分析實現高質量的資料清洗、資料整合、資料驗證和可信度搜索。

圖和同質網路的聚類和分類 - 已經開發出基於大型網路的聚類分析方法,以揭示網路機制、查詢隱藏的社群、中心節點和異常值,具體取決於網路拓撲機制及其相關屬性。已經開發了幾種型別的網路聚類方法,可以將其歸類為分割槽、層次或基於密度的演算法。

異質網路的聚類、排序和分類 - 異質網路包括多個型別的互連節點和連線。此類互連機制包含豐富的資料,可用於相互改進節點和連結,並將觀察結果從一種型別傳播到另一種型別。

此類異質網路的聚類和排序可以緊密結合在上下文中實現,其中聚類中排名靠前的節點在計算聚類凝聚力時比其排名較低的對應節點貢獻更多。

更新時間:2022年2月18日

2K+ 瀏覽量

開啟你的 職業生涯

透過完成課程獲得認證

立即開始
廣告

© . All rights reserved.