什麼是網路挖掘的型別?


網路挖掘定義了使用資料探勘技術從網路資料中提取有益模式、趨勢和資料的過程,通常藉助於網路,處理來自基於網路的記錄和服務、伺服器日誌和超連結的資料。網路挖掘的主要目標是透過收集和分析資料來發現網路資料中的模式,從而獲得重要的見解。

網路挖掘可以被廣泛地視為將改進後的資料探勘方法應用於網路,而資料探勘則表示為應用演算法在一個知識發現過程中,在主要結構化的資料中尋找模式。

網路挖掘具有支援多個數據型別集合的獨特屬性。網路具有多個方面,為挖掘過程提供了多種方法,例如包含文字的網頁、透過超連結連線的網頁以及可以透過網路伺服器日誌監控的使用者活動。

網路挖掘有多種型別,如下所示:

網路內容挖掘 - 網路內容挖掘是網路挖掘的一種過程,它從網站 (WWW) 中提取重要的描述性資料。內容包括音訊、影片、文字文件、超連結和結構化記錄。網路內容旨在以文字、列表、影像、影片和表格的形式向用戶提供記錄。

內容挖掘的功能是資料提取,其中結構化資料是從非結構化網站複製的。目標是透過利用提取的結構化資料,支援對多個網站的資料聚合。

網路結構挖掘 - 網路結構挖掘是網路挖掘的核心技術之一,它處理超連結結構。結構挖掘本質上顯示了網站的結構化摘要。它識別網站中連結網頁之間的關係。

網路挖掘只是從網路挖掘資訊的資料探勘。有幾種演算法技術用於從網路查詢資料。結構挖掘分析網站的超連結以彙集資訊記錄並將其分類為相似性和關係等元素。頁面內挖掘是在文件級別實現的一種挖掘型別,而超連結級別挖掘稱為頁面間挖掘。

網路使用挖掘 - 網路使用挖掘用於從 Web 日誌資料中提取有用的記錄、資訊、知識,並有助於識別使用者對網頁的訪問模式。

在挖掘中,對 Web 資源的使用,個人會考慮網站訪問者的請求記錄,這些記錄通常作為 Web 伺服器日誌收集。雖然網頁集的內容和架構遵循網頁作者的意圖,但單個請求顯示了使用者如何檢視這些網頁。網路使用挖掘可能會揭示網頁建立者未提出的關係。

更新於:2022年2月15日

8K+ 瀏覽量

啟動您的職業生涯

完成課程獲得認證

開始學習
廣告
© . All rights reserved.