資料探勘中聚類的例子有哪些?


將一組物理或抽象物件組合成相同物件的類別的過程稱為聚類。聚類是一組資料物件,這些資料物件在同一聚類中彼此相同,並且與其他聚類中的物件不同。在許多應用中,一組資料物件可以被視為一個集體。聚類分析是一項重要的人類活動。

聚類分析用於根據對這些記錄進行的各種度量形成相同記錄的組或聚類。關鍵設計是以對分析目標有用的方式定義聚類。這些資料已在多個領域使用,例如天文學、考古學、醫學、化學、教育、心理學、語言學和社會學。

以下是一些聚類的示例:

生物學 - 生物學家花費數年時間建立了所有生物(如界、門、綱、目、科、屬和種)的分類法(分層分類)。因此,一些早期聚類分析工作試圖建立一種數值分類學科,該學科可以找到這種分類結構也就不足為奇了。

此外,生物學家已使用聚類來分析可訪問的大量遺傳資料。例如,聚類已被用於發現具有相同功能的基因組。

資訊檢索 - 全球資訊網包含數十億個網頁,對搜尋引擎的查詢結果可以恢復數百萬個網頁。聚類可用於將這些搜尋結果分組為幾個聚類,每個聚類都代表查詢的特定方面。

例如,“電影”查詢可以恢復合併到包括評論、預告片、明星和影院等類別的網頁。每個聚類都可以細分為子類別(子聚類),形成支援使用者分析查詢結果的分層結構。

氣候 - 它可以學習地球的氣候,需要發現大氣和海洋中的模式。聚類分析已被用於發現極地地區和對陸地氣候具有重要影響的海洋區域的大氣壓力的模式。

心理學和醫學 - 疾病或病症通常有多種變化,聚類研究可用於識別這些多種亞型。例如,聚類可用於識別幾種型別的抑鬱症。聚類分析還用於識別疾病的空間或時間分配模式。

商業 - 企業收集大量有關現有和潛在使用者的資料。它通常用於將使用者細分為少量團隊,以便進行更多分析和營銷活動。

更新於: 2022年2月14日

4K+ 瀏覽量

開啟您的 職業生涯

透過完成課程獲得認證

開始學習
廣告