資料探勘 - 術語



資料探勘

資料探勘定義為從海量資料中提取資訊。換句話說,資料探勘就是從資料中挖掘知識。這些資訊可用於以下任何應用:

  • 市場分析
  • 欺詐檢測
  • 客戶保留
  • 生產控制
  • 科學探索

資料探勘引擎

資料探勘引擎對於資料探勘系統至關重要。它由一組功能模組組成,執行以下功能:

  • 特徵描述
  • 關聯和相關性分析
  • 分類
  • 預測
  • 聚類分析
  • 離群值分析
  • 演變分析

知識庫

這是領域知識。此知識用於指導搜尋或評估所得模式的趣味性。

知識發現

一些人將資料探勘與知識發現等同起來,而另一些人則將資料探勘視為知識發現過程中的一個重要步驟。以下是知識發現過程涉及的步驟:

  • 資料清洗
  • 資料整合
  • 資料選擇
  • 資料轉換
  • 資料探勘
  • 模式評估
  • 知識呈現

使用者介面

使用者介面是資料探勘系統的一個模組,它有助於使用者與資料探勘系統之間的通訊。使用者介面允許以下功能:

  • 透過指定資料探勘查詢任務與系統互動。
  • 提供資訊以幫助集中搜索。
  • 基於中間資料探勘結果進行挖掘。
  • 瀏覽資料庫和資料倉庫模式或資料結構。
  • 評估挖掘的模式。
  • 以不同的形式視覺化模式。

資料整合

資料整合是一種資料預處理技術,它將來自多個異構資料來源的資料合併到一個一致的資料儲存中。資料整合可能涉及不一致的資料,因此需要資料清洗。

資料清洗

資料清洗是一種用於去除噪聲資料和糾正資料中不一致性的技術。資料清洗涉及轉換以糾正錯誤資料。資料清洗是在準備資料倉庫資料的過程中作為資料預處理步驟執行的。

資料選擇

資料選擇是從資料庫中檢索與分析任務相關的資料的過程。有時在資料選擇過程之前會執行資料轉換和整合。

叢集

叢集是指一組類似的物件。聚類分析是指形成彼此非常相似但與其他叢集中的物件大相徑庭的物件組。

資料轉換

在此步驟中,透過執行彙總或聚合操作,將資料轉換為或整合為適合挖掘的形式。

廣告
© . All rights reserved.