資料探勘 - 系統



存在各種各樣的資料探勘系統。資料探勘系統可以整合以下技術:

  • 空間資料分析
  • 資訊檢索
  • 模式識別
  • 影像分析
  • 訊號處理
  • 計算機圖形學
  • Web技術
  • 商業
  • 生物資訊學

資料探勘系統分類

資料探勘系統可以根據以下標準進行分類:

  • 資料庫技術
  • 統計學
  • 機器學習
  • 資訊科學
  • 視覺化
  • 其他學科
Data Mining Systems

除此之外,資料探勘系統還可以根據(a)挖掘的資料庫型別,(b)挖掘的知識型別,(c)使用的技術以及(d)應用的應用進行分類。

基於挖掘的資料庫的分類

我們可以根據挖掘的資料庫型別對資料探勘系統進行分類。資料庫系統可以根據不同的標準進行分類,例如資料模型、資料型別等,資料探勘系統可以相應地進行分類。

例如,如果我們根據資料模型對資料庫進行分類,那麼我們可能會有關係型、事務型、物件關係型或資料倉庫挖掘系統。

基於挖掘的知識型別的分類

我們可以根據挖掘的知識型別對資料探勘系統進行分類。這意味著資料探勘系統是基於以下功能進行分類的:

  • 特徵描述
  • 區分
  • 關聯和相關性分析
  • 分類
  • 預測
  • 異常值分析
  • 演變分析

基於所用技術的分類

我們可以根據使用的技術型別對資料探勘系統進行分類。我們可以根據所涉及的使用者互動程度或所採用的分析方法來描述這些技術。

基於所應用的應用程式的分類

我們可以根據所應用的應用程式對資料探勘系統進行分類。這些應用程式如下:

  • 金融
  • 電信
  • DNA
  • 股票市場
  • 電子郵件

將資料探勘系統與DB/DW系統整合

如果資料探勘系統沒有與資料庫或資料倉庫系統整合,那麼將沒有系統可以進行通訊。這種方案被稱為非耦合方案。在這種方案中,主要關注的是資料探勘設計以及為挖掘可用資料集而開發高效有效的演算法。

整合方案列表如下:

  • 無耦合 - 在此方案中,資料探勘系統不使用任何資料庫或資料倉庫功能。它從特定來源獲取資料,並使用一些資料探勘演算法來處理這些資料。資料探勘結果儲存在另一個檔案中。

  • 松耦合 - 在此方案中,資料探勘系統可以使用資料庫和資料倉庫系統的一些功能。它從這些系統管理的資料儲存庫中獲取資料,並對這些資料執行資料探勘。然後,它將挖掘結果儲存在檔案中,或儲存在資料庫或資料倉庫中的指定位置。

  • 半緊耦合 - 在此方案中,資料探勘系統與資料庫或資料倉庫系統相連,此外,可以在資料庫中提供一些資料探勘原語的高效實現。

  • 緊耦合 - 在此耦合方案中,資料探勘系統被平滑地整合到資料庫或資料倉庫系統中。資料探勘子系統被視為資訊系統的一個功能元件。

廣告
© . All rights reserved.