資料探勘的組成部分是什麼?


資料探勘是從大量資訊中選擇、探索和建模的過程,以發現最初未知的規律或關係,從而為資料庫所有者獲得清晰且有益的結果。

資料探勘是一個跨學科領域,是一組學科的集合,例如資料庫系統、統計學、機器學習、視覺化和資料科學。它基於使用的資料探勘方法,可以利用其他學科的方法,包括神經網路、模糊和粗糙集理論、知識表示、歸納邏輯程式設計或高效能計算。

根據要挖掘的資料型別或給定的資料探勘應用程式,資料探勘系統還可以整合來自空間資料分析、資料檢索、模式識別、影像分析、訊號處理、計算機圖形、網路技術、經濟學、商業、生物資訊學或心理學的方法。

可以設計資料探勘查詢語言來包含這些原語,使使用者能夠靈活地與資料探勘系統連線。資料探勘查詢語言支援使用者友好的圖形介面的構建。這促進了資料探勘系統與其他資料系統的通訊及其與完整資料處理環境的整合。

設計一個包容性的資料探勘語言具有挑戰性,因為資料探勘保護著廣泛的功能,從資料特徵描述到演化分析。每個任務都有幾個要求。設計有效的**資料探勘查詢語言需要對不同型別資料探勘任務的功能、限制和底層結構有廣泛的瞭解**。

資料探勘功能用於定義必須在資料探勘任務中發現的模式型別。一般來說,資料探勘任務可以分為兩類,包括描述性和預測性。描述性挖掘任務定義資料庫中資料的共同特徵,而預測性挖掘任務則對當前資訊進行推理以開發預測。

資料探勘的主要組成部分如下:

  • **資料庫** - 這是一組或多組資料庫、資料倉庫、電子表格和其他型別的儲存庫,可以在其中實現資料清理和整合技術。
  • **資料倉庫伺服器** - 此元件根據使用者的請求從資料倉庫中獲取相關記錄。
  • **知識庫** - 它是用於發現有趣模式的知識領域。
  • **資料探勘引擎** - 它使用一個功能模組來執行分類、關聯、聚類分析等任務。
  • **模式評估模組** - 此元件使用有趣性度量與資料探勘結構通訊,以將搜尋目標導向有趣的模式。
  • **使用者介面** - 此介面使使用者能夠透過圖形使用者介面描述資料探勘功能或查詢來與系統互動。

更新於: 2022年2月15日

5K+ 瀏覽量

開啟您的職業生涯

透過完成課程獲得認證

開始學習
廣告

© . All rights reserved.