資料探勘的架構是什麼?
資料探勘是從儲存在儲存庫中的大量資料中篩選,使用模式識別技術以及統計和數學技術,發現有意義的新關聯、模式和趨勢的過程。它是對觀察資料集的分析,以發現意想不到的關係,並以對資料所有者既易於理解又實用的新穎方式對資料進行總結。
它是選擇、探索和建模大量資訊以尋找最初未知的規律或關係,以便為資料庫所有者獲得清晰和有益的結果的過程。資料探勘是透過自動或半自動方式探索和分析海量資料以發現有意義的設計和方法的階段。
資料探勘是一種重要的方法,它可以從海量資訊中提取以前未知的且可能對使用者有用的資料。資料探勘過程包含多個元件,這些元件構成了資料探勘系統結構。資料探勘的主要元件如下:
資訊儲存庫 - 這是一組或多組資料庫、資料倉庫、電子表格或多種型別的資料儲存庫。可以對資料實施資料清理和資料整合技術。
資料庫或資料倉庫伺服器 - 資料庫或資料倉庫伺服器負責根據使用者的資料庫請求獲取相關資料。
知識庫 - 這是可以指導搜尋或計算結果設計趣味性的領域知識。
資料探勘引擎 - 這對於資料探勘系統至關重要,它包含一組用於執行任務的功能模組,包括特徵描述、關聯和相關性分析、分類、預測、聚類分析、離群值分析和演化分析。
模式評估模組 - 此元件通常使用趣味性度量,並與資料探勘結構通訊以將搜尋集中在有趣的模式上。
此部分通常使用利益相關者度量,這些度量與資料探勘模組協作,以將搜尋目標定位到引人入勝的設計。它可以使用利益相關者閾值來過濾掉髮現的模式。
換句話說,模式評估模組可以根據所使用的資料探勘技術的執行情況與挖掘模組協調。為了有效的資料探勘,建議儘可能將模式利益相關者的評估推入挖掘過程中,以將搜尋限制在僅限於有趣的模式。
使用者介面 - 此模組連線使用者和資料探勘系統,使使用者能夠透過定義資料探勘查詢或任務與系統互動,提供資料以幫助集中搜索,以及根據中間資料探勘結果執行探索性資料探勘。
此外,此元件允許使用者瀏覽資料庫和資料倉庫設計或資料結構,評估挖掘的模式,並以不同的形式視覺化這些模式。
資料結構
網路
關係資料庫管理系統
作業系統
Java
iOS
HTML
CSS
Android
Python
C 程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP