元規則在資料探勘中如何發揮作用?
資料探勘是從儲存在儲存庫中的大量資料中提取有用的新關聯、模式和趨勢的過程,它使用模式識別技術,包括統計和數學技術。它是對事實資料集的分析,以發現意想不到的關係,並以對資料庫所有者既邏輯又有效的新方法總結記錄。
它是選擇、探索和建模海量資訊以發現最初未知的規律或關係的過程,從而為資料庫所有者獲得清晰而有益的結果。
資料探勘類似於資料科學。它由一個人在特定情況下、針對特定資料集、以特定目標進行。此階段包含多種型別的服務,包括文字挖掘、網路挖掘、音訊和影片挖掘、影像資料探勘和社交媒體挖掘。它是透過簡單或高度特定的軟體完成的。
元規則使使用者能夠定義他們參與挖掘的規則的語法形式。規則形式可以用作約束,以提高挖掘階段的有效性。元規則可以基於分析師對資料或自動生成的經驗、期望或直覺,具體取決於資料庫模式。
**元規則引導的挖掘** - 考慮一下作為 AllElectronics 的市場分析師,它可以訪問定義客戶(包括客戶年齡、地址和信用評級)的資料以及客戶交易列表。
它可以查詢客戶特徵與客戶購買的商品之間的關聯。但是,它不僅要查詢反映這些關係的一些關聯規則,而且只對確定哪些客戶特徵對銷售辦公軟體有幫助感興趣。
此類元規則的一個示例是
P1(X, Y)∧ P2(X, W) ⇒ buys(X, “office software”)
其中 P1 和 P2 是謂詞變數,在挖掘階段被例項化為給定資料庫中的屬性,X 是定義客戶的變數,Y 和 W 分別取分配給 P1 和 P2 的屬性的值。
通常,使用者可以定義要用於與 P1 和 P2 例項化的屬性列表。因此,可以使用預設集。
一般來說,元規則形成了關於使用者參與感知或確認的關係的假設。資料探勘系統可以搜尋連線給定元規則的規則。例如,
age(X, “30...39”)∧income(X, “41K...60K”) ⇒ buys(X, “office software”)
資料結構
網路
關係資料庫管理系統
作業系統
Java
iOS
HTML
CSS
Android
Python
C 語言程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP