什麼是多關係資料探勘?
多關係資料探勘 (MRDM) 方法搜尋包含關係資料庫中多個表(關係)的設計。每個表或關係都表示一個實體或關係,由一組屬性描述。關係之間的連結顯示它們之間的關係。
一種應用傳統資料探勘方法(假設資料駐留在單個表中)的方法是命題化,它使用連線和聚合將多個關係資料轉換為單個扁平資料關係。
這可能導致生成一個巨大的、不希望的“通用關係”(包含所有屬性)。此外,它還可能導致資訊丟失,包括資料庫設計中連結所表示的重要語義資訊。
多關係資料探勘旨在直接從關係資料中發現知識。存在不同的多關係資料探勘功能,例如多關係分類、聚類和頻繁模式挖掘。
多關係分類的優勢在於構建一個利用不同關係中資訊的分類模型。多關係聚類旨在使用其屬性以及與它們在不同關係中相關的元組將元組分組為叢集。多關係頻繁模式挖掘旨在查詢涉及不同關係中互連專案的模式。它可以首先使用多關係分類來說明多關係資料探勘的目的和過程。
在用於多關係分類的資料庫中,存在一個目標關係 Rt,其元組稱為目標元組,並與類標籤相關。其他關係是非目標關係。每個關係可以有一個主鍵(唯一識別關係中的元組)和幾個外部索引鍵(一個關係中的主鍵可以連線到另一個關係中的外部索引鍵)。
如果可以考慮一個兩類問題,則可以選擇一類作為正類,另一類作為負類。構建準確的多關係分類器的服務是查詢不同關係中的相關特徵,以幫助對正目標元組和負目標元組進行分類。
多關係分類中最流行的假設形式是規則集。每個規則都是謂詞列表(邏輯合取),與類標籤相關聯。謂詞是對關係中屬性的約束。謂詞通常基於某個連線路徑定義。當且僅當目標元組滿足規則的每個謂詞時,它才滿足該規則。
廣告
資料結構
網路
關係資料庫管理系統 (RDBMS)
作業系統
Java
iOS
HTML
CSS
Android
Python
C語言程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP