可以挖掘哪些型別的資料?


資料探勘定義了從海量資料中提取或挖掘知識的過程。資料探勘通常用於儲存和處理大量資料的地方。例如,銀行系統使用資料探勘來儲存大量資料,這些資料會不斷被處理。

在資料探勘中,根據多個類別將資料的隱藏模式轉換為有用的資料。這些資料被收集在一個區域,包括用於分析的資料倉庫,並執行資料探勘演算法。這些資料有助於做出有效的決策,從而降低成本並提高收入。

以下列出了各種用於資料的資料探勘應用程式型別:

  • 關係型資料庫 - 資料庫系統也稱為資料庫管理系統。它包括一組相互關聯的資料(稱為資料庫)和一組用於處理和訪問資料的軟體程式。

關係型資料庫是一組表,每個表都有一個唯一的名稱。每個表都包含一組屬性(列或欄位),並且通常儲存大量元組(記錄或行)。關係表中的每個元組都定義了一個由唯一鍵標識的物件,並由一組屬性值表示。通常會為關係型資料庫構建一個語義資料模型,包括實體關係 (ER) 資料模型。ER 資料模型將資料庫定義為一組實體及其關係。

  • 事務型資料庫 - 事務型資料庫包含一個檔案,其中每條記錄都定義一個事務。事務通常包含一個唯一的事務標識號 (trans ID) 和構成事務的專案的列表(例如,在商店中購買的商品)。

事務型資料庫可以具有與其相關的其他表,其中包括有關銷售的其他資料,包括交易日期、客戶 ID 號、銷售人員的 ID 號以及出現銷售的分支機構的 ID 號等。

  • 物件關係型資料庫 - 物件關係型資料庫基於物件關係型資料模型構建。該模型透過支援用於管理複雜物件和麵向物件的功能的豐富資料型別來擴充套件關係模型。

  • 時間序列資料庫 - 時間序列資料庫通常儲存包含與時間相關的屬性的關係資料。這些屬性可以包括多個時間戳,每個時間戳都有不同的語義。

  • 序列資料庫 - 序列資料庫儲存有序事件的序列,無論是否具有時間的事實概念。例如,客戶購物序列、網路點選流和生物序列。

  • 時間序列資料庫 - 時間序列資料庫儲存隨著時間的推移重複測量獲得的值或事件的序列(例如,每小時、每天、每週)。例如,從股票交易所、庫存控制和自然現象測量(如溫度和風)中收集的資料。

更新於:2021年11月19日

15K+ 瀏覽量

啟動你的 職業生涯

透過完成課程獲得認證

開始學習
廣告