資料探勘的功能是什麼?
資料探勘功能用於表示必須在資料探勘任務中發現的模式型別。一般來說,資料探勘任務可以分為兩類,包括描述性和預測性。描述性挖掘任務定義資料庫中資料的共同特徵,而預測性挖掘任務則對當前資訊進行推斷以開發預測。
有各種資料探勘功能,如下所示:
資料特徵描述 - 它總結了資料物件類的一般特徵。與使用者指定類相對應的資料通常由資料庫查詢收集。資料特徵描述的輸出可以以多種形式呈現。
資料區分 - 它比較目標類資料物件的一般特徵與來自一個或一組對比類的物件的一般特徵。目標類和對比類可以由使用者表示,並且可以透過資料庫查詢獲取等效資料物件。
關聯分析 - 它分析通常在事務資料集中一起出現的專案集。有兩個引數用於確定關聯規則:
它提供了識別資料庫中共同專案集的方法。
置信度是在另一個專案出現時,專案出現在事務中的條件機率。
分類 - 分類是發現表示和區分資料類或概念的模型的過程,目的是能夠使用該模型來預測類標籤未知的物件的類。派生模型是基於對一組訓練資料(即類標籤已知的物件資料)的分析建立的。
預測 - 它定義了預測一些不可用的資料值或未來的趨勢。可以根據物件的屬性值和類的屬性值來預測物件。它可以是缺失數值的預測或與時間相關的資訊的增長/下降趨勢。
聚類 - 它類似於分類,但類未預定義。類由資料屬性表示。它是無監督學習。物件被聚類或分組,取決於最大化類內相似性和最小化類間相似性的原則。
異常值分析 - 異常值是無法在給定類或聚類中分組的資料元素。這些是與其他資料物件的一般行為具有多種行為的資料物件。此型別資料的分析對於挖掘知識可能至關重要。
演變分析 - 它定義了行為隨時間變化的物件的趨勢。
廣告