頻繁模式挖掘的標準是什麼?


頻繁模式挖掘有幾個標準,如下所示:

基於要挖掘的模式的完整性 - 在給定最小支援閾值的情況下,它可以挖掘所有頻繁項集、閉合頻繁項集和最大頻繁項集。

它還可以提取受約束的頻繁項集(它可以滿足一組使用者定義的約束)、近似頻繁項集(它可以僅更改挖掘的頻繁項集的近似支援計數)、近似匹配頻繁項集(它可以計算相對匹配項集的支援計數)、前 k 個頻繁項集(即,對於使用者指定的 k 值,k 個最頻繁的項集)等。

一些應用程式可能對要挖掘的模式的完整性有多個要求,這可能導致不同的計算和最佳化方法。

基於規則集中包含的抽象級別 - 關聯規則挖掘有幾種方法可以在多個抽象級別上發現規則。例如,考慮一組挖掘的關聯規則包含以下規則,其中 X 是定義客戶的變數:

購買(X,“電腦”) ⇒ 購買(X,“惠普印表機”)

購買(X,“筆記型電腦”) ⇒ 購買(X,“惠普印表機”)

基於規則中包含的資料維度數量 - 如果關聯規則中的專案或屬性僅引用一個維度,則它是單維關聯規則。

基於規則中處理的值型別 - 如果規則包含專案存在和不存在之間的關聯,則它是布林關聯規則。如果規則定義定量專案或屬性之間的關聯,則它是定量關聯規則。在這些規則中,專案或屬性的定量值被分成區間。

基於要挖掘的規則型別 - 頻繁模式分析可以建立幾種型別的規則和不同的有趣關係。關聯規則是從頻繁模式生成的著名型別的規則。

基於要挖掘的模式型別 - 可以從多種型別的資料集中挖掘幾種型別的頻繁模式。主要目標是頻繁項集挖掘,即從事務或關係資料集中挖掘頻繁項集(專案集)。

序列模式挖掘在序列資料集中搜索頻繁子序列,其中序列資料是事件的排序。例如,使用序列模式挖掘,可以研究通常購買專案的系列。例如,使用者可能傾向於先購買 PC,然後購買數碼相機,然後購買儲存卡。

更新於: 2022年2月16日

1K+ 瀏覽量

開啟你的 職業生涯

透過完成課程獲得認證

開始學習
廣告