找到 413 篇文章 關於資料探勘

什麼是 CBR?

Ginni
更新於 2022年2月16日 11:50:51

401 次瀏覽

CBR 代表基於案例的推理。CBR 分類器需要一個問題解決方案資料庫來闡明新問題。與最近鄰分類器不同的是,最近鄰分類器將訓練元組儲存為歐幾里德空間中的點,而 CBR 將元組或“案例”儲存為複雜的符號表示形式,用於解決問題。CBR 的各種商業應用包括客戶服務幫助臺的問題解決,其中案例描述了與產品相關的診斷問題。CBR 已用於工程和法律等領域,其中案例分別為技術設計或法律裁決。醫學教育是 CBR 的一個應用,其中患者病史和治療方案用於支援診斷和考慮…… 閱讀更多

貝葉斯信念網路如何學習?

Ginni
更新於 2022年2月16日 11:49:01

315 次瀏覽

貝葉斯分類器是統計分類器。它們可以預測類成員機率,包括給定樣本屬於特定類的機率。貝葉斯分類器在處理大型資料庫時也顯示出較高的效率和速度。一旦定義了類,系統就應該推斷控制分類的規則,因此係統應該能夠找到每個類的描述。這些描述應該只參考訓練集的預測屬性,以便只有正例應該滿足描述,而不是反例。如果規則的描述涵蓋…… 閱讀更多

什麼是屬性選擇度量?

Ginni
更新於 2022年2月16日 11:46:57

25K+ 次瀏覽

屬性選擇度量是一種啟發式方法,用於選擇“最佳”地將給定類標記訓練元組的資料分割槽 D 分隔成單個類的分裂測試。如果它可以根據分裂標準的結果將 D 分裂成更小的分割槽,理想情況下,每個分割槽都可以是純的(即,落入給定分割槽中的某些元組可以屬於同一類)。從概念上講,“最佳”分裂標準是最接近這種方法的結果。屬性選擇度量被稱為分裂規則,因為它們決定了如何劃分給定節點處的元組。屬性選擇…… 閱讀更多

決策樹如何用於分類?

Ginni
更新於 2022年2月16日 11:44:47

1K+ 次瀏覽

決策樹歸納是從類標記訓練元組中學習決策樹。決策樹是一種類似於流程圖的順序樹狀結構,其中每個內部節點(非葉節點)表示對屬性的測試,每個分支定義測試的結果,每個葉節點(或終端節點)表示一個類標籤。樹中最高的節點是根節點。它定義了概念“購買電腦”,即它預測 AllElectronics 的使用者是否可能購買電腦。內部節點用矩形表示,葉節點用橢圓表示。有各種決策樹…… 閱讀更多

分類是如何工作的?

Ginni
更新於 2022年2月16日 11:43:32

938 次瀏覽

分類是一種資料探勘方法,它將元素分配到一組資料中,以幫助更有效地進行預測和分析。當有兩個目標類時,通常使用分類,稱為二元分類。當可以預測超過兩個類時,尤其是在模式識別問題中,這被稱為多項式分類。然而,多項式分類可用於分類響應資料,其中需要預測哪些類別中的例項具有最大機率。資料分類是一個兩階段的階段。在第一階段,構建分類器,定義預定資料集合…… 閱讀更多

我們如何使用規則約束來修剪搜尋空間?

Ginni
更新於 2022年2月16日 11:40:48

119 次瀏覽

規則約束可以分為以下五個要素:反單調性 - 約束的第一個要素是反單調性。考慮規則約束“sum(I.price) ≤ 100”。考慮它使用 Apriori 框架,在每次迭代 k 中分析大小為 k 的項集。如果項集中專案的成本總和不少於 100,則可以從此搜尋空間中縮短此項集,因為向集合中插入更多專案只會使其成本更高,因此不會滿足約束條件。反單調約束的修剪可以用於…… 閱讀更多

元規則在資料探勘中有什麼用?

Ginni
更新於 2022年2月16日 11:37:34

705 次瀏覽

資料探勘是透過傳輸儲存在儲存庫中的大量資料來查詢有用的新相關性、模式和趨勢的過程,使用模式識別技術,包括統計和數學技術。它是對事實資料集的分析,以發現意想不到的關係,並以對資料庫所有者而言既合乎邏輯又有所幫助的新方法總結記錄。它是選擇、探索和建模大量資訊的過程,以查詢最初未知的規律或關係,以便為資料庫所有者獲得清晰且有益的結果。資料探勘類似於…… 閱讀更多

什麼是基於約束的關聯挖掘?

Ginni
更新於 2022年2月16日 11:36:27

21K+ 次瀏覽

資料探勘過程可以從給定的資訊集中發現數千條規則,其中大部分最終對使用者來說是獨立的或乏味的。使用者最瞭解哪種挖掘“方向”可以導致有趣的模式,以及他們可能希望發現的模式或規則的“形式”。因此,一個好的啟發式方法是讓使用者將這種直覺或期望定義為約束,以約束搜尋空間。這種策略稱為基於約束的挖掘。基於約束的演算法需要約束來減少頻繁項集生成步驟(關聯規則生成步驟…… 閱讀更多

關聯規則聚類系統涉及哪些步驟?

Ginni
更新於 2022年2月16日 11:34:44

1K+ 次瀏覽

關聯規則聚類系統涉及以下步驟:分箱 - 定量屬性可以具有代表其域的廣泛值範圍。可以考慮如果將年齡和收入作為軸繪製,那麼二維網格會有多大,其中年齡的每個可能值都在一個軸上建立一個特定位置,同樣,收入的每個可能值都在另一個軸上建立一個特定位置。可以將網格保持到可管理的大小,可以改為將定量屬性的區域劃分為區間。這些…… 閱讀更多

我們如何挖掘封閉頻繁項集?

Ginni
更新於 2022年2月16日 11:30:57

1K+ 次瀏覽

在天真的方法中,可以挖掘頻繁項集的完整集合,然後刪除每個頻繁項集,它是當前頻繁項集的真子集,並提供與其相同的支援。此方法可以匯出 2100−1 個頻繁項集以獲得長度為 100 的頻繁項集,所有這些都在開始刪除冗餘項集之前。推薦的技術是在挖掘階段精確地搜尋封閉頻繁項集。這需要我們在挖掘過程中識別封閉項集的方法時修剪搜尋空間。有各種修剪策略,包括以下幾種:專案…… 閱讀更多

廣告
© . All rights reserved.