找到 413 篇文章 關於資料探勘

資料探勘中約束的分類有哪些?

Ginni
更新於 2022年2月18日 10:02:36

366 次檢視

基於約束的演算法需要約束來減少頻繁項集生成階段的搜尋空間(關聯規則建立步驟與窮舉演算法相同)。約束的重要性是明確的,它們只生成對客戶有意義的關聯規則。該方法非常簡單,規則空間減小,從而使剩餘規則利用約束。有三種類型的約束,如下所示:例項約束 - 例項約束定義瞭如何在聚類分析中對例項對或例項集進行分組。從……中有兩種型別的約束 閱讀更多

如何測量圖中兩個頂點之間的相似度或距離?

Ginni
更新於 2022年2月18日 10:09:11

1K+ 次檢視

有兩種型別的度量,例如測地線距離和基於隨機遊走的距離。測地線距離 - 圖中兩個頂點之間距離的一個簡單度量是頂點之間的最短路徑。通常,兩個頂點之間的測地線距離是指頂點之間最短路徑的邊數。對於圖中未連線的兩個頂點,測地線距離表示為無窮大。透過利用測地線距離,它可以表示圖分析和聚類的各種有用度量。給定一個圖 G = (V, E),其中 V ... 閱讀更多

二分圖有哪些應用?

Ginni
更新於 2022年2月18日 07:31:57

2K+ 次檢視

在二分圖中,頂點可以分成兩個不相交的集合,使得每條邊都連線一個集合中的一個頂點和另一個集合中的一個頂點。對於 AllElectronics 使用者購買資料,一組頂點定義使用者,每個頂點一個使用者。另一個集合定義產品,每個頂點一個產品。一條邊將使用者連線到產品,定義使用者購買該產品。二分圖有各種應用,如下所示:網路搜尋引擎 - 在網路搜尋引擎中,搜尋日誌被歸檔到資料使用者查詢和 ... 閱讀更多

如何從高維資料中找到子空間聚類?

Ginni
更新於 2022年2月18日 07:30:18

347 次檢視

已經有多種方法被歸類為三大類,包括子空間搜尋技術、基於相關性的聚類技術和雙聚類技術。子空間搜尋技術 - 子空間搜尋方法搜尋多個子空間的聚類。因此,聚類是在子空間中彼此相同的物件的子集。相似度是透過傳統的度量獲得的,包括距離或密度。例如,CLIQUE 演算法是一種子空間聚類技術。它可以在維度遞增序列中指定子空間和這些子空間中的聚類,並使用反單調性來剪枝其中不存在聚類的子空間。一個更大的 ... 閱讀更多

什麼是主動學習?

Ginni
更新於 2022年2月18日 07:25:56

442 次檢視

主動學習是一種重複性的監督學習型別,與資料充足但類標籤稀缺或獲取成本高的情況相關。學習演算法是主動的,因為它可以仔細地查詢使用者(例如,人工預言機)以獲取標籤。用於理解該方法的概念的多個元組小於典型監督學習中所需的數量。它用於保持成本降低,主動學習者的目標是利用盡可能少的標記示例來實現高精度。令 D 為正在考慮的所有資料。有幾種方法 ... 閱讀更多

什麼是貝葉斯信念網路?

Ginni
更新於 2022年2月18日 07:24:24

871 次檢視

樸素貝葉斯分類器假設類條件獨立性,即,給定元組的類標籤,屬性的值被假設為彼此條件獨立。這簡化了計算。當假設影響真即時,因此樸素貝葉斯分類器與多個分類器相比效率更高。貝葉斯信念網路定義聯合條件機率分佈。它們允許在變數子集之間表示類條件獨立性。它們支援因果關係的圖形結構,學習可以在其上實現。訓練後的貝葉斯信念網路用於分類。貝葉斯信念網路也稱為 ... 閱讀更多

如何視覺化資料以支援互動式決策樹構建?

Ginni
更新於 2022年2月18日 07:20:57

166 次檢視

基於感知的分類 (PBC) 是一種基於多維視覺化方法的互動式方法,允許使用者在構建決策樹時整合關於資料的背景知識。透過與資料進行視覺互動,使用者更有可能對資料產生更深入的瞭解。生成的樹可能比使用傳統決策樹歸納技術構建的樹更小,因此更容易解釋,同時實現大致相同的準確性。PBC 需要一種畫素導向方法來考慮其類標籤資料的多維資料。圓段方法被採用,它將 d 維資訊物件對映到一個圓 ... 閱讀更多

模式挖掘有哪些應用?

Ginni
更新於 2022年2月18日 07:19:16

2K+ 次檢視

模式挖掘有各種應用,如下所示:模式挖掘通常用作多個數據密集型應用程式中的預處理中的噪聲過濾和資料清理。例如,它可以用於探索微陣列資料,其中包含數萬個維度(例如,描述基因)。模式挖掘有助於發現隱藏在資料中的內在機制和聚類。例如,給定 DBLP 資料集,頻繁模式挖掘可以簡單地發現有趣的聚類,例如合著者聚類(透過確定通常合作的作者)和會議聚類(透過確定多個作者和術語的共享)。這種架構 ... 閱讀更多

資料立方體計算有哪些技術?

Ginni
更新於 2022年2月18日 07:17:14

7K+ 次檢視

以下是有效計算資料立方體的一般最佳化技術,如下所示:排序、雜湊和分組 - 必須將排序、雜湊和分組操作用於維度屬性以重新排序和聚類關聯的元組。在立方體計算中,聚合是在共享相同維度值集的元組上實現的。因此,分析排序、雜湊和分組服務以訪問和分組此類資料以支援此類聚合的評估至關重要。它可以按分支、日期和專案計算總銷售額。按分支和……對元組或單元進行排序可能更有效 閱讀更多

資料探勘與資訊處理和聯機分析處理有什麼關係?

Ginni
更新於 2022年2月18日 07:15:30

960 次檢視

資料倉庫應用程式主要有三種類型:資訊處理、分析處理和資料探勘。資訊處理 - 它提供查詢、基本數值分析以及使用交叉表、表格、圖表或圖形進行文件記錄的功能。資料倉庫資料處理的現代趨勢是開發低成本的基於 Web 的訪問工具,並將其與 Web 瀏覽器整合。分析處理 - 它提供基本的 OLAP 操作,例如切片和切塊、鑽取、上卷和旋轉。它通常處理歷史資訊,包括彙總形式和詳細形式。線上分析處理相較於資訊處理的主要優勢在於對資料倉庫資料進行多維資訊分析。資料 ... 閱讀更多

廣告
© . All rights reserved.