什麼是KDD?


KDD 代表知識發現 (Knowledge Discovery in Databases)。它定義了從資料中發現知識的廣泛過程,並強調了特定資料探勘技術的更高級別應用。它是許多領域研究人員感興趣的領域,例如人工智慧、機器學習、模式識別、資料庫、統計學、專業系統知識獲取和資料視覺化。

KDD 過程的主要目標是從大型資料庫中的資訊中提取資料。它透過利用資料探勘演算法來識別被認為是知識的內容來做到這一點。資料庫中的知識發現被視為對大型資料儲存庫進行的程式化、探索性分析和建模。KDD 是從大型且複雜的資料集中識別有效、有用和可理解的設計的有組織的過程。

KDD 是識別資料中有效、新穎、可能有用且基本上合乎邏輯的設計的非平凡過程。該過程表明,KDD 包括許多步驟,包括資料準備、模式搜尋、知識評估和細化,所有這些步驟都在多次迭代中重複。非平凡是指包含某些搜尋或推理;即,它不是像計算一組數字的平均值那樣對預定義量進行簡單的計算。

資料探勘是 KDD 過程的根源,例如推斷出用於調查記錄、開發模型和發現以前未知模式的演算法。該模型用於從資訊中提取知識、分析資訊和預測資訊。

資料探勘是 KDD 過程中的一步,包括應用資料分析和發現演算法,這些演算法在可接受的計算效率限制下,對資料進行模式(或模型)的特定列舉。

模式領域通常是無限的,並且模式的列舉包含此空間中某種形式的搜尋。實際的計算約束對資料探勘演算法可以分析的子空間施加了嚴格的限制。

KDD 過程包括使用資料庫以及對其進行的一些必要的選擇、預處理、子取樣和轉換;使用資料探勘方法(演算法)從中列舉模式;以及計算資料探勘的產出以識別被認為是知識的列舉模式的子集。

KDD 過程中的資料探勘元件與從記錄中提取和列舉模式的演算法方法有關。完整的 KDD 過程包括對挖掘出的模式進行評估和可能的解釋,以確定哪些模式可以被視為新知識。

更新於: 2021年11月24日

2K+ 次瀏覽

開啟你的 職業生涯

透過完成課程獲得認證

開始學習
廣告

© . All rights reserved.