資料探勘系統與資料庫系統的整合是什麼?
資料探勘系統與資料庫或資料倉庫系統整合,以便其能夠有效地執行任務。資料探勘系統在一個需要與其他資料系統(如資料庫系統)通訊的環境中執行。以下是一些可以整合這些系統的可能的整合方案:
無耦合 - 無耦合定義為資料探勘系統不使用資料庫或資料倉庫系統的任何功能。它可以從特定來源(包括檔案系統)檢索資料,使用一些資料探勘演算法處理資料,然後將挖掘結果儲存到不同的檔案中。
這樣的系統雖然簡單,但存在各種侷限性。首先,資料庫系統在儲存、組織、訪問和處理資料方面提供了很大的靈活性和適應性。不使用資料庫/資料倉庫系統,資料探勘系統可能會花費大量時間查詢、收集、清理和轉換資料。
松耦合 - 在這種資料探勘系統中,它使用資料庫或資料倉庫系統的一些服務。資料是從這些系統處理的資料儲存庫中獲取的。資料探勘方法用於處理資料,然後將處理後的資料儲存到檔案中或資料庫或資料倉庫中的指定區域。松耦合優於無耦合,因為它可以使用查詢處理或各種系統設施來獲取儲存在資料庫中的一些資料區域。
半緊耦合 - 在這種情況下,可以在資料庫/資料倉庫系統中支援一些基本資料探勘原語的充分執行。這些原語可以包含排序、索引、聚合、直方圖分析、多路連線以及一些重要統計度量的預計算,包括總和、計數、最大值、最小值、標準差等。
緊耦合 - 緊耦合定義為資料探勘系統與資料庫/資料倉庫系統無縫整合。資料探勘子系統被視為資訊系統的一個功能元素。
資料探勘查詢和函式是在資料庫/資料倉庫系統的挖掘查詢分析、資料結構、索引方案和查詢處理方法的基礎上開發和建立的。這是非常理想的,因為它支援資料探勘功能的有效實現、高系統性能和整合的數 據處理環境。
廣告