資料探勘的歷史是什麼?
資料探勘是從儲存在儲存庫中的大量資料中轉移,使用包括統計和數學技術在內的模式識別技術,查詢有用的新關聯、模式和趨勢的過程。它是對事實資料集的分析,以發現意想不到的關係,並以對資料所有者來說既合乎邏輯又有所幫助的新方法總結記錄。
它是選擇、探索和建模大量資訊以查詢最初未知的規律或關係的過程,以獲得對資料庫所有者來說清晰且有益的結果。
資料探勘類似於資料科學。它由一個人在特定情況下對特定資料集進行,並具有目標。此階段包含多種型別的服務,包括文字挖掘、網路挖掘、音訊和影片挖掘、影像資料探勘和社交媒體挖掘。它是透過簡單或高度特定的軟體完成的。
透過外包資料探勘,所有工作都可以更快地完成,並且運營成本較低。特定公司還可以使用新技術來儲存手動無法找到的資料。多個平臺上提供了大量資料,但可訪問的知識卻非常有限。
在資料中查詢有用模式的方法已被賦予多個名稱,包括資料探勘、知識提取、資料發現、資料收集、資料考古和資料模式處理。資料探勘已被統計學家、資料分析師和管理資訊系統 (MIS) 社群使用。
它還在資料庫領域獲得了越來越多的關注。知識發現於資料庫的過程是在 1989 年的第一次 KDD 研討會上發明的(Piatetsky-Shapiro 1991),以維護知識是資料驅動發現的最終產品。它在人工智慧和機器學習領域得到了推廣。
KDD 定義了從資料中發現有用知識的完整過程,而資料探勘定義了此過程中的特定步驟。資料探勘是應用特定演算法從資料中提取模式。KDD 過程與資料探勘步驟(在該過程中)之間的差異是此物件的中心點。
KDD 過程中的後續步驟,包括資料準備、資料選擇、資料清理、結合適當的先驗知識以及對挖掘結果的適當分析,對於確保從資料中獲得有用的知識至關重要。
盲目應用資料探勘技術(在統計文獻中被正確地稱為資料探勘)可能是一項危險的活動,很容易導致發現毫無意義和無效的設計。
資料結構
網路
關係資料庫管理系統
作業系統
Java
iOS
HTML
CSS
Android
Python
C 程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP