資料探勘方法學的不同方面是什麼?
資料探勘方法學包含以下幾個方面:
挖掘各種新的知識 − 資料探勘涵蓋了廣泛的資料分析和知識發現服務,從資料特徵描述和區分到關係和關聯分析、分類、迴歸、聚類、異常值方法、序列方法以及趨勢和計算分析。
這些服務可以多種方式使用同一個資料庫,並需要開發多種資料探勘技術。由於軟體的多樣性,新的挖掘服務不斷湧現,使資料探勘成為一個強大且快速發展的領域。
例如,為了有效地發現數據網路中的知識,整合聚類和排序可以幫助發現高質量的叢集和網路中物件的排名。
在多維空間中挖掘知識 − 當在高維資料集中探尋知識時,可以分析多維空間中的資訊。它可以在多個抽象級別搜尋維度(屬性)集合之間的有趣模式。這種挖掘被稱為(探索性)多維資料探勘。
在許多情況下,資料可以被收集或視為多維資料立方體。在立方體區域挖掘知識可以提高資料探勘的效力和適應性。
資料探勘——一項跨學科的努力 − 透過整合來自多個學科的新技術,可以提高資料探勘的效力。例如,它可以挖掘包含自然語言文字的記錄,將資料探勘方法與資料檢索和自然語言處理方法相融合是有意義的。
增強網路環境中發現能力 − 一些資料物件存在於連線或互連的環境中,無論是Web、資料庫關聯、檔案還是記錄。多個數據物件之間的語義連線可用於改進資料探勘。在一個物件集中發現的知識可以用來增強在“關聯”或語義連線的物件組中發現知識。
處理資料的不確定性、噪聲或不完整性 − 資料可能包含噪聲、錯誤、異常或歧義,或者是不完整的。錯誤和噪聲可能會混淆資料探勘階段,導致匯出錯誤的設計。資料清洗、資料預處理、異常值檢測和去除以及歧義推理是需要與資料探勘過程統一起來的方法示例。
模式評估和模式或約束引導的挖掘 − 資料探勘過程產生的並非所有模式都具有趣味性。模式的趣味性因使用者而異。因此,需要根據主觀度量來評估已發現模式的趣味性的技術。
這些技術根據給定的使用者類別、使用者的信念或期望來計算模式的值。此外,透過使用趣味性度量或使用者定義的約束來指導發現過程,可以生成更有趣的模式並縮小搜尋空間。
資料結構
網路
關係資料庫管理系統 (RDBMS)
作業系統
Java
iOS
HTML
CSS
Android
Python
C語言程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP