資料探勘在科學和工程中的作用是什麼?
資料探勘在科學和工程中有多種作用,如下所示:
資料倉庫和資料預處理 − 資料預處理和資料倉庫對於資料交換和資料探勘非常重要。構建資料倉庫需要發現解決在多個環境和多個時間段收集的不一致或不相容資訊的方法。
這需要協調語義、引用系統、數學、測量、效率和精度。需要方法來整合來自異構資料來源的資料並識別事件。
挖掘複雜資料型別 − 數值資料集本質上是異構的。它們通常包含半結構化和非結構化資料,包括多媒體資料和地理參考流資料,以及具有複雜、深度隱藏語義的資料(例如基因組和蛋白質組記錄)。
需要穩健且專用的分析方法來管理時空資料、生物資料、相關的概念層次結構和複雜的語義關係。
基於圖和網路的挖掘 − 在圖或網路建模中,每個要挖掘的物件由圖中的一個頂點定義,頂點之間的邊定義了物件之間的關係。例如,可以使用圖來模擬化學結構、生物途徑以及包括流體流動模擬在內的整數模擬產生的資料。
基於圖或網路建模的成功取決於多種基於圖的資料探勘服務的可擴充套件性和有效性的改進,包括分類、頻繁模式挖掘和聚類。
視覺化工具和領域特定知識 − 數學資料探勘系統需要高階圖形使用者介面和視覺化工具。這些必須與當前的領域特定資料和資料系統相統一,以幫助研究人員和普通使用者查詢模式、表示和視覺化發現的模式,並在其決策中利用發現的知識。
工程中的資料探勘與科學中的資料探勘有許多相似之處。這兩種實踐都收集大量資料,並需要資料預處理、資料倉庫以及對複雜型別資料的可擴充套件挖掘。兩者通常都使用視覺化並充分利用圖形和網路。此外,許多工程流程需要即時響應,因此即時挖掘資料流通常成為一個必不可少的組成部分。
大量的人際交往資料湧入我們的日常生活。這種交流以多種形式存在,例如新聞、部落格、文章、網頁、線上討論、產品評論、推特、訊息、廣播和通訊,無論是在網際網路上還是在各種社交網路上。
因此,社會科學和社會研究中的資料探勘越來越受歡迎。此外,可以探索客戶或讀者對產品、演講和文章的反饋,以推斷社會中這些人的普遍觀點和情緒。分析結果可用於預測趨勢、改進工作並支援決策。
資料結構
網路
關係資料庫管理系統
作業系統
Java
iOS
HTML
CSS
Android
Python
C 程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP