資料探勘的侷限性是什麼?


資料探勘是從儲存在資料庫中的海量資料中提取有用的新關聯、模式和趨勢的過程,它使用包括統計和數學技術在內的模式識別技術。它是對事實資料集的分析,以發現意想不到的關係,並以對資料所有者既有邏輯意義又有所幫助的新方法來總結記錄。

資料探勘是一個跨學科領域,它彙集了一套學科,例如資料庫系統、統計學、機器學習、視覺化和資料科學。根據所使用的資料探勘方法,可以應用其他學科的技術,例如神經網路、模糊和/或粗糙集理論、知識表示、歸納邏輯程式設計或高效能計算。

資料探勘類似於資料科學。它由個人在特定情況下對特定資料集進行,並具有特定目標。此階段包含多種型別的服務,包括文字挖掘、網路挖掘、音訊和影片挖掘、影像資料探勘和社交媒體挖掘。它是透過簡單或非常具體的軟體完成的。

透過外包資料探勘,所有工作都可以更快地完成,並且運營成本更低。特定的公司還可以使用新技術來儲存手動無法找到的資料。多個平臺上有大量資料可用,但可訪問的知識非常有限。

主要挑戰在於分析資料以提取可用於解決問題或公司發展的重要資料。有許多動態工具和技術可用於挖掘資料並從中獲得更好的判斷。

資料探勘的侷限性主要與資料或人員相關,而不是與技術相關。

  • 資料探勘軟體是非常強大的工具,但它們不是自給自足的應用程式。它的成功需要熟練的技術和分析專家,他們能夠構建分析並解釋生成的輸出。

  • 資料探勘用於獲取模式和關係,但它不會告訴使用者這些模式的價值或意義。這些型別的確定必須由使用者做出。

  • 所發現模式的有效性取決於如何將這些模式與現實世界的情況進行比較。例如,為了評估旨在在一個龐大的人群中識別潛在恐怖嫌疑人的資料探勘應用程式的有效性,使用者可以使用包含有關已知恐怖分子的資訊的資料來測試模型。

  • 資料探勘可以識別行為和變數之間的聯絡,但它並不一定能識別因果關係。例如,一個應用程式可以識別出一種行為模式,例如在航班起飛前不久購買機票的傾向,與收入、教育水平和網際網路使用等特徵相關。

更新於:2022年2月15日

3K+ 次瀏覽

啟動你的職業生涯

透過完成課程獲得認證

開始學習
廣告