找到 413 篇文章 關於資料探勘

統計資料挖掘的方法有哪些?

Ginni
更新於 2022年2月18日 10:40:01

2K+ 瀏覽量

在統計資料挖掘技術中,它被建立用於有效處理大量通常是多維的且可能包含幾種複雜型別的資料。存在幾種行之有效的統計資料分析方法,特別是對於數值資料。這些方法已被廣泛用於科學記錄(例如,物理、工程、製造、心理學和醫學實驗記錄),以及來自經濟學和社會科學的資訊。統計資料挖掘的各種方法如下:迴歸 - 一般來說,這些技術用於根據新的預測變數(自變數)預測響應變數(因變數)的值…… 閱讀更多

什麼是時空資料探勘?

Ginni
更新於 2022年2月18日 10:38:30

1K+ 瀏覽量

時空資料探勘定義了從時空資料中查詢模式和知識的過程。時空資料探勘的一個例項包括查詢城市和土地的發展歷史、揭示天氣模式、預測地震和颶風以及確定全球變暖趨勢。鑑於行動電話、GPS 裝置、基於網際網路的地圖服務、天氣服務和數字地球以及衛星、RFID、感測器、無線和影片技術的普及,時空資料探勘變得越來越重要,並具有深遠的影響。存在幾種型別的時空資料,移動物件資料非常重要。例如,動物科學家將遙測裝置連線到野生動物身上以探索生態行為,移動性管理器嵌入…… 閱讀更多

什麼是圖和網路挖掘?

Ginni
更新於 2022年2月18日 10:36:41

2K+ 瀏覽量

圖定義了一種比集合、序列、格和樹更通用的機制類別。網際網路和社交網路、資料網路、生物網、生物資訊學、化學資訊學、計算機視覺以及多媒體和內容檢索中存在廣泛的圖應用。圖和網路挖掘的應用如下:圖模式挖掘 - 它是在一個或一組圖中挖掘頻繁子圖。挖掘圖模式的各種方法可以分為基於 Apriori 和基於模式增長的方法。它可以挖掘封閉圖的集合,其中圖 g 是…… 閱讀更多

序列資料探勘的型別有哪些?

Ginni
更新於 2022年2月18日 10:35:08

2K+ 瀏覽量

序列是有序事件列表。序列可以根據它們定義的事件特徵分為三組,如下所示:時間序列資料中的相似性搜尋時間序列資料集包括在重複計算時間內獲取的整數值序列。這些值通常以相同的時間間隔(例如,每分鐘、每小時或每天)進行測量。時間序列資料庫在許多應用中都很有名,包括股票市場分析、經濟和銷售預測、預算分析、效用研究、庫存研究、收入預測、工作量預測以及流程和質量服務。它們有利於研究自然現象、數學和工程…… 閱讀更多

高維資料異常值檢測的挑戰有哪些?

Ginni
更新於 2022年2月18日 10:32:37

530 瀏覽量

高維資料異常值檢測的各種挑戰如下:異常值的解釋 - 他們必須能夠不僅識別異常值,而且還能支援對異常值的解釋。因為高維資料集包含多個特徵(或維度),所以識別異常值而不支援關於它們為什麼是異常值的解釋並沒有多大幫助。異常值的解釋可以來自顯示異常值的特定子空間或關於物件“異常性”的評估。這種解釋可以幫助使用者瞭解異常值的可能含義和重要性。資料稀疏性 -…… 閱讀更多

異常值檢測的方法有哪些?

Ginni
更新於 2022年2月18日 10:30:11

13K+ 瀏覽量

異常值檢測的各種方法如下:監督方法 - 監督方法模擬資料正態性和異常性。領域專業人員測試和標記基本資料樣本。異常值檢測可以建模為分類問題。這項服務是為了理解可以識別異常值的分類器。該樣本可用於訓練和測試。在各種應用中,專業人員只能標記正常物件,並且一些與正常物件模型不相關的物件被記錄為異常值。有不同的方法對異常值進行建模,並考慮與異常值模型不相關的物件…… 閱讀更多

異常值檢測的挑戰有哪些?

Ginni
更新於 2022年2月18日 10:28:33

2K+ 瀏覽量

異常值是一個與其餘物件本質上不同的資料物件,就好像它是由不同的機制產生的。為方便起見,可以將不是異常值的資料物件定義為“正常”或預期資訊。同樣,可以將異常值定義為“異常”資料。異常值是無法組合到給定類別或叢集中的資料元件。這些資料物件的行為與其他資料物件的通常行為有所不同。這種資料的分析對於挖掘知識可能很重要。異常值檢測的各種挑戰…… 閱讀更多

資料探勘中異常值的型別有哪些?

Ginni
更新於 2022年2月18日 10:26:01

841 瀏覽量

資料探勘中存在各種型別的異常值,如下所示:全域性異常值 - 在給定的資料集中,如果資料物件與其餘資訊集本質上不同,則它是一個全域性異常值。全域性異常值稱為點異常,是最容易識別的異常值型別。大多數異常值檢測方法旨在發現全域性異常值。為了識別全域性異常值,一個重要的問題是發現關於所討論的應用程式的適當偏差度量。已經提出了幾種度量,並且根據這些度量,異常值檢測方法被劃分為多個類別。全域性…… 閱讀更多

什麼是異常值?

Ginni
更新於 2022年2月18日 10:24:01

2K+ 瀏覽量

異常值是一個與其餘物件本質上不同的資料物件,就好像它是由不同的機制產生的。為方便起見,可以將不是異常值的資料物件定義為“正常”或預期資訊。通常,可以將異常值定義為“異常”資料。異常值是無法組合到給定類別或叢集中的資料元件。這些資料物件的行為與其他資料物件的通常行為有所不同。這種資料的分析對於挖掘知識可能很重要。異常值不同於噪聲資訊。噪聲…… 閱讀更多

帶約束的聚類方法有哪些?

Ginni
更新於 2022年2月18日 10:19:33

589 瀏覽量

處理特定約束需要多種技術。處理硬約束和軟約束的一般原則如下:處理硬約束——處理困難約束的一種常用方法是在聚類分配過程中嚴格遵守約束。給定一個數據集和一組關於示例的約束(即,必須連結或不能連結約束),我們如何改進k-means方法以滿足這些約束?COP-kmeans演算法的工作原理如下:為必須連結約束生成超級例項——它可以計算必須連結約束的傳遞閉包。因此,所有必須連結約束……閱讀更多

廣告
© . All rights reserved.