異常檢測的應用有哪些?
在異常檢測中,目標是發現與多個物件不同的物件。通常,異常物件被稱為離群值,因為在資料的散點圖上,它們遠離多個數據點。異常檢測被稱為偏差檢測,因為異常物件的屬性值與預期或一般的屬性值存在本質上的偏差,或者作為異常挖掘,因為異常在多種意義上都是異常的。
異常檢測的應用多種多樣,如下所示:
**欺詐檢測** - 持有信用卡的某人的購買行為與最初持有人的購買行為不同。信用卡公司試圖透過查看錶明盜竊的購買模式或感知與一般行為的偏差來識別盜竊。相同的方法用於不同型別的欺詐。
**入侵檢測** - 不幸的是,對計算機系統和計算機網路的攻擊很常見。雖然一些攻擊(包括旨在停用或壓倒計算機和網路的攻擊)很明顯,但其他攻擊(包括旨在秘密收集資料的攻擊)很難識別。透過觀察系統和網路中的異常行為,可以識別其中一些入侵。
**生態系統干擾** - 在現實世界中,存在一些可能對人類產生重大影響的自然事件。例如,颶風、洪水、乾旱、熱浪和火災。目標是預測這些事件發生的可能性及其原因。
**公共衛生** - 在一些國家,醫院和醫療診所將一些統計資料報告給國家機構以進行進一步分析。例如,如果一個城市的一些兒童接種了某種特定疾病(如麻疹)的疫苗,那麼在該城市的一些醫院散佈的一些病例的出現就是一個異常事件,可能表明該城市的疫苗接種計劃存在問題。
**醫學** - 對於特定患者而言,異常的症狀或檢查結果可能表明潛在的健康問題。但是,特定的檢查結果是否異常可能取決於患者的多種特徵,包括年齡和性別。此外,將結果分類為異常與否需要付出代價——如果患者是活躍的,則需要進行更多不必要的檢查,如果病情未被診斷和治療,則可能對患者造成傷害。
儘管一些當前對異常檢測的興趣是由軟體驅動的,在這些軟體中異常是目標,但從歷史上看,異常檢測一直被認為是一種增強對一般資料物件分析的技術。
例如,少量離群值可能會改變一組值的均值和標準差,或者改變聚類演算法建立的聚類集。因此,異常檢測是資料預處理的一個組成部分。
資料結構
網路
RDBMS
作業系統
Java
iOS
HTML
CSS
Android
Python
C 程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP