什麼是資料傾斜?(症狀、如何預防)


什麼是資料傾斜?

在傾斜攻擊中,攻擊者試圖偽造(或傾斜)資料以影響組織對其有利的決策。傾斜攻擊可分為兩種型別:

  • 機器學習資料投毒攻擊 − 當攻擊者更改機器學習演算法使用的訓練資料時,就會發生這種情況,導致演算法出錯。

  • 網路分析傾斜 − 攻擊者透過部署機器人發出大量自動查詢來操縱來自 Google Analytics 或 Adobe Analytics 等系統的分析資料。目標是使其看起來好像網站訪問者比實際情況更頻繁地完成特定操作。

網路分析傾斜是如何工作的?

典型的網路分析傾斜攻擊是這樣的:

  • 攻擊者使用機器人發出自動 HTTP 請求,以增加對特定頁面的訪問次數。這些通常是具有交易價值的頁面,例如電子商務產品頁面。

  • 網路分析系統記錄了大量的點選次數,網站所有者認為對該商品有很大的興趣。

  • 在某些情況下,傾斜機器人會嘗試執行轉換操作,例如填寫表單或進行購買。這需要一個更高階的機器人框架,類似於搶票機器人使用的框架。

偽造的分析資料可能會導致商業決策,例如網站所有者更突出地推廣產品或將其包含在廣告活動中。由於攻擊者是目標頁面上推廣產品的附屬機構,因此商業決策對他們有利。

傾斜的後果是什麼?

資料用於做出關鍵的業務決策,例如安全事件分類、網站改版成功或失敗、營銷甚至產品定價。如果資料不準確,則基於該資料做出的決策也將不準確,從而損害公司所有者的利益。

以下是一些可能受傾斜影響的不良業務決策示例:

  • 將垃圾郵件或重複登入嘗試錯誤分類為有效。

  • 例如,在大型電子商務公司中,在 A/B 測試中選擇錯誤的設計可能會導致巨大的經濟損失。

  • 做出不準確的自動判斷,例如錯誤地向某人授予信用評級

  • 例如,透過錯誤計算廣告的質量得分,降低主要廣告商的每次點選付費廣告成本

  • 根據產品頁面點選次數或轉化活動過度補償聯盟或合作伙伴

傾斜嘗試的症狀

注意網站流量或應用程式使用情況中的以下傾斜情況,並調查它們以確定它們是否與傾斜相關:

  • 異常的流量峰值

  • 某些使用者群的異常增加

  • 異常高的頁面數量或每次會話花費的時間

  • 跳出率非常高。

  • 在程式中,異常的使用者行為

  • 異常使用會影響安全或花費金錢的產品或網站功能

預防傾斜攻擊

為幫助防止網站上的傾斜,請使用以下建議的實踐:

  • 雖然經驗豐富的攻擊者可能會在其 HTTP 標頭中使用現代瀏覽器和使用者代理,但許多“指令碼小子”部署的機器人基於過時的瀏覽器。您可以完全禁止這些過時的瀏覽器版本或使用嚴格的 CAPTCHA,而不會冒著擾亂許多真實使用者的風險。

  • 阻止已知的惡意主機和代理。編譯已知惡意主機和代理網路的列表。允許來自此類來源的訪問可能會阻止攻擊者試圖歪曲您的網站、API 或移動應用程式。請記住,攻擊者可以使用更強大的匿名化技術,例如住宅代理。

  • 考慮機器人可能透過網際網路連線到您的系統的多種方式,在您的網站之外,以保護容易受到機器人攻擊的訪問點。API、移動應用程式以及任何其他面向公眾的端點都應受到保護。當您發現並禁止機器人時,請確保在所有端點上釋出此資訊。

  • 檢查流量來源。定期檢視分析或模型訓練資料,深入研究並查詢具有獨特特徵的細分市場。如果您找到一個,請進一步調查以檢視它是否包含機器人建立的資料。調查使用量的峰值——如果您的網站或應用程式的使用量突然增加,請調查哪些功能受到影響。

如果您能夠將整個激增追溯到單個流量來源、使用者組或功能,則表示您正在處理傾斜攻擊。

檢測到傾斜攻擊後,請採取以下步驟來預防它們:

  • 在您的網路分析中過濾掉有害來源。

  • 在網路分析中阻止有害 IP。

  • 檢查防火牆日誌中與異常分析資料相關的有害機器人流量,然後設定防火牆以阻止它。

更新於:2022年6月2日

354 次檢視

啟動您的職業生涯

完成課程獲得認證

開始
廣告