什麼是ROC曲線?
ROC代表接受者操作特徵曲線(Receiver Operating Characteristic)。ROC曲線是分析兩個分類模型的便捷視覺化工具。ROC曲線起源於二戰期間為搜尋雷達影像而產生的訊號檢測理論。
ROC曲線顯示了給定模型的真陽性率或靈敏度(識別出的陽性元組的比例)與假陽性率(錯誤地將陰性元組識別為陽性元組的比例)之間的權衡。
在給定的二元分類問題中,它使我們能夠預測模型準確識別“是”案例的比率與它錯誤地將“否”案例識別為“是”案例的比率之間的權衡,這適用於測試集的多個“部分”。真陽性率的增加伴隨著假陽性率的增加。ROC曲線下的面積是模型準確性的評估指標。
對於給定的分類模型M,要繪製ROC曲線,該模型應該能夠返回每個測試元組的預測類別的機率或排序。需要按降序排列測試元組,其中分類器認為通常屬於陽性或“是”類的元組位於列表頂部。
樸素貝葉斯和反向傳播分類器是合適的,而包括決策樹分類器,可以簡單地修改以針對每個預測返回類機率分佈。ROC曲線的縱軸定義了真陽性率。橫軸定義了假陽性率。M的ROC曲線繪製如下。
它從左下角開始(真陽性率和假陽性率均為0),可以測試列表中第一個元組的實際類別標籤。如果它是真陽性(即正確識別的陽性元組),則在ROC曲線上,它可以向上移動並繪製一個點。
它顯示了兩個分類模型的ROC曲線。該圖還顯示了一條對角線,對於該模型的每個真陽性,通常會遇到一個假陽性。
因此,模型的ROC曲線越接近對角線,模型的效率越低。如果模型是最佳的,則當它向下移動排序列表時,它可能會遇到真陽性。因此,曲線可以從零點陡峭地上升。隨後,當它開始遇到越來越少的真陽性和越來越多的假陽性時,曲線趨於平緩。
廣告
資料結構
網路
關係資料庫管理系統 (RDBMS)
作業系統
Java
iOS
HTML
CSS
Android
Python
C語言程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP