如何使用Tensorflow和Estimator在泰坦尼克號資料集上找到ROC曲線?


Tensorflow 和 Estimator 可以藉助於 'sklearn.metrics' 包中的 'roc_curve' 函式在泰坦尼克號資料集上找到 ROC 曲線。'plot' 方法繪製資料,'show' 方法用於在控制檯上顯示此繪圖。

閱讀更多: 什麼是 TensorFlow 以及 Keras 如何與 TensorFlow 協作建立神經網路?

我們將使用 Keras Sequential API,它有助於構建一個用於處理層級堆疊的順序模型,其中每一層都只有一個輸入張量和一個輸出張量。

包含至少一層卷積層的神經網路稱為卷積神經網路。我們可以使用卷積神經網路構建學習模型。

我們正在使用 Google Colaboratory 來執行以下程式碼。Google Colab 或 Colaboratory 幫助在瀏覽器上執行 Python 程式碼,無需任何配置,並且可以免費訪問 GPU(圖形處理單元)。Colaboratory 建立在 Jupyter Notebook 之上。

Estimator 是 TensorFlow 對完整模型的高階表示。它旨在實現輕鬆擴充套件和非同步訓練。我們將使用 tf.estimator API 訓練一個邏輯迴歸模型。該模型用作其他演算法的基線。我們使用泰坦尼克號資料集,目標是根據性別、年齡、等級等特徵預測乘客的生存情況。

Estimator 使用特徵列來描述模型如何解釋原始輸入特徵。Estimator 期望一個數值輸入向量,特徵列將有助於描述模型應該如何轉換資料集中每個特徵。

示例

print("Trade off between true positive rate and false positive rate")
from sklearn.metrics import roc_curve
fpr, tpr, _ = roc_curve(y_eval, probs)
plt.plot(fpr, tpr)
plt.title('ROC curve')
plt.xlabel('false positive rate')
plt.ylabel('true positive rate')
plt.xlim(0,)
plt.ylim(0,)
plt.show()

程式碼來源 −https://www.tensorflow.org/tutorials/estimator/boosted_trees

輸出

解釋

  • 接收者操作特徵(ROC)曲線可用於視覺化資料。

  • 這有助於瞭解真陽性率和假陽性率之間的權衡。

更新於: 2021年2月25日

308 次檢視

開啟你的職業生涯

透過完成課程獲得認證

立即開始
廣告

© . All rights reserved.