Python中的邏輯迴歸 - 測試

在我們投入生產使用之前，需要測試上面建立的分類器。如果測試結果表明模型未達到所需的準確率，則需要返回上述過程，選擇另一組特徵（資料欄位），重新構建模型並進行測試。這將是一個迭代步驟，直到分類器滿足您所需的準確率要求。因此，讓我們測試我們的分類器。

預測測試資料

為了測試分類器，我們使用在早期階段生成的測試資料。我們對建立的物件呼叫predict方法，並傳遞測試資料的X陣列，如下面的命令所示：

In [24]: predicted_y = classifier.predict(X_test)

這將為整個訓練資料集生成一個一維陣列，給出X陣列中每一行的預測結果。您可以使用以下命令檢查此陣列：

In [25]: predicted_y

以下是執行上述兩個命令後的輸出：

Out[25]: array([0, 0, 0, ..., 0, 0, 0])

輸出表明，前三位和最後三位客戶不是定期存款的潛在候選人。您可以檢查整個陣列以篩選出潛在客戶。為此，請使用以下Python程式碼片段：

In [26]: for x in range(len(predicted_y)):
   if (predicted_y[x] == 1):
      print(x, end="\t")

執行上述程式碼的輸出如下所示：

輸出顯示了所有可能成為訂閱TD候選人的行的索引。您現在可以將此輸出提供給銀行的營銷團隊，他們將獲取所選行中每個客戶的聯絡方式，並繼續執行他們的工作。

在我們投入生產使用此模型之前，我們需要驗證預測的準確性。

要測試模型的準確性，請在分類器上使用score方法，如下所示：

In [27]: print('Accuracy: {:.2f}'.format(classifier.score(X_test, Y_test)))

執行此命令的螢幕輸出如下所示：

Accuracy: 0.90

它表明我們模型的準確率為90%，這在大多數應用程式中被認為是非常好的。因此，不需要進一步調整。現在，我們的客戶已準備好執行下一輪活動，獲取潛在客戶列表，並追逐他們開立TD，從而獲得很高的成功率。

列印頁面