
Python中的邏輯迴歸 - 測試
在我們投入生產使用之前,需要測試上面建立的分類器。如果測試結果表明模型未達到所需的準確率,則需要返回上述過程,選擇另一組特徵(資料欄位),重新構建模型並進行測試。這將是一個迭代步驟,直到分類器滿足您所需的準確率要求。因此,讓我們測試我們的分類器。
預測測試資料
為了測試分類器,我們使用在早期階段生成的測試資料。我們對建立的物件呼叫predict方法,並傳遞測試資料的X陣列,如下面的命令所示:
In [24]: predicted_y = classifier.predict(X_test)
這將為整個訓練資料集生成一個一維陣列,給出X陣列中每一行的預測結果。您可以使用以下命令檢查此陣列:
In [25]: predicted_y
以下是執行上述兩個命令後的輸出:
Out[25]: array([0, 0, 0, ..., 0, 0, 0])
輸出表明,前三位和最後三位客戶不是定期存款的潛在候選人。您可以檢查整個陣列以篩選出潛在客戶。為此,請使用以下Python程式碼片段:
In [26]: for x in range(len(predicted_y)): if (predicted_y[x] == 1): print(x, end="\t")
執行上述程式碼的輸出如下所示:

輸出顯示了所有可能成為訂閱TD候選人的行的索引。您現在可以將此輸出提供給銀行的營銷團隊,他們將獲取所選行中每個客戶的聯絡方式,並繼續執行他們的工作。
在我們投入生產使用此模型之前,我們需要驗證預測的準確性。
驗證準確性
要測試模型的準確性,請在分類器上使用score方法,如下所示:
In [27]: print('Accuracy: {:.2f}'.format(classifier.score(X_test, Y_test)))
執行此命令的螢幕輸出如下所示:
Accuracy: 0.90
它表明我們模型的準確率為90%,這在大多數應用程式中被認為是非常好的。因此,不需要進一步調整。現在,我們的客戶已準備好執行下一輪活動,獲取潛在客戶列表,並追逐他們開立TD,從而獲得很高的成功率。
廣告