如何計算邏輯迴歸的預測精度？

機器學習 Python 資料分析

邏輯迴歸是一種統計方法，用於檢查因變數和一個或多個自變數之間的關係。當因變數是二元的（即僅取兩個值）時，它是一種常用於分類任務的迴歸分析形式。邏輯迴歸的目的是找到自變數與因變數取特定值的機率之間的關係。

由於它使我們能夠根據自變數的值預測事件發生的機率，因此邏輯迴歸是資料分析和機器學習中一個重要的工具。它通常用於需要預測結果的行業，包括醫療保健、金融和營銷。

邏輯迴歸模型對結果預測的準確性是衡量模型效能的關鍵指標。準確率得分顯示所有預測中正確預測的比例。準確率得分越高，模型的預測越準確；反之，準確率得分越低，模型的預測越不準確。在這篇文章中，我們將瞭解如何評估邏輯迴歸的預測準確性。

計算邏輯迴歸的預測精度

這是一個使用 scikit-learn 模組根據真實資料集確定邏輯迴歸預測精度的 Python 程式示例：

要計算邏輯迴歸的預測精度，我們將遵循以下步驟：

首先，我們將從 sklearn 匯入所有必要的模組。
然後我們將載入資料集。
將資料分成訓練集和測試集。
然後，我們將建立一個邏輯迴歸模型。
最後，我們將預測測試集的準確性。

在這個例子中，我們首先使用 scikit-learn 的 load_breast_cancer 方法載入乳腺癌資料集。然後，我們使用 train_test_split 函式將資料集分成訓練集和測試集。下一步是使用 LogisticRegression 類生成一個邏輯迴歸模型，然後使用 fit 方法將其擬合到訓練資料集。然後，透過使用 scikit-learn 的 accuracy_score 函式對測試資料進行預測，並利用 predict 方法生成預測結果來確定預測精度。最後，我們在控制檯中輸出預測精度。

示例

# Import necessary libraries
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score

# Load the breast cancer dataset
data = load_breast_cancer()

# Split the dataset into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(data.data, data.target, test_size=0.3, random_state=42)

# Create a logistic regression model
lr = LogisticRegression()

# Fit the model on the training data
lr.fit(X_train, y_train)

# Make predictions on the testing data
y_pred = lr.predict(X_test)

# Calculate the prediction accuracy
accuracy = accuracy_score(y_test, y_pred)

# Print the prediction accuracy
print("Prediction Accuracy:", accuracy)

輸出

Prediction Accuracy: 0.9707602339181286

結論

總之，預測精度是確定邏輯迴歸模型效能的關鍵因素。準確率得分表示模型做出的預測中正確預測的比例。更高的準確率得分表示模型預測更準確，而更低的得分表示模型預測更不準確。

Jay Singh

更新於：2023年4月25日

3000+ 次瀏覽

開啟您的職業生涯

透過完成課程獲得認證

開始學習