如何計算邏輯迴歸的預測精度?


邏輯迴歸是一種統計方法,用於檢查因變數和一個或多個自變數之間的關係。當因變數是二元的(即僅取兩個值)時,它是一種常用於分類任務的迴歸分析形式。邏輯迴歸的目的是找到自變數與因變數取特定值的機率之間的關係。

由於它使我們能夠根據自變數的值預測事件發生的機率,因此邏輯迴歸是資料分析和機器學習中一個重要的工具。它通常用於需要預測結果的行業,包括醫療保健、金融和營銷。

邏輯迴歸模型對結果預測的準確性是衡量模型效能的關鍵指標。準確率得分顯示所有預測中正確預測的比例。準確率得分越高,模型的預測越準確;反之,準確率得分越低,模型的預測越不準確。在這篇文章中,我們將瞭解如何評估邏輯迴歸的預測準確性。

計算邏輯迴歸的預測精度

這是一個使用 scikit-learn 模組根據真實資料集確定邏輯迴歸預測精度的 Python 程式示例:

要計算邏輯迴歸的預測精度,我們將遵循以下步驟:

  • 首先,我們將從 sklearn 匯入所有必要的模組。

  • 然後我們將載入資料集。

  • 將資料分成訓練集和測試集。

  • 然後,我們將建立一個邏輯迴歸模型。

  • 最後,我們將預測測試集的準確性。

在這個例子中,我們首先使用 scikit-learn 的 load_breast_cancer 方法載入乳腺癌資料集。然後,我們使用 train_test_split 函式將資料集分成訓練集和測試集。下一步是使用 LogisticRegression 類生成一個邏輯迴歸模型,然後使用 fit 方法將其擬合到訓練資料集。然後,透過使用 scikit-learn 的 accuracy_score 函式對測試資料進行預測,並利用 predict 方法生成預測結果來確定預測精度。最後,我們在控制檯中輸出預測精度。

示例

# Import necessary libraries
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score

# Load the breast cancer dataset
data = load_breast_cancer()

# Split the dataset into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(data.data, data.target, test_size=0.3, random_state=42)

# Create a logistic regression model
lr = LogisticRegression()

# Fit the model on the training data
lr.fit(X_train, y_train)

# Make predictions on the testing data
y_pred = lr.predict(X_test)

# Calculate the prediction accuracy
accuracy = accuracy_score(y_test, y_pred)

# Print the prediction accuracy
print("Prediction Accuracy:", accuracy)

輸出

Prediction Accuracy: 0.9707602339181286

結論

總之,預測精度是確定邏輯迴歸模型效能的關鍵因素。準確率得分表示模型做出的預測中正確預測的比例。更高的準確率得分表示模型預測更準確,而更低的得分表示模型預測更不準確。

更新於:2023年4月25日

3000+ 次瀏覽

開啟您的職業生涯

透過完成課程獲得認證

開始學習
廣告