分類與迴歸的區別


在資料探勘中,存在兩個主要的預測問題,即分類迴歸。分類和迴歸之間最基本的區別在於,分類演算法用於分析離散值,而回歸演算法則分析連續的實數值。

輸出變數必須是連續的或實數值。分類中的輸出變數必須是離散值。相反,迴歸中的輸出變數必須是連續的或實數值。

在本文中,我們將討論分類和迴歸之間所有重要的差異。讓我們從分類和迴歸的一些基礎知識開始,以便更容易理解它們彼此之間的區別。

什麼是分類?

分類是尋找一個模型的過程,該模型表示並區分資料類或概念,目的是能夠使用該模型來預測類標籤未知的物件的類別。派生的模型基於對一組訓練記錄的分析,即類標籤已知的數 據物件。

分類是資料探勘中最重要的概念之一,因為它定義了一個根據例項的屬性為其分配預定義類標籤的過程。分類是一種預先確定的方法,可以使對大型資料集的分析更有效。

什麼是迴歸?

迴歸是一種監督機器學習方法,可用於預測任何連續值的屬性。迴歸使一些商業組織能夠探索目標變數和預測變數之間的關聯。因此,迴歸是探索可用於貨幣預測和時間序列建模的資料的重要工具之一。

我們可以使用迴歸來執行分類。為此,它使用兩種方法,即劃分預測。在劃分的情況下,資料被劃分為位於類上的區域,而在預測中,使用一些公式來預測類的輸出值。

迴歸可以預測一些相關的依賴資料集。迴歸還支援預測變數的方法,但存在某些限制和假設,例如變數的獨立性、變數的固有正態分佈等。

分類與迴歸的區別

下表突出顯示了分類和迴歸之間所有重要的差異 -

分類 迴歸
分類輸出離散值。 迴歸輸出連續值。
給定一組資料,此方法有助於將資料分組到不同的組中。 它使用對映函式將值對映到連續輸出。
在分類中,預測資料的性質是無序的。 迴歸具有有序的預測資料。
對映函式用於將值對映到預定義的類。 它試圖找到最佳擬合線。它試圖外推圖形以查詢/預測值。
示例包括決策樹、邏輯迴歸。 示例包括迴歸樹(隨機森林)、線性迴歸
分類透過測量準確性來完成。 迴歸使用均方根誤差方法完成。

結論

分類和迴歸之間最顯著的區別在於,分類提供了一個預測模型,該模型藉助歷史資料以離散標籤預測新資料,而回歸則以連續值預測資料。

更新於:2022-12-20

12K+ 瀏覽量

開啟你的 職業生涯

透過完成課程獲得認證

開始學習
廣告

© . All rights reserved.