如何利用判別分析預測公司的實力?
什麼是判別分析?
判別分析是機器學習、統計學和金融學中廣泛使用的工具。它是一種根據某些假設對目標進行分類,然後利用這些分類來預測過程未來走向的方法。顯然,由於投資者和分析師希望預測公司未來的實力,因此該工具對他們至關重要。
判別分析依賴於連續的獨立變數來形成模式,該模式顯示兩個引數之間的關係或可能滿足資料集關係的預測方程。然後,這些方程用於對因變數進行分類。
當資料被分成兩組時,稱為DFA(判別函式分析)。當資料被分成兩組以上時,該過程稱為 *多元判別分析* 或MDA。多元判別分析也稱為典範變異分析或CVA。
判別分析的假設
當滿足適用假設時,判別分析可以提供關於預測分類的極好細節。
以下是判別分析函式中的主要假設:
自變數服從正態分佈。大多數來自實際應用的變數要麼服從正態分佈,要麼傾向於服從正態分佈曲線。
假設給定類別中的方差在預測變數的水平上相似或相同。二次判別分析更適合這些假設。
但是,線性判別分析也遵循該假設。此處可以監控異常值的存在。因此,使方差穩定是一個主要需求,可以透過對數變換來滿足。
預測變數被視為獨立的。它們之間存在相關性會降低分析的效力。為了解決這個問題,可以替換或刪除變數以確保獨立性。
在分析中,樣本也被認為是獨立的。當總體很大時,這是一個合理的假設。
如何利用判別分析預測公司的實力?
當輸出類別事先已知,或者想要成功地對資料集進行分類時,就會進行判別分析。如果輸出類別事先未知,則必須進行聚類。
在下文中,將進行判別分析以預測公司的財務狀況:
制定問題
首先要找到手頭的問題。在確定公司實力的情況下,問題是該公司是會成功還是會失敗並破產。
找到問題後,必須確定自變數和結果類別。一些變數可能包括 *流動資產淨額與總資產之比、留存收益與總資產之比* 和 *息稅前利潤與總資產之比*。自變數的數量可以儘可能多。
樣本分為兩組——分析組用於估計,驗證組用於檢查結果。
尋找判別函式
判別函式寫成:
$$\mathrm{D\:=\:b0\:+\:b1X1\:+\:b2X2\:+\:\ldots+bkXk}$$
這裡,‘D’是判別分數,‘b’表示預測變數‘X’的係數。當已知‘X’時,需要估計‘b’的值。
尋找判別函式的重要性
我們從上述過程中得到的函式必須在統計上具有顯著性。為此,檢查函式的特徵值。特徵值越好,函式正確的可能性就越大。
結果解釋
重要的是要透過其係數來檢查預測變數的影響。較好的絕對標準係數值指向更好的判別。
評估有效性
現在,必須根據判別分數和一個決策規則對資料進行分類。驗證樣本分類後,應測量正確分類的百分比。這是對驗證的交叉檢查。
資料結構
網路
關係型資料庫管理系統 (RDBMS)
作業系統
Java
iOS
HTML
CSS
Android
Python
C語言程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP