文獻(xiàn)標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.201234
中文引用格式: 張露,劉家鵬,,江敏祺. 集成機(jī)器學(xué)習(xí)模型在不平衡樣本財(cái)務(wù)預(yù)警中的應(yīng)用[J].電子技術(shù)應(yīng)用,,2021,47(8):34-38.
英文引用格式: Zhang Lu,,Liu Jiapeng,,Jiang Minqi. The application of the integrated machine learning model in the financial crisis of imbalanced sample[J]. Application of Electronic Technique,2021,,47(8):34-38.
0 引言
進(jìn)入大數(shù)據(jù)時(shí)代以來,,對信息的敏感程度和預(yù)測能力變得尤為重要,,而對企業(yè)而言,無論是在經(jīng)營活動(dòng)還是投資活動(dòng)中,,財(cái)務(wù)危機(jī)預(yù)警一直是個(gè)問題和難題,。機(jī)器學(xué)習(xí)的興起為大數(shù)據(jù)的處理和應(yīng)用提供了新的方式。
目前,,許多學(xué)者將機(jī)器學(xué)習(xí)與金融危機(jī)預(yù)警相結(jié)合,,取得了重大突破。OHLSON J A[1]建議將邏輯回歸應(yīng)用于分類的后概率,,來估計(jì)公司的破產(chǎn)概率,。Zou Hui和HASTIE T[2]提出了彈性網(wǎng)絡(luò),克服了嶺回歸和Lasso的缺點(diǎn)[3],。決策樹學(xué)習(xí)是一種強(qiáng)大的分類器[4],,在樹分類器的基礎(chǔ)上,有學(xué)者提出了隨機(jī)森林[5]和XGBoost[6],,在計(jì)算機(jī)[7],、圖像分類[8]等領(lǐng)域被證明有效。
但在過去的研究中,,大多采用人工設(shè)定樣本量,,而忽視了實(shí)際上財(cái)務(wù)預(yù)警企業(yè)與正常企業(yè)的數(shù)量對比的懸殊[9]。數(shù)據(jù)不平衡的問題是財(cái)務(wù)預(yù)警研究領(lǐng)域的難題[10],。VEGANZONES D和SEVERIN E[11]提出采樣技術(shù)可用于提高不平衡樣本預(yù)測的分類器性能,,隨機(jī)上采樣技術(shù)[12]、隨機(jī)下采樣技術(shù)[13]和人工合成少數(shù)抽樣技術(shù)(SMOTE)[14]的應(yīng)用解決了集成復(fù)雜分類器在不平衡的財(cái)務(wù)預(yù)警研究數(shù)據(jù)中失效的問題,。而集成學(xué)習(xí)機(jī)制可以通過集成不同的模型來整合多種算法的優(yōu)點(diǎn)[15],,目前在個(gè)人信貸領(lǐng)域已經(jīng)有了一定的應(yīng)用[16]。
本文詳細(xì)內(nèi)容請下載:http://wldgj.com/resource/share/2000003695,。
作者信息:
張 露1,,劉家鵬1,江敏祺2
(1.中國計(jì)量大學(xué) 經(jīng)濟(jì)與管理學(xué)院,,浙江 杭州310018,;2.上海財(cái)經(jīng)大學(xué) 信息管理與工程學(xué)院,,上海200000)