版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者单位:华中科技大学
学位级别:硕士
导师姓名:欧阳红兵
授予年度:2022年
学科分类:120202[管理学-企业管理(含:财务管理、市场营销、人力资源管理)] 12[管理学] 02[经济学] 0202[经济学-应用经济学] 1202[管理学-工商管理] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 020204[经济学-金融学(含∶保险学)]
主 题:财务危机预警模型 机器学习 集成学习 Stacking模型
摘 要:近年来,我国市场竞争不断加剧,企业内外部经营情况不确定性增加,一些企业隐藏问题暴露并逐步发展成财务危机,甚至导致破产、退市,投资者、债权人等利益相关者蒙受巨大损失。然而财务危机的形成是个循序渐进的过程,这使得提前识别财务危机是有可能的。自上世纪30年代开始,公司财务危机预警逐渐得到学者们的重视,并且随时时间的推移,科技水平进步,研究公司财务危机预警模型的手段也越来越多样,从单变量模型、多变量模型发展到概率函数类模型以及现在的伴随人工智能发展诞生的机器学习。机器学习在处理多维度、多噪音、非线性的金融数据方面有独特的优势,从上世纪90年代开始应用于财务危机预警模型,但对国内外研究现状进行梳理发现,以往学者的研究大多注重单一模型的优化和预测,多个学习器融合构建财务危机预警模型的研究较少,基于此本文尝试运用能够堆叠多个异质学习器的Stacking多算法融合模型来构建财务危机预警模型。本文以中国A股所有上市公司为研究对象,把上市公司的股票首次被沪深交易所标记ST(Special Treatment)作为发生财务危机的标志,首先对收集的数据进行数据预处理和特征筛选,建立了包含盈利能力、经营能力、发展能力、偿债能力、风险水平这五类财务指标和以及行业分类、内部治理、市场表现这三类非财务指标的财务危机预警指标体系,共8个方面22个维度。在数据为字符问题上,本文采用哑变量处理。在数据平衡处理方面,本文采取SMOTETomek综合采样法,即SMOTE过采样和Tomeklink欠采样相结合的方法对样本数据进行平衡。接着进行模型构建,按照7:3的比例划分训练集和测试集,采用逻辑回归、决策树、支持向量机这三种单一算法和随机森林、GBDT、XGBoost这三种集成学习进行建模和预测,通过准确率、精确率、召回率、F1值、AUC值和ROC曲线来评估五个模型的预测效果。最后将表现优异的模型进行Stacking堆叠融合,观察预测效果并利用第一层模型的特征重要性来找出可能导致公司出现财务危机的重要因素。研究结果表明,在单独使用一个算法进行建模预测时,集成学习算法在模型评价各个指标上都表现出色,其中XGBoost在准确率、精准率、召回率、F1值方面表现最优,随机森林在AUC值上最优,三种单一算法模型的预测性能虽然不如集成学习模型,但准确率等指标依然大于0.8,预测性能也较为优秀。将表现优异的决策树、支持向量机、随机森林、GBDT、XGBoost进行Stacking堆叠融合,融合后的模型在预测性能的各个方面相较于单独使用一个算法有0.0018~0.0103的提升,说明基于Stacking多算法堆叠模型构建的上市公司财务危机预警模型具有较强的可行性。随机森林、GBDT、XGBoost的特征重要性显示,盈利指标中的总资产净利润率和净资产收益率,发展能力指标中的总资产增长率以及非财务指标中的行业分类对结果影响较大,投资者、债权人、经营者等利益相关者在构建财务危机预警系统时应重点关注这些指标。