咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向不平衡医疗数据的多阶段混合特征选择算法 收藏

面向不平衡医疗数据的多阶段混合特征选择算法

Multi-Stage Hybrid Feature Selection Algorithm for Imbalanced Medical Data

作     者:刘佳璇 李代伟 任李娟 张海清 陈金京 杨瑞 LIU Jiaxuan;LI Daiwei;REN Lijuan;ZHANG Haiqing;CHEN Jinjing;YANG Rui

作者机构:成都信息工程大学软件工程学院成都610225 四川省信息化应用支撑软件工程技术研究中心成都610225 

出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)

年 卷 期:2025年第61卷第2期

页      面:158-169页

核心收录:

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:欧盟项目(598649-EPP-1-2018-1-FR-EPPKA2-CBHE-JP) 国家自然科学基金(61602064) 四川省科技厅项目(2021YFH0107,2022NSFSC0571) 中国气象局“揭榜挂帅”科技项目(CMAJBGS202302) 

主  题:高维不平衡 特征选择 多阶段混合 医疗数据 

摘      要:为解决医疗数据中存在的特征高维和类别不平衡问题,在基于简单、快速和有效高维特征选择算法SFE(simple,fast and effective high-dimensional feature selection)的基础上,提出了一种面向不平衡医疗数据的多阶段混合特征选择算法HFSIM(hybrid feature selection for imbalanced medical data)。HFSIM算法采用改进的自适应边界SMOTE过采样技术,生成符合边界条件的新少数类实例以解决医学数据中类不平衡问题。同时,为了改善搜索空间多样性不足的问题,优化了SFE算法中的非选择操作符率参数UR(unselected rate),有效避免了算法过早收敛及易陷入局部最优的问题。将过滤式Fisher Score方法与优化UR参数后的算法有效结合,使算法能以较低的计算成本获得较好寻优能力。经实验验证,相比于SFE算法,HFSIM算法在Ovarian数据集上准确率达到99.67%,提升了2.11个百分点,G-means和F1分别提升了5.13和2.30个百分点。此外,通过对比特征数量和运行时间,证明了HFSIM算法既能保证算法精度又有效降低了计算成本。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分