咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >一种基于欠采样的不平衡数据分类算法 收藏

一种基于欠采样的不平衡数据分类算法

Imbalanced Data Classification Algorithm Based on Undersampling

作     者:程险峰 李军 李雄飞 CHENG Xian-feng;LI Jun;LI Xiong-fei

作者机构:长春市公安局交通警察支队长春130011 长春理工大学数学系长春130022 吉林大学符号计算与知识工程教育部重点实验室长春130012 

出 版 物:《计算机工程》 (Computer Engineering)

年 卷 期:2011年第37卷第13期

页      面:147-149页

核心收录:

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家科技支撑计划基金资助项目(2006BAK01A33) 公安部重点科研基金资助项目(B类)(20032252001) 吉林省科技发展计划基金资助项目(20070321 20090704) 

主  题:机器学习 分类算法 不平衡数据 欠采样 邻域 

摘      要:针对不平衡数据学习问题,提出一种基于欠采样的分类算法。对多数类样例进行欠采样,保留位于分类边界附近的多数类样例。以AUC为优化目标,选择最恰当的邻域半径使数据达到平衡,利用欠采样后的样例训练贝叶斯分类器,并采用AUC评价分类器性能。仿真数据及UCI数据集上的实验结果表明,该算法有效。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分