版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:安徽大学计算智能与信号处理教育部重点实验室合肥230601 安徽大学人工智能研究所合肥230601
出 版 物:《小型微型计算机系统》 (Journal of Chinese Computer Systems)
年 卷 期:2014年第35卷第11期
页 面:2511-2514页
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金项目(61073117 61175046)资助 安徽省教育厅基金项目(kJ2013A016)资助 安徽大学研究生学术创新项目(10117700183)资助
摘 要:多示例学习是一种新型的机器学习框架,正包中大量的噪声使多示例数据集具有很大的歧义性.为了排除多示例数据集正包中大量的假正例,提高分类精度,结合邻域覆盖算法,提出一个新的多示例包层次覆盖k近邻算法.覆盖算法的学习结果是一系列的球形邻域,在每一个球形邻域中只含有同类样本,本文利用的覆盖算法的这一特性重新组织多示例数据集的包结构.概括的说,为了排除正包中大量的假正例,首先对原有的多示例包结构进行重新构造,使用覆盖算法生成的球形邻域做为新的包结构,从而提高多示例样本在新的特征空间中的可分离性.然后,使用包层次的k近邻算法排除正包中大量的噪声并预测测试包的类别.实验表明,多示例学习的包层次覆盖k近邻算法具有很好的性能.