咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向众包数据清洗的主动学习技术 收藏

面向众包数据清洗的主动学习技术

Active Learning Approach for Crowdsourcing-enhanced Data Cleaning

作     者:叶晨 王宏志 高宏 李建中 YE Chen;WANG Hong-Zhi;GAO Hong;LI Jian-Zhong

作者机构:哈尔滨工业大学计算机科学与技术学院黑龙江哈尔滨150001 

出 版 物:《软件学报》 (Journal of Software)

年 卷 期:2020年第31卷第4期

页      面:1162-1172页

核心收录:

学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金(U1509216,U1866602,61472099,61602129) 国家重点研发计划(2016YFB1000703) 黑龙江省留学归国人员科学基金(LC2016026) 

主  题:众包 数据清洗 主动学习 机器学习 领域专家 

摘      要:传统方法多数采用机器学习算法对数据进行清洗.这些方法虽然能够解决部分问题,但存在计算难度大、缺乏充足的知识等局限性.近年来,随着众包平台的兴起,越来越多的研究将众包引入数据清洗过程,通过众包来提供机器学习所需要的知识.由于众包的有偿性,研究如何将机器学习算法与众包有效且低成本结合在一起是必要的.提出了两种支持基于众包的数据清洗的主动学习模型,通过主动学习技术来减少众包开销,实现了对给定的数据集基于真实众包平台的数据清洗,最大程度减少成本的同时提高了数据的质量.在真实数据集上的实验结果验证了所提模型的有效性.

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分