咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于特征迁移和实例迁移的跨项目缺陷预测方法 收藏

基于特征迁移和实例迁移的跨项目缺陷预测方法

Cross-project Defect Prediction Method Based on Feature Transfer and Instance Transfer

作     者:倪超 陈翔 刘望舒 顾庆 黄启国 李娜 NI Chao;CHEN Xiang;LIU Wang-Shu;GU Qing;HUANG Qi-Guo;LI Na

作者机构:计算机软件新技术国家重点实验室(南京大学)江苏南京210023 南通大学计算机科学与技术学院江苏南通226019 南京工业大学计算机科学与技术学院江苏南京211816 

出 版 物:《软件学报》 (Journal of Software)

年 卷 期:2019年第30卷第5期

页      面:1308-1329页

核心收录:

学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金(61373012 61202006 91218302 61321491) 南京大学计算机软件新技术国家重点实验室开放课题(KFKT2016B18 KFKT2018B17) 江苏省自然科学基金(BK20180695) 国家建设高水平大学公派研究生项目(201806190172) 

主  题:软件质量保障 软件缺陷预测 跨项目缺陷预测 迁移学习 特征迁移 实例迁移 

摘      要:在实际软件开发中,需要进行缺陷预测的项目可能是一个新启动项目,或者这个项目的历史训练数据较为稀缺.一种解决方案是利用其他项目(即源项目)已搜集的训练数据来构建模型,并完成对当前项目(即目标项目)的预测.但不同项目的数据集间会存在较大的分布差异性.针对该问题,从特征迁移和实例迁移角度出发,提出了一种两阶段跨项目缺陷预测方法 FeCTrA.具体来说,在特征迁移阶段,该方法借助聚类分析选出源项目与目标项目之间具有高分布相似度的特征;在实例迁移阶段,该方法基于TrAdaBoost方法,借助目标项目中的少量已标注实例,从源项目中选出与这些已标注实例分布相近的实例.为了验证FeCTrA方法的有效性,选择Relink数据集和AEEEM数据集作为评测对象,以F1作为评测指标.首先,FeCTrA方法的预测性能要优于仅考虑特征迁移阶段或实例迁移阶段的单阶段方法;其次,与经典的跨项目缺陷预测方法 TCA+、Peters过滤法、Burak过滤法以及DCPDP法相比,FeCTrA方法的预测性能在Relink数据集上可以分别提升23%、7.2%、9.8%和38.2%,在AEEEM数据集上可以分别提升96.5%、108.5%、103.6%和107.9%;最后,分析了FeCTrA方法内的影响因素对预测性能的影响,从而为有效使用FeCTrA方法提供了指南.

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分