针对半监督软件缺陷预测中的类不平衡以及特征中含有过多无关特征和冗余特征的问题,提出一种改进的半监督集成软件缺陷预测方法 Fe SSTri(semi-supervised software prediction using Feature Selecting and Sample and Tri-training)....
详细信息
针对半监督软件缺陷预测中的类不平衡以及特征中含有过多无关特征和冗余特征的问题,提出一种改进的半监督集成软件缺陷预测方法 Fe SSTri(semi-supervised software prediction using Feature Selecting and Sample and Tri-training).首先使用ADASYN自适应综合过采样算法对部分标记样本进行采样,来解决数据集类不平衡问题;其次利用采样后的数据构建分类器,给未标记数据做预标记,将标记样本与预标记样本结合,使用最小冗余最大相关mRMR算法对数据集进行特征选择,解决无关特征过多和特征冗余问题,最后使用半监督集成算法Tri-training构建最终的半监督缺陷预测模型.本文在NASA数据集和AEEEM数据集上以F1值为评测指标对提出的模型进行了验证.实验结果表明:Fe SSTri方法要优于初始的Tri-training算法,并且与经典的机器学习方法相比,Fe SSTri方法均可以取得更好的预测结果.
云任务调度作为云计算体系的一个重要组成部分,其调度策略的效果直接影响到云平台资源利用率及用户服务质量。为解决当前云调度策略中Min-Min算法和Ma-Min算法容易因云任务分布导致负载不均衡、资源综合使用率低和任务总体完成时间较大等问题,提出一种基于三支决策的云任务调度优化算法(Cloud Task Scheduling Algorithm based on three-Way Decision,CTSA-3WD)。根据云任务的执行时间和计算资源的实际情况来标定任务集合中的轻负载任务和重负载任务。借鉴三支决策基本思想,根据两种任务在其任务集合中所占比例进行三支划分,有针对性地对划分后的3个任务集合设计合适的调度策略:针对轻负载任务占比高的任务集合,使用Max-Min算法;针对重负载任务占比高的任务集合,使用Min-Min算法;针对轻重负载任务接近的任务集合,采用基于Min-Min和Max-Min的改进任务调度算法。对分配完毕的节点中的关键资源进行重新调度,在满足总体完成时间减少的前提下选择最匹配的任务分配给轻负载资源。CloudSim仿真平台的实验结果表明,所提出的云任务调度优化算法(CTSA-3WD)相比Min-Min,Max-Min及选择调度算法可以有效提高整体资源利用率,提升了用户的服务质量,同时也使得整个系统中的资源达到更好的负载均衡水平。
暂无评论