粒球邻域粗糙集(Granular Ball Neighborhood Rough Set,GBNRS)作为一种经典的属性约简方法,要求粒球的纯度严格为1,在类边界处会产生大量样本数为1的粒球.这些粒球通常被误判为离群点并剔除,导致类边界信息的丢失.为了解决此问题.文中首先定义模糊纯度函数,融合隶属度与类别标签,作为粒球质量的评价指标.此函数基于动态质量评估和优化策略,综合考虑数据点的隶属度、数据点的类标签及粒球的类标签三重信息.然后,在粒球分裂过程中,引入分类显著性阈值β,自适应调整M-means的m值,构建模糊纯度粒球生成算法.进一步地,针对粗糙集属性约简问题,设计前向属性约简算法,并提出基于模糊纯度粒球的粗糙集模型(Rough Set Model Based on Fuzzy Purity Granular Ball,FPGBRS).最后,在12个真实数据集上的实验表明,FPGBRS可提升分类精度和效率.
暂无评论