版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:贵州大学省部共建公共大数据国家重点实验室贵州贵阳550025
出 版 物:《贵州大学学报(自然科学版)》 (Journal of Guizhou University:Natural Sciences)
年 卷 期:2025年第42卷第1期
页 面:60-68页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金资助项目(61966005 62366008)
主 题:图半监督学习 密度峰值聚类 引领森林 高密度近邻 确定性标记
摘 要:半监督学习由于能够充分利用未标记数据而广受关注,其中图半监督学习方法具有表示直观和概念清晰的优点。然而,基于图的半监督学习方法大多需要迭代优化,且由于初始标记点的选取变化,会导致预测准确性不稳定。为了解决这一问题,提出了一种基于高密度近邻和确定性标记(high density nearest neighbors and determinate labeling,HDN-DL)的半监督分类方法,利用数据中的潜在结构和信息,选择影响力较高的节点作为标签传播的起点,通过密度峰值聚类算法(density peak clustering,DPC)得到初始的无监督聚类图结构后,将该图断开得到引领森林,再根据每个样本点的所在层次计算其高密度近邻及其相对距离,以此来综合考虑多个属性以判定当前样本的标签,避免级联误分。标签传播的过程无需迭代,复杂度为O(n)。在多个数据集上进行的实验验证了该方法的有效性和稳定性。