安全风险管理是保障安全的核心任务,传统识别安全风险的方法已经不能满足智能化发展的需求。关系抽取是安全风险识别的方法之一,研究关系抽取对安全风险管理具有重要意义。尽管现有的模型已经取得了较好的性能,但是大多数现有的关系抽取模型忽略了领域实体表征不足的问题,并且数据中存在较多不相关信息。针对该问题,提出了一个基于多视角IB(Information Bottleneck)的安全风险关系抽取模型MIBRE(Multi-view Information Bottleneck for Relation Extraction),它通过融合多视角语义信息来达到增强领域实体语义的目的。这两个视角分别是文本视角和图像视角。为了最大化获取两个视角之间的相关信息,基于信息瓶颈方法构造了一个目标函数,在压缩两个视角信息的同时最大化地保留了相关信息。在两个真实的铁路领域数据集上的实验表明,MIBRE识别的F1值分别达到了64.28%和74.34%,相较于基于异构图的LGGCN模型F1值分别提升了4.41%和2.98%,相较于基于注意力机制的TDGAT模型F1值分别提升了1.89%和1.53%。实验结果验证了所提模型在安全风险识别上的有效性。
针对谱聚类在尺度参数计算时需要人为设置近邻参数及聚类结果不稳定等问题,本文将初始类中心值和尺度参数作为决策变量,重点对谱聚类算法进行自适应优化与改进。首先,将样本邻域标准差的倒数作为度量样本局部密度的参数,与密度峰值思想相结合,设计了一种基于密度峰值的初始类中心决策值选择方法(initial class center decision value algorithm based on density peak,DP_KD),解决密度调整谱聚类中聚类结果不稳定的问题。其次,利用样本间的平均距离计算相应的邻域半径,并根据样本标准差自适应地求解每个样本的尺度参数,构造样本间的相似度矩阵,实现了近邻参数的自适应设置,解决尺度参数需要人为设置的问题。然后,基于优化后的初始类中心决策值和近邻参数方法,进一步调整高斯核函数,提出一种基于邻域标准差的密度调整谱聚类算法(density adjusted spectral clustering algorithm based on neighborhood standard deviation,DSSD),通过构建特征向量空间实现了密度谱聚类。最后,将提出的算法与其他聚类算法在多个数据集上进行了对比。结果表明,与其他谱聚类算法相比,本文提出的DSSD算法不仅具有更好的聚类效果,且聚类结果更加稳定,尤其是在类内密集且类间边缘明确的DIM512数据集中,DSSD算法可以正确地进行聚类分簇;在准确率、兰德系数和F-measure上较其他算法至少提升了0.0268、0.0136和0.0247,这表明DSSD算法不仅聚类效果较好且更适合大规模数据集的聚类分析。
暂无评论