均值漂移属于硬划分的聚类算法,在处理不确定性数据时可能导致决策风险的提高和聚类精度的降低等问题。为此,本文引入阴影集理论来处理三支聚类的数据对象分类问题,提出了一种基于阴影集的三支核均值漂移聚类算法。算法采用类归属概率来刻画阴影集的隶属度概念。通过优化算法来获得阴影集划分的最优阈值,有效减少了人为干预带来的不确定性。最后基于最优阈值,形成了以阴影集隶属为依据的三支聚类。在2个人工数据集和8个UCI公共数据集上算法进行测试。相较于均值漂移算法、带宽自适应均值漂移算法(Adaptive Bandwidth Mean Shift Algorithm,ABMS)以及核均值漂移算法(Kernel Mean Shift Algorithm,KMS),本文所提出的基于阴影集的三支核均值漂移聚类算法(Three-way Kernel Mean Shift Algorithm Based on Shadow Sets,TKMSSS)不仅可以对数据进行有效划分,而且可以很好地刻画类簇的边界域,在戴维森堡丁指数、轮廓系数、准确率、调整兰德系数、同质性等聚类评价指标方面均达到最优或与最优算法结果相近,表明TKMSSS综合聚类性能优于比较算法。
多模态方面级情感分析(Multimodal Aspect-Based Sentiment Analysis,MABSA)作为一种细粒度情感分析技术,旨在通过整合多种模态的特征数据来提高该领域的精度和效果。针对现有的多模态方面级情感分析的研究大多集中在文本和图像模态间的跨模态对齐上,忽略了图像的粗细粒度特征信息对MABSA子任务的潜在贡献。为此,本文提出一种联合双粒度图像信息的多模态方面级情感分析方法(Combining Two Granularity Image Information for Multi-Modal Aspect-Based Sentiment Analysis,CTGI)。具体地,在多模态方面词提取任务中,为增强图像与文本模态的交互,利用ClipCap获取图像的粗粒度特征描述文本,作为图像提示信息,辅助模型预测文本中的方面词及其属性。在多模态方面词情感分类中,为了捕获丰富的图像细粒度情感特征,通过跨模态注意力机制,将带有原始情感语义的图像底层特征与掩码后的文本经过多层深度交互,强化图像特征到文本特征的融合。通过在两个公共的Twitter数据集和Restaurant+数据集上的实验结果表明,CTGI的表现优于当前的基线模型,验证了图像粗细粒度对MABSA子任务不同贡献度的合理性。
暂无评论