版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:浙江工业大学计算机科学与技术学院
出 版 物:《计算机辅助设计与图形学学报》 (Journal of Computer-Aided Design & Computer Graphics)
年 卷 期:2025年
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:浙江省自然科学基金重点项目(LZ23F020010) 国家自然科学基金重大项目(72192820) 国家自然科学基金面上项目(61972355)
摘 要:主题建模是自然语言处理中的重要文本挖掘方法, 但其建模过程复杂且会生成部分不符合用户期望的结果. 为帮助非专家用户理解模型建模过程, 高效掌握和修改模型结果, 设计了基于BERTopic的交互式可视分析系统. 系统通过以下关键功能提升BERTopic的可解释性与实用性: 1) 挖掘并展示BERTopic层次聚类的中间过程, 直观揭示主题生成机制; 2) 分析离群文档, 揭示其与主题间的潜在关系; 3) 提出多粒度局部模型编辑算法, 增强BERTopic主题模型准确性; 4) 开发基于Web的交互式层次主题模型系统BTVis, 支持用户通过可视分析与交互探索理解并提升模型结果. 在TED、豆瓣影评等真实长文本和短文本数据集中进行了定性分析, 面向100位参与者设计用户实验, 并通过一致性、多样性和稳定性指标和其他模型进行对比, 实验结果验证了所提系统的有效性和实用性.