咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向长尾分布的民众诉求层次多标签分类模型 收藏

面向长尾分布的民众诉求层次多标签分类模型

Hierarchical multi-label classification model for public complaints with long-tailed distribution

作     者:刘昕 杨大伟 邵长恒 王海文 庞铭江 李艳茹 LIU Xin;YANG Dawei;SHAO Changheng;WANG Haiwen;PANG Mingjiang;LI Yanru

作者机构:中国石油大学(华东)青岛软件学院、计算机科学与技术学院山东青岛266580 青岛大学计算机科学技术学院山东青岛266071 

出 版 物:《计算机应用》 (journal of Computer Applications)

年 卷 期:2025年第45卷第1期

页      面:82-89页

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金资助项目(62071491) 山东省自然科学基金资助项目(ZR2020MF045) 

主  题:接诉即办 智能派单 层次多标签分类 先验知识 长尾分布 编解码器 

摘      要:接诉即办是实现社会治理智能化、提高人民满意度的重要举措,其中精准分析民众诉求智能匹配工单处理部门,实现诉求的快速响应、高效办理尤为关键;然而,民众诉求数据中的诉求描述不清晰、类别混淆且比例失衡会导致诉求类别分析困难,影响了智能派单的效率与准确性。针对上述问题,提出编解码器结构的诉求层次多标签分类模型(HMCHotline)。首先,在文本编码器中引入诉求领域中的细粒度关键词先验知识以抑制噪声干扰,并融合诉求的时空信息提高语义特征的判别力;其次,利用标签层次结构生成具有层次与语义感知的标签嵌入,并构建基于Transformer模型的标签解码器,利用诉求的语义特征和标签嵌入进行标签解码;同时,在标签的层级依赖关系基础上引入动态标签表策略限制标签的解码范围,以解决标签不一致问题;最后,采用Softmax分组策略将样本数量相近的标签类别分为同组进行Softmax操作,从而缓解由标签长尾分布导致的分类准确率低的问题。在Hotline、RCV1(Reuters Corpus VolumeⅠ)-v2和WOS(Web Of Science)数据集上的实验结果表明,相较于层次感知的标签语义匹配网络(HiMatch),所提模型的Micro-F1分别提高了1.65、2.06和0.43个百分点,验证了模型的有效性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分