咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >人大报告内容的文本分类 收藏

人大报告内容的文本分类

Text classification of NPC report contents

作     者:喻航 李红莲 吕学强 YU Hang;LI Hong-lian;LYU Xue-qiang

作者机构:北京信息科技大学信息与通信工程学院北京100101 北京信息科技大学网络文化与数字传播北京市重点实验室北京100101 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2021年第42卷第6期

页      面:1772-1778页

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金项目(61671070) 北京成像技术高精尖创新中心基金项目(BAICIT-2016003) 国家社会科学基金重大基金项目(14@ZH0363) 国家语委重点基金项目(ZDI135-53) 

主  题:人大报告 文本分类 词频-逆文档频率 知识增强语义表示模型 速度 

摘      要:针对区级人大报告特定的几方面内容进行文本分类,可以让人大工作人员对不同工作内容进行快速分辨,是构建人大报告辅助生成系统的必要内容。为对不同内容分类,基于TF-IDF(词频-逆文档频率)与知识增强语义表示模型ERNIE(enhanced representation from knowledge integration)结合构建分类模型。ERNIE直接对语义知识单元进行建模,在此基础上加入TF-IDF提升模型性能。实验结果表明,该方法在分类的准确率和召回率上表现不错,使ERNIE模型收敛速度加快,通过该模型可以较好地对人大报告的文本进行分类。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分