版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:北京信息科技大学网络文化与数字传播北京市重点实验室北京100101 北京城市系统工程研究中心北京100089
出 版 物:《计算机工程与设计》 (Computer Engineering and Design)
年 卷 期:2019年第40卷第1期
页 面:279-284页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金项目(61671070) 北京成像技术高精尖创新中心基金项目(BAICIT-2016003) 国家社会科学基金重大基金项目(14@ZH036) 国家语委重点基金项目(ZDI135-53) 国家语委重大课题基金项目(ZDA125-26)
主 题:中文专利术语 术语抽取 条件随机场 序列标注 新能源汽车领域
摘 要:通过对新能源汽车领域中文专利文献中术语特点的分析,提出利用条件随机场模型,分别基于三词位、四词位和六词位的字序列标注进行术语抽取的方法。以字为切分粒度,避免在术语抽取过程中因分词原因导致术语识别错误问题,并探讨不同词位标注集对术语抽取性能的影响。实验结果表明,基于六词位字标注的条件随机场模型术语抽取的性能最好,准确率、召回率和F值优于对比方法中基于词、词性、词长等信息作为特征的抽取方法,验证了所提方法的有效性。