版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN202310508076.4
公 开 号:CN116629262A
发 明 人:任浩 刘荣辉 崔巍 桂卫华 阳春华 梁骁俊 骆伟超 黄科科 孙备 张超波
代 理 人:晏波
代理机构:深圳市世纪恒程知识产权代理事务所
专利类型:发明专利
申 请 日:20230822
公 开 日:20230506
专利主分类号:G06F40/295
关 键 词:实体类别 实体识别 序列标签 预测 工业领域 化工业 预设 重复利用率 查询效率 存储介质 工业数据 数据确定 文本实体 序列标注 准确率 层级 构建 标注 文本 管理
摘 要:本发明公开了一种文本实体识别方法、装置、设备及存储介质,该方法包括:根据不同工业属性层级建立树状工业实体词典;获取工业领域的非结构化工业数据,并根据树状工业实体词典和非结构化工业数据确定工业实体类别;对工业实体类别进行序列标注,获得待预测序列标签;根据预设实体识别模型对所述待预测序列标签进行实体识别。本发明构建树状工业实体词典,便于提高管理和查询效率以及对知识的重复利用率,根据树状工业实体词典和工业数据确定工业实体类别,并对工业实体类别进行标注获得待预测序列标签,根据预设实体识别模型对待预测序列标签进行实体识别,从而能在工业领域内提高识别文本的准确率。