版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN202310294365.9
公 开 号:CN116822511A
代 理 人:马雪利
代理机构:上海唯智赢专利代理事务所(普通合伙)
专利类型:发明专利
申 请 日:20230929
公 开 日:20230323
专利主分类号:G06F40/295
关 键 词:标识词 自然语言模型 自然语言识别 所属领域 辨识 语料 预设 匹配 搜索 重复 统计
摘 要:本发明公开了一种基于自然语言模型的专业名词识别方法及装置,属于自然语言识别技术领域。该方法包括:确定所属领域的标识词,根据所述标识词得到若干关键词;根据所述关键词,搜索得到M篇语料;在所述语料中,选取所述标识词后K个字作为候选名词;将所述候选名词在所述语料中进行匹配,统计其在所述语料中出现的次数与预设的阈值进行比较,依次减少K值,直至确定合适的专业名词,重复上述操作,获得所有专业名词的识别结果。本发明基于自然语言模型给出了一种专业名词的识别方法,解决了对新兴行业专业名词进行辨识、建立专业名词库的问题。