咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于语义理解的中文实词提取算法 收藏
基于语义理解的中文实词提取算法

基于语义理解的中文实词提取算法

专利申请号:CN201710475016.1

公 开 号:CN107273360A

发 明 人:张鹏 

代 理 人:杨春

代理机构:11340 北京天奇智新知识产权代理有限公司

专利类型:发明申请

申 请 日:20171020

公 开 日:20170621

专利主分类号:G06F17/27(20060101)

关 键 词:匹配信息 实词提取 语义理解 分词 算法 中文 短句 断句 时间复杂度 词典建立 匹配过程 数据检索 中间结果 中字符串 字段处理 正确率 字符串 散列 字段 句子 匹配 扫描 保存 改进 

摘      要:本发明提供了一种基于语义理解的中文实词提取算法,该方法包括:采用散列树词典建立数据检索结构;根据断句表,将中文句子切分为短句,在进行匹配分词的同时保存匹配过程中字符串的匹配信息;通过字符串的匹配信息以及逐词扫描来判断存在的二义字段,将预切分的中间结果交给细分过程进行处理。本发明提出了一种基于语义理解的中文实词提取算法,改进了对分词的二义字段处理的过程,具备更理想的时间复杂度和切分正确率。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分