检索结果-内蒙古大学图书馆

作者：戴耿毅浙江工业大学

学位级别：硕士

中文分词(Chinese Word Segmentation)指的是将汉字序列按照一定的规则组合成词序列的过程,它是中文信息处理系统中的一个重要部分,是中文文献检索、搜索引擎、机器翻译(MT)、语音合成等信息系统中最基本的一步。中文分词的切分精度和... 详细信息

中文分词(Chinese Word Segmentation)指的是将汉字序列按照一定的规则组合成词序列的过程,它是中文信息处理系统中的一个重要部分,是中文文献检索、搜索引擎、机器翻译(MT)、语音合成等信息系统中最基本的一步。中文分词的切分精度和切分速度将直接对系统的后续过程产生影响,为了在保证中文分词切分速度的基础上,尽可能的提高中文分词的切分精度,以达到提高中文分词算法性能的目的,近年来研究和开发高性能的中文分词系统成为了热点。汉语词法分析系统ICTCLAS(Institute of Computing Technology,Chinese Lexical Analysis System)是世界上领先的开源汉语词法分析器。本文通过研究开源版本的ICTCLAS汉语词法分析系统,结合现有的中文分词研究成果,在词典的构成、数词和时间词识别规则、机构名识别以及实现基于类的隐马尔可夫分词算法几方面提出改进思路。改进后的newICTCLAS分词系统采用双数组trie树结构的词典机制,完善人名、译名、地名以及数词匹配规则的同时,添加时间词识别和机构名未登录词的识别,并实现了基于类的隐马分词。实验结果表明改进后的newICTCLAS分词系统与开源版本的ICTCLAS系统相比在切分精度、切分速度、召回率和准确率上都有了不同程度的提高,证明了改进后系统的优越性。

关键词：中文分词 ICTCLAS 隐马尔可夫分词算法双数组trie树算法

来源：评论

学校读者我要写书评

暂无评论

基于双数组trie树法的关键字预处理技术及其在CNC语法检验中的应用

引用

贵州大学学报（自然科学版） 2010年第1期27卷 49-52,61页

作者：王子牛曹凌菲王岩贵州大学信息化管理中心贵州贵阳550025 贵州大学计算机科学与信息学院贵州贵阳550025 上海交通大学机械系统与振动国家重点实验室上海200240

语法检验在CNC系统中占有相当大的比重,尤其是在数控系统的自动或MDI方式下运行。NC代码的正确与否直接关系到能否正确完成数控加工,而现在国内自主开发CNC系统的语法检验功能还不够完善,并且检验方法也不尽科学。针对五轴联动高档数控... 详细信息

语法检验在CNC系统中占有相当大的比重,尤其是在数控系统的自动或MDI方式下运行。NC代码的正确与否直接关系到能否正确完成数控加工,而现在国内自主开发CNC系统的语法检验功能还不够完善,并且检验方法也不尽科学。针对五轴联动高档数控机床,参照双数组trie算法的原理,提出了基于双数组trie算法的关键字预处理技术,并将其成功地应用在语法检验之中,从而使得对NC代码的语法检测更加准确。

关键词：双数组trie树算法关键字预处理语法检验 CNC

来源：评论

学校读者我要写书评

暂无评论

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案：

请选择收藏分类：

通借通还

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案： 新增检索档案 确定 取消

请选择收藏分类： 新增自定义分类 确定 取消

通借通还

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

请选择保存的检索档案：

请选择收藏分类：