咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于无向图序列标注模型的中文分词词性标注一体化系统 收藏

基于无向图序列标注模型的中文分词词性标注一体化系统

Joint Chinese Word Segmentation and POS Tagging System with Undirected Graphical Models

作     者:朱聪慧 赵铁军 郑德权 Zhu Cong-hui;Zhao Tie-jun;Zheng De-quan

作者机构:教育部-微软语言语音重点实验室哈尔滨工业大学哈尔滨150001 

出 版 物:《电子与信息学报》 (Journal of Electronics & Information Technology)

年 卷 期:2010年第32卷第3期

页      面:700-704页

核心收录:

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金(60773069 60973169)资助课题 

主  题:中文分词 词性标注 一体化系统 无向图模型 

摘      要:在中文词法分析中,分词是词性标注必须经历的阶段。为了能在分词阶段就充分利用词性标注的信息和减少两阶段错误的累计,最好的方法是将两个阶段,整合到一个架构中。该文以无向图模型为基础,将分词和词性标注有机地统一在一个序列标注模型中。由于可以采用更深层次的依赖关系作为特征,一体化系统在1998年人民日报语料上取得了97.19%的分词精确率和95.34%的词性标注精确率,是目前同类系统,在这一语料上取得的最好结果。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分