咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于语料库的语言建模 收藏

基于语料库的语言建模

Language modeling based on corpus

作     者:许伟 苑春法 黄昌宁 

作者机构:清华大学计算机科学与技术系 智能技术与系统国家重点实验室 

出 版 物:《清华大学学报(自然科学版)》 (Journal of Tsinghua University(Science and Technology))

年 卷 期:1997年第37卷第3期

页      面:71-76页

核心收录:

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金 

主  题:语言模型 语料库语言学 隐马氏模型 计算语言学 

摘      要:语料库语言学的发展的核心问题是语言模型的建立问题。常用的语言模型可以概括为三类:(1)n元模型(及隐马尔可夫模型);(2)基于分布理论的模型;(3)基于规则的模型。基于语料库的建模过程就是对语言模型的参数进行求解的过程,也可以认为是一个机器学习的过程。它可分为两大类别:(1)有指导学习;(2)无指导学习。本文着重论述了近年发展的热点——无指导学习的各种技术和影响参数可信度的数据稀疏问题及其解决办法。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分