咨询与建议

限定检索结果

文献类型

  • 75 篇 会议
  • 1 册 图书

馆藏范围

  • 76 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 47 篇 文学
    • 37 篇 外国语言文学
    • 8 篇 中国语言文学
    • 2 篇 新闻传播学
  • 29 篇 工学
    • 20 篇 计算机科学与技术...
    • 18 篇 软件工程
    • 10 篇 控制科学与工程
    • 9 篇 仪器科学与技术
  • 9 篇 艺术学
    • 9 篇 设计学(可授艺术学...
  • 3 篇 管理学
    • 3 篇 管理科学与工程(可...
  • 1 篇 法学
    • 1 篇 社会学

主题

  • 4 篇 语料库
  • 3 篇 hownet
  • 3 篇 信息检索
  • 3 篇 机器翻译
  • 3 篇 自然语言处理
  • 3 篇 向量空间模型
  • 3 篇 双语语料库
  • 2 篇 无导方法
  • 2 篇 中科院计算所
  • 2 篇 概念
  • 2 篇 博士生
  • 2 篇 中文信息处理
  • 2 篇 知识表示
  • 2 篇 北京语言大学
  • 2 篇 词义消歧
  • 2 篇
  • 2 篇 流行语
  • 2 篇 词对齐
  • 2 篇 词性标注
  • 2 篇 对外汉语教学

机构

  • 13 篇 北京语言大学
  • 7 篇 北京广播学院
  • 7 篇 哈尔滨工业大学
  • 7 篇 东北大学
  • 6 篇 北京大学
  • 4 篇 烟台师范学院
  • 4 篇 北京工业大学
  • 3 篇 华中师范大学
  • 3 篇 中国科学院计算机...
  • 3 篇 山西大学
  • 2 篇 中国科学院计算技...
  • 2 篇 swcl2004程序委员...
  • 2 篇 清华大学
  • 1 篇 华中科技大学
  • 1 篇 大连理工大学
  • 1 篇 图像信息处理与智...
  • 1 篇 河北大学
  • 1 篇 department of co...
  • 1 篇 中国社会科学院研...
  • 1 篇 沈阳航空工业学院

作者

  • 4 篇 朱靖波
  • 4 篇 陈文亮
  • 4 篇 荀恩东
  • 4 篇 宋柔
  • 3 篇 陈肇雄
  • 3 篇 何婷婷
  • 3 篇 黄河燕
  • 3 篇 姚天顺
  • 3 篇 俞士汶
  • 3 篇 杨沐昀
  • 2 篇 张俐
  • 2 篇 肖华云
  • 2 篇 张亮
  • 2 篇 张孝飞
  • 2 篇 颜伟
  • 2 篇 戴胜海
  • 2 篇 刘群
  • 2 篇 杨尔弘
  • 2 篇 杨波
  • 2 篇 时晓升

语言

  • 76 篇 中文
检索条件"任意字段=第二届全国学生计算语言学研讨会"
76 条 记 录,以下是51-60 订阅
排序:
面向译文质量的EBMT系统实例库优化研究
面向译文质量的EBMT系统实例库优化研究
收藏 引用
第二届全国学生计算语言学研讨会
作者: 杨建 杨沐昀 于浩 时晓升 哈尔滨工业大学计算机科学与技术系 哈尔滨工业大学计算机科学与技术系 哈尔滨工业大学计算机科学与技术系 哈尔滨工业大学计算机科学与技术系
基于实例的翻译和基于统计的翻译系统中实例库的建设至关重要,近年来对实例库的获取、标记等已经有了很多研究,但在实例库的优化上缺乏相应研究,本文从影响实例库质量的几个因素做了研究。减少了实际EBMT系统实例库的大小,且提高了译文... 详细信息
来源: 评论
关于在分词系统中引入领域词典的研究
关于在分词系统中引入领域词典的研究
收藏 引用
第二届全国学生计算语言学研讨会
作者: 李晶 陈鄞 杨沐昀 徐冰 哈尔滨工业大学计算机学院机器翻译实验室 哈尔滨工业大学计算机学院机器翻译实验室 哈尔滨工业大学计算机学院机器翻译实验室 哈尔滨工业大学计算机学院机器翻译实验室
在自然语言处理系统的应用过程中,很多系统允许用户自由挂接一部或多部领域词典。本文首先对采用次分词方法产生的次分词歧义现象的分布情况进行了研究,然后通过实验比较了两种挂接领域词典方法在分词中的不同及其对次分词歧义的... 详细信息
来源: 评论
一种新的基于规则的多音字自动注音方法
一种新的基于规则的多音字自动注音方法
收藏 引用
第二届全国学生计算语言学研讨会
作者: 郑敏 蔡莲红 清华大学计算机科学与技术系 清华大学计算机科学与技术系
本文统计了大量正确标音的语料,结果表明220个多音字的出现频度占总频度的99%以上。本文针对这220个多音字,提出了一种新的基于规则的多音字自动注音的方法。该方法首先对语句中的多音字进行预分类,然后基于8项特征提取规则,并进行自动... 详细信息
来源: 评论
基于短语本位语法体系的混合模板汉语生成
基于短语本位语法体系的混合模板汉语生成
收藏 引用
第二届全国学生计算语言学研讨会
作者: 方志炜 于水源 杜利民 中科院声学所语音交互信息研究中心 北京广播学院声学研究所 中科院声学所语音交互信息研究中心
目前世界上典型通用的语言生成方法大致有四种:封装文本,基于模板,基于短语以及基于特征的方法。这些方法基本上都是针对英语提出来的,由于汉语(典型的分析语)与英语(属于印欧语系)的语法特点差异很大,它们并不完全适用于汉语。基于短... 详细信息
来源: 评论
基于hownet概念获取的中文自动文摘系统
基于hownet概念获取的中文自动文摘系统
收藏 引用
第二届全国学生计算语言学研讨会
作者: 王萌 何婷婷 王晓荣 华中师范大学计算机科学系 华中师范大学计算机科学系 华中师范大学计算机科学系
本文首先基于hownet对多义词进行无导词语消歧处理,然后利用hownet建立的知识库获取文章中词语的概念。并对未登录词语进行概念标注。用概念统计代替传统的词形频率统计方法。选择出与主题相关的若干概念,建立主题概念向量空间模型;通... 详细信息
来源: 评论
形式语用研究状况与展望
形式语用学研究状况与展望
收藏 引用
第二届全国学生计算语言学研讨会
作者: 刘根辉 李德华 尉迟治平 图像信息处理与智能控制教育部重点实验室华中科技大学人工智能研究所 图像信息处理与智能控制教育部重点实验室华中科技大学人工智能研究所 华中科技大学中国语言研究所
语用研究经过近半个世纪的发展,已经取得了丰硕成果;逻辑方法的渐趋成熟为建立形式语用奠定了基础。国外对形式语用的探讨为我们开展面向汉语的形式语用研究提供了参考。文章全面介绍了形式语用的起源、发展和现状,给出了形... 详细信息
来源: 评论
一种基于可信度的人名识别方法
一种基于可信度的人名识别方法
收藏 引用
第二届全国学生计算语言学研讨会
作者: 罗智勇 宋柔 荀恩东 北京工业大学计算机学院 北京语言大学语言信息处理研究所 北京语言大学语言信息处理研究所
专名识别是中文自动分词的重要任务。本文分析了目前流行的基于语料库和统计语言模型(SLM)的专名识别方法中存在的问题,同时以人名识别为例,在规则和统计相结合的基础上,提出了一种基于可信度的人名识别方法。从我们对《人民日报》1998... 详细信息
来源: 评论
怎样计算现代汉语句子的时间信息
怎样计算现代汉语句子的时间信息
收藏 引用
第二届全国学生计算语言学研讨会
作者: 陈振宇 陈振宁 复旦大学中文系 四川师范大学文学院
现代汉语句子的时间信息,是由句中的各个单位及其关系共同编码的,因此必须建立起整体的时间认知模型才能计算。包括三个方面:1、将时间性质分解为事件的基本阶段(起始、持续、终结)、事件的时段(确定时段、相对小量、相对大量)和认知窗... 详细信息
来源: 评论
基于大规模语料的中文词聚类研究与实现
基于大规模语料的中文词聚类研究与实现
收藏 引用
第二届全国学生计算语言学研讨会
作者: 蒋宏飞 曹海龙 杨沐昀 哈尔滨工业大学计算机系 哈尔滨工业大学计算机系 哈尔滨工业大学计算机系
词聚类算法对自然语言处理具有重要意义。Brown 1990年提出了一个经典的词聚类算法,但是由于算法本身的复杂度较高,故难于对大规模语科进行处理(Brown文中提到词数超过5000便是不可行的)。本研究中我们尝试着对上万词数的中文词语料进... 详细信息
来源: 评论
词聚类在文本分类中的应用
词聚类在文本分类中的应用
收藏 引用
第二届全国学生计算语言学研讨会
作者: 朱慕华 陈文亮 朱靖波 东北大学自然语言处理实验室 东北大学自然语言处理实验室 东北大学自然语言处理实验室
现有的文本分类方法需要较大的训练语料,在训练语料足够大的前提下可取得不错的效果,训练语料的规模直接影响分类的效果。然而,要大规模人工进行语料标注是一个难题。本文将k-means聚类算法引入到文本分类中,首先在无标注语料上进行词聚... 详细信息
来源: 评论