咨询与建议

限定检索结果

文献类型

  • 70 篇 期刊文献
  • 34 篇 会议
  • 2 件 标准

馆藏范围

  • 106 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 78 篇 工学
    • 73 篇 计算机科学与技术...
    • 70 篇 软件工程
    • 7 篇 控制科学与工程
    • 3 篇 仪器科学与技术
    • 1 篇 机械工程
    • 1 篇 地质资源与地质工...
    • 1 篇 交通运输工程
  • 25 篇 文学
    • 11 篇 中国语言文学
    • 10 篇 外国语言文学
    • 4 篇 新闻传播学
  • 16 篇 管理学
    • 13 篇 管理科学与工程(可...
    • 4 篇 图书情报与档案管...
    • 1 篇 工商管理
  • 5 篇 法学
    • 3 篇 社会学
    • 2 篇 民族学
  • 2 篇 医学
    • 1 篇 中医学
    • 1 篇 中西医结合
  • 1 篇 经济学
    • 1 篇 应用经济学
  • 1 篇 理学
  • 1 篇 艺术学
    • 1 篇 设计学(可授艺术学...

主题

  • 11 篇 自然语言处理
  • 9 篇 中文信息处理
  • 7 篇 计算机应用
  • 5 篇 语料库
  • 5 篇 词义消歧
  • 4 篇 知识工程
  • 4 篇 句本位语法
  • 3 篇 语言知识库
  • 3 篇 句法分析
  • 3 篇 人工智能
  • 3 篇 机器翻译
  • 3 篇 技术控制
  • 3 篇 语义角色标注
  • 3 篇 无指导译文消歧
  • 2 篇 特征选择
  • 2 篇 规则库
  • 2 篇 最大熵方法
  • 2 篇 惯用语
  • 2 篇 情感分类
  • 2 篇 中医药

机构

  • 104 篇 北京大学
  • 9 篇 北京信息科技大学
  • 8 篇 郑州大学
  • 7 篇 北京拓尔思信息技...
  • 7 篇 哈尔滨工业大学
  • 5 篇 中国科学技术信息...
  • 4 篇 计算语言学教育部...
  • 4 篇 清华大学
  • 4 篇 北京师范大学
  • 4 篇 山东中医药大学
  • 3 篇 北京联合大学
  • 3 篇 鲁东大学
  • 3 篇 中国社会科学院语...
  • 2 篇 语言能力协同创新...
  • 2 篇 中国科学院计算技...
  • 2 篇 乐山师范学院
  • 2 篇 南京师范大学
  • 2 篇 中国标准化与信息...
  • 2 篇 北京语言大学
  • 2 篇 人民日报社新闻信...

作者

  • 26 篇 俞士汶
  • 16 篇 王厚峰
  • 13 篇 吴云芳
  • 12 篇 穗志方
  • 8 篇 吕学强
  • 8 篇 王洪俊
  • 8 篇 昝红英
  • 8 篇 刘耀
  • 7 篇 常宝宝
  • 7 篇 施水才
  • 7 篇 张坤丽
  • 6 篇 wu yun-fang
  • 6 篇 肖诗斌
  • 5 篇 yu shi-wen
  • 5 篇 zhang yang-sen
  • 5 篇 liu yao
  • 5 篇 张仰森
  • 5 篇 wu yunfang
  • 4 篇 宋继华
  • 4 篇 yu shiwen

语言

  • 106 篇 中文
检索条件"机构=北京大学信息学院计算语言学研究所"
106 条 记 录,以下是1-10 订阅
排序:
基于机器习方法的汉语名词隐喻识别
收藏 引用
高技术通讯 2007年 第6期17卷 575-580页
作者: 王治敏 王厚峰 俞士汶 北京语言大学汉语学院 北京100083 北京大学计算语言学研究所 北京100083
把机器习方法引入汉语隐喻识别的研究。隐喻识别过程被描述成隐喻义与字面义的分类问题,通过最大熵和朴素贝叶斯两种方法的隐喻建模,在综合上下文词语、词性等多项特征的基础上,最后初步确定了最大熵识别的理想窗口,进而又引入左右位... 详细信息
来源: 评论
基于特征选择和最大熵模型的汉语词义消歧
收藏 引用
软件 2010年 第6期21卷 1287-1295页
作者: 何径舟 王厚峰 北京大学信息科学技术学院计算语言学研究所 北京100871 北京大学计算语言学教育部重点实验室 北京100871
词义消歧是自然语言处理中一类典型的分类问题.在分类中,特征的选择至关重要.通常情况下,特征是由人工选择的,这就要求特征选取者对于待分类的问题本身和分类模型的特点有深刻的认识.分析了汉语词义消岐中特征模板对消歧结果的影响,在... 详细信息
来源: 评论
中文分词模型的领域适应性方法
收藏 引用
计算 2015年 第2期38卷 272-281页
作者: 韩冬煦 常宝宝 北京大学信息科学技术学院计算语言学研究所计算语言学教育部重点实验室 北京100871
字标注分词方法是当前中文分词领域中一种较为有效的分词方法.但因为受制于训练语料的领域和规模,该方法在领域适应性方面效果不佳,影响了该方法在应用系统中的实际应用.在文中,作者提出使用卡方统计量以及边界熵提升未登录词的处理能力... 详细信息
来源: 评论
大型词典编纂的计算机辅助开发与管理系统
收藏 引用
辞书研究 2004年 第2期 73-81,72页
作者: 王惠 李康年 北京大学信息学院计算语言学研究所 北京100871
一个用于词典编纂的计算机辅助开发与管理系统已经在北京大学《现代汉语语义词典》的开发过程中发挥重要作用 ,有效地提高了词典编纂的效率和质量。同时 ,该项研究也是对汉语计算词典理论的一种探索。
来源: 评论
最大熵方法中特征选择算法的改进与纠错排歧
收藏 引用
北京理工大学 2006年 第1期26卷 36-40页
作者: 张仰森 曹元大 俞士汶 北京大学计算语言学研究所 北京理工大学软件学院 北京100081
对应用最大熵原理建立语言模型的特征选取方法作了改进.用特征模板从训练样本中获得候选特征集,应用频次与平均互信息相结合的方法从候选特征集中选取特征.在选择有效特征时,对候选特征集中出现频次大于某一限值的特征或平均互信息很大... 详细信息
来源: 评论
采用无标注语料的动词和形容词主观性评级
收藏 引用
软件 2013年 第5期24卷 1036-1050页
作者: 徐戈 蒙新泛 王厚峰 北京大学计算语言学研究所 北京100871 计算语言学教育部重点实验室(北京大学) 北京100871 闽江学院计算机科学系 福建福州350108
为了自动区分中文主观词和客观词,采用主观性线索和汉字的主观性两种手段对动词和形容词进行主观性度量.主观性的线索进一步被分成级差(gradability)线索和主体(subject)线索;根据这些线索,使用基于图的算法进行评级(ranking).在汉语主... 详细信息
来源: 评论
关键词自动标引的最大熵模型应用研究
收藏 引用
计算 2004年 第9期27卷 1192-1197页
作者: 李素建 王厚峰 俞士汶 辛乘胜 北京大学计算语言学研究所 北京100871 人民日报社新闻信息中心 北京100733
关键词是文档管理、文本聚类 /分类、信息检索等领域可利用的重要资源 ,因此该文提出了利用最大熵模型进行自动标引的技术 .最大熵模型为一个成熟的数模型 ,已经应用到计算语言学的各个领域 .然而它的应用非常灵活 ,针对标引任务和现... 详细信息
来源: 评论
基于图的同义词集自动获取方法
收藏 引用
计算研究与发展 2011年 第4期48卷 610-616页
作者: 吴云芳 石静 金澎 计算语言学教育部重点实验室(北京大学) 北京100871 北京大学计算语言学研究所 北京100871 乐山师范学院智能信息处理及应用实验室 四川乐山614000
同义词集是重要的语言基础知识,基于大规模语料库的同义词集自动获取是自然语言处理领域的一项基础性研究课题.从大规模语料中自动获取有并列结构关联的词语对,据此形成图,采用Newman算法对图进行划分而自动聚类相似词语.着重研究在New... 详细信息
来源: 评论
藏文信息处理技术的研究现状与展望
收藏 引用
中国藏 2003年 第4期 97-107页
作者: 陈玉忠 俞士汶 北京大学信息科学技术学院计算语言学研究所
本文主要对国内开展藏文信息处理以来的相关研究工作进行了介绍和评价。在此基础上对藏文信息处理的进一步发展进行了展望。目的是为了探讨如何加速推进藏文信息处理技术的发展。通过对藏文操作系统、藏文信息技术标准、藏语信息处理、... 详细信息
来源: 评论
无双语词典的英汉词对齐
收藏 引用
计算 2004年 第8期27卷 1036-1045页
作者: 吴宏林 姚天顺 北京大学信息科学技术学院计算语言学研究所 北京100871 东北大学信息科学与工程学院计算机软件与理论研究所 沈阳110004
该文提出了一种基于语料库的无双语词典的英汉词对齐模型 .它把自然语言的句子形式化地表示为集合 ,通过集合的交运算和差运算实现单词对齐 ,同时还考虑了词序和重复词的影响 .该模型不仅能对齐高频单词 ,而且能对齐低频单词 ,对未登录... 详细信息
来源: 评论