您好,读者! 请
登录
内蒙古大学图书馆
首页
概况
本馆概况
组织机构
入馆须知
规章制度
馆藏布局
参观与访问图书馆
党建
资源
馆藏资源
电子资源
数据库导航
特色资源
服务
办证服务
图书借阅
阅读推广
文献传递与馆际互借
空间与设施
开放时间
iThenticate论文原创性检测服务
科研支持
论文收录引用证明
科技查新
知识产权
档案馆
帮助
联系我们
地理位置
新生指南
常见问题
图书捐赠
咨询与建议
建议与咨询
留下您的常用邮箱和电话号码,以便我们向您反馈解决方案和替代方法
您的常用邮箱:
*
您的手机号码:
*
问题描述:
当前已输入0个字,您还可以输入200个字
全部搜索
期刊论文
图书
学位论文
标准
纸本馆藏
外文资源发现
数据库导航
超星发现
本站搜索
搜 索
高级检索
分类表
所选分类
----=双击删除一行=----
>>
<<
限定检索结果
标题
作者
主题词
出版物名称
出版社
机构
学科分类号
摘要
ISBN
ISSN
基金资助
索书号
标题
标题
作者
主题词
出版物名称
出版社
机构
学科分类号
摘要
ISBN
ISSN
基金资助
索书号
作者
标题
主题词
出版物名称
出版社
机构
学科分类号
摘要
ISBN
ISSN
基金资助
索书号
作者
作者
标题
主题词
出版物名称
出版社
机构
学科分类号
摘要
ISBN
ISSN
基金资助
索书号
确 定
文献类型
52 篇
会议
2 篇
期刊文献
馆藏范围
54 篇
电子文献
0 种
纸本馆藏
日期分布
学科分类号
52 篇
工学
52 篇
计算机科学与技术...
52 篇
软件工程
2 篇
控制科学与工程
2 篇
文学
2 篇
中国语言文学
2 篇
管理学
2 篇
管理科学与工程(可...
1 篇
法学
1 篇
社会学
主题
8 篇
自然语言处理
5 篇
神经网络
3 篇
注意力机制
3 篇
深度学习
3 篇
卷积神经网络
2 篇
智能技术与系统国...
2 篇
语言知识库
2 篇
未登录词
2 篇
形态分析
2 篇
阅读理解
2 篇
迁移学习
2 篇
国际学术研讨会
2 篇
清华大学
2 篇
南京师范大学
2 篇
语料库
2 篇
词向量
2 篇
中文信息
2 篇
学术会议
2 篇
计算语言学
2 篇
双向长短期记忆人...
机构
7 篇
北京大学
6 篇
清华大学
6 篇
山西大学
4 篇
大连理工大学
4 篇
苏州大学
3 篇
南京师范大学
3 篇
广东外语外贸大学
2 篇
北京市信息服务工...
2 篇
华南农业大学
2 篇
山西省大数据挖掘...
2 篇
北京语言大学
1 篇
台湾中正大学
1 篇
智能技术与系统国...
1 篇
香港理工大学
1 篇
北京交通大学
1 篇
北京科技大学
1 篇
中国科学院大学
1 篇
中国科学院
1 篇
香港教育大学
1 篇
河南科技学院
作者
4 篇
王厚峰
3 篇
王素格
3 篇
江铭虎
3 篇
李茹
2 篇
曲维光
2 篇
汪梦翔
2 篇
李素建
2 篇
王元龙
2 篇
黄德根
2 篇
熊德意
2 篇
阿布都克力木.阿布...
2 篇
黄沛杰
2 篇
冯文贺
2 篇
姚登峰
2 篇
饶琪
2 篇
李丽双
2 篇
周国栋
1 篇
高盛祥
1 篇
李德玉
1 篇
宋丽
语言
54 篇
中文
检索条件
"任意字段=第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会"
共
54
条 记 录,以下是41-50
订阅
全选
清除本页
清除全部
题录导出
标记到"检索档案"
详细
简洁
排序:
相关度排序
时效性降序
时效性升序
相关度排序
相关度排序
时效性降序
时效性升序
基于
局部密度的无监督作文跑题检测方法
基于局部密度的无监督作文跑题检测方法
收藏
分享
引用
第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会
作者:
李霞
温启帆
广东外语外贸大学 语言工程与计算实验室
广东 广州510006
广东外语外贸大学 信息科学与技术学院
广东 广州510006
广东外语外贸大学 信息科学与技术学院
广东 广州510006
针对现有的无监督作文跑题检测方法中使用作文内容向量表示作文存在非主题词噪音所导致的相似度不准确问题,本文提出一种
基于
作文主题词抽取和局部密度阈值选择的无监督作文跑题检测方法.首先使用LDA主题生成模型挖掘待测作文的主题词,...
详细信息
针对现有的无监督作文跑题检测方法中使用作文内容向量表示作文存在非主题词噪音所导致的相似度不准确问题,本文提出一种
基于
作文主题词抽取和局部密度阈值选择的无监督作文跑题检测方法.首先使用LDA主题生成模型挖掘待测作文的主题词,并使用分布式表示向量寻找与题目词项语义相似的词作为对作文题目的主题词扩展,在此基础上使用本文提出的切题度
计算
方法
计算
待测作文的切题度,并使用所提出的
基于
作文集切题度局部密度的阈值抽取方法动态选取切题阈值,进而实现一种无需训练集和主题无关的无监督作文跑题检测方法.在以英语为母语的学习者和以汉语为母语的学习者所写的8个作文集共9381篇作文上的实验结果表明,本文提出的作文跑题检测方法能有效识别跑题作文.
关键词:
作文跑题检测
主题词抽取
切题度
阈值选取
来源:
评论
学校读者
我要写书评
暂无评论
向量模型和多源词汇分类体系相结合的词语相似性
计算
向量模型和多源词汇分类体系相结合的词语相似性计算
收藏
分享
引用
第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会
作者:
梁泳诗
黄沛杰
岑洪杰
唐杰聪
王俊东
华南农业大学数学与信息学院
广东 广州 510642
现有的词语语义相似性
计算
主要包括
基于
向量模型以及
基于
词汇分类体系两类方法,但这两类方法都存在自身的缺点.向量模型所依赖的文本共现中的上下文信息不等同于真正意义上的语义,而词汇分类体系方法则存在构建代价大,并且在一定程度上...
详细信息
现有的词语语义相似性
计算
主要包括
基于
向量模型以及
基于
词汇分类体系两类方法,但这两类方法都存在自身的缺点.向量模型所依赖的文本共现中的上下文信息不等同于真正意义上的语义,而词汇分类体系方法则存在构建代价大,并且在一定程度上还不够完善的问题.本文提出一种向量模型与多源词汇分类体系相结合的词语相似性
计算
方法,采用多源词汇分类体系的近义词关系以及向量模型得到的词向量,
计算
得到词语的向量表达,并探索了不同类型词汇分类体系提供的知识的选用和融合问题,弥补了单一词向量和单一词汇分类体系在词语相似性
计算
中的缺点.本文采用了NLPCC-ICCPOL2016词语相似度评测比赛中的PKU500
数据
集进行评测.在该
数据
集上,本文的方法取得了0.618的斯皮尔曼等级相关系数,比NLPCC-ICCPOL2016词语相似度评测比赛第一名的方法的结果提高了19.3%.
关键词:
词语相似性
向量模型
词汇分类体系
组合方法
多源融合
来源:
评论
学校读者
我要写书评
暂无评论
基于
双向LSTM语义强化的主题建模
基于双向LSTM语义强化的主题建模
收藏
分享
引用
第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会
作者:
彭敏
杨绍雄
朱佳晖
武汉大学 计算机学院
武汉 430072
当前,双向LSTM神经网络等深度学习方法在文本语义特征表达方面取得了突破性的进展,为构建深层次的具有语义连贯性的主题模型提供了可能.但是,现有方法在文本的概率主题建模方面,提升的效果还比较有限.本文提出了一个
基于
双向LSTM语义强...
详细信息
当前,双向LSTM神经网络等深度学习方法在文本语义特征表达方面取得了突破性的进展,为构建深层次的具有语义连贯性的主题模型提供了可能.但是,现有方法在文本的概率主题建模方面,提升的效果还比较有限.本文提出了一个
基于
双向LSTM语义强化的概率主题模型DGPU-LDA(Double Generalized Polya Urn with LDA).该模型一方面结合双向LSTM文档语义编码框架DS-Bi-LSTM(Document Semantic Bi-directional LSTM)来实现文档宏观语义的嵌入表示,另一方面采用文档-主题和词汇-词汇双GPU(Generalized Polya Urn)语义强化机制以及LSTM来刻画参数推断过程中的吉布斯采样过程.在搜狗新闻
数据
集以及20新闻组
数据
集上的实验结果表明,DGPU-LDA模型在主题语义连贯性、文本分类准确率方面相对于一些比较前沿的主题模型具有一定的优势,同时也表明了该模型在文本语义特征表达方面的有效性.
关键词:
语义强化
双向长短期记忆人工神经网络
主题模型
来源:
评论
学校读者
我要写书评
暂无评论
儿童外语学习认知
数据
收集的在线游戏框架
儿童外语学习认知数据收集的在线游戏框架
收藏
分享
引用
第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会
作者:
马为之
张敏
张琛昱
陈忆馨
谢倩
孙炜岳
刘奕群
马少平
智能技术与系统国家重点实验室
清华信息科学与技术国家实验室清华大学计算机系北京100084
近年来,人工智能技术飞速发展,不少工作试图从人类的认知发展过程中探索前进方向,
语言学
习认知的过程成为了重点关注的研究领域.已有的
语言
认知研究工作主要集中在学龄前儿童母语的词汇学习认知方面,依赖于WordBank1等大规模语料库.然...
详细信息
近年来,人工智能技术飞速发展,不少工作试图从人类的认知发展过程中探索前进方向,
语言学
习认知的过程成为了重点关注的研究领域.已有的
语言
认知研究工作主要集中在学龄前儿童母语的词汇学习认知方面,依赖于WordBank1等大规模语料库.然而就所知,目前在第二
语言学
习方面研究不多,尚未有大规模的第二
语言
词汇学习
数据
,且传统的
数据
收集方法难以收集到大规模
数据
,这也一定程度上限制了对于第二
语言学
习的研究工作及母语与第二
语言学
习的比较.针对这一问题,本文针对学龄前儿童群体设计了
基于
游戏性原则的
数据
收集方法和研究框架,用于收集第二
语言
的
语言学
习情况和用户
数据
,以支撑相应研究工作的开展.目前,已经实现了针对学龄前儿童的第二
语言
为英语的词汇认知
数据
收集系统,正在进行在线的
数据
收集.
关键词:
儿童外语学习
第二
语言
语言
认知
游戏性
数据
收集
来源:
评论
学校读者
我要写书评
暂无评论
基于
多模型融合的汉语介词短语识别
基于多模型融合的汉语介词短语识别
收藏
分享
引用
第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会
作者:
刘彤
黄德根
张聪
大连理工大学 计算机学院
辽宁省 大连市 116024
提出了一种多模型融合的介词短语识别方法,不仅能识别并列型介词短语,而且提高了嵌套型介词短语的识别精度.首先,利用简单名词短语识别模型识别出语料中的短语信息并进行融合,简化语料,降低介词短语内部复杂性;其次,用CRF模型识别嵌套...
详细信息
提出了一种多模型融合的介词短语识别方法,不仅能识别并列型介词短语,而且提高了嵌套型介词短语的识别精度.首先,利用简单名词短语识别模型识别出语料中的短语信息并进行融合,简化语料,降低介词短语内部复杂性;其次,用CRF模型识别嵌套的内层介词短语,即若存在嵌套则识别嵌套的内层,若无嵌套则识别该介词短语;最后,将初始语料中识别出来的内层介词短语进行分词融合并修改其特征信息,重新训练外层介词短语识别模型进行识别.在内、外层介词短语自动识别后,利用双重错误校正系统对识别的介词短语进行校正.在2000年《人民日报》语料中进行
五
倍交叉实验,结果表明,该方法识别的介词短语的正确率、召回率、F值分别为94.11%,94.02%,94.06%,比
基于
简单名词短语的介词短语识别方法(baseline)分别提高了1.09、1.07、1.08个百分点,有效提高了介词短语识别的性能.
关键词:
简单名词短语
分词融合
分层嵌套结构
双重错误校正系统
来源:
评论
学校读者
我要写书评
暂无评论
基于
双向LSTM和两阶段方法的触发词识别
基于双向LSTM和两阶段方法的触发词识别
收藏
分享
引用
第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会
作者:
何馨宇
李丽双
大连理工大学 计算机科学与技术学院
辽宁 大连 116023
生物事件抽取是生物文本挖掘领域的一个重要分支,而触发词识别作为事件抽取的重要子过程,已经吸引了众多的关注.现有的触发词识别方法多为浅层的一阶段方法,训练代价较大,且需要丰富的领域知识抽取大量特征,人工成本较高.因此,本文提出...
详细信息
生物事件抽取是生物文本挖掘领域的一个重要分支,而触发词识别作为事件抽取的重要子过程,已经吸引了众多的关注.现有的触发词识别方法多为浅层的一阶段方法,训练代价较大,且需要丰富的领域知识抽取大量特征,人工成本较高.因此,本文提出了一种
基于
两阶段和双向LSTM神经网络的触发词识别方法.首先,将触发词识别分为识别和分类两个阶段,有效的缓解了训练过程中存在的类不平衡问题.其次,在两个阶段中均采用目前性能较好的双向LSTM神经网络来完成二分类任务和多分类任务,避免了浅层机器学习方法抽取人工特征时的代价.此外,利用PubMed
数据
库下载大规模语料训练带有依存关系的词向量,获得了更加丰富的语义信息,从而有效的提高了触发词的识别性能.本文方法在生物事件抽取通用语料MLEE上已获得目前最好抽取性能,F值为78.46%.
关键词:
触发词识别
两阶段法
双向LSTM神经网络
来源:
评论
学校读者
我要写书评
暂无评论
基于
特征融合的产科多标记辅助诊断研究
基于特征融合的产科多标记辅助诊断研究
收藏
分享
引用
第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会
作者:
马鸿超
张坤丽
赵悦淑
昝红英
庄雷
郑州大学信息工程学院 郑州 450001
郑州大学产业技术研究院 郑州 450001
郑州大学信息工程学院 郑州 450001
郑州大学第三附属医院 郑州 450052
中文产科电子病历中蕴含着大量的医疗知识和健康信息,针对电子病历的信息抽取及辅助诊断对提高人口的生育健康水平具有重要意义.电子病历中首次病程记录的入院诊断是根据主诉、辅助检查、查体等信息得出的,通常情况下诊断中包含正常诊...
详细信息
中文产科电子病历中蕴含着大量的医疗知识和健康信息,针对电子病历的信息抽取及辅助诊断对提高人口的生育健康水平具有重要意义.电子病历中首次病程记录的入院诊断是根据主诉、辅助检查、查体等信息得出的,通常情况下诊断中包含正常诊断、病理诊断及并发症,非单一结果,因此该文将辅助诊断问题转化为多标记分类任务.在对产科电子病历首次病程记录进行
数据
清洗和结构化的基础上,规范化诊断结论,将LDA所抽取的文本特征与病历中的数字特征采用向量拼接的方法融合为新的特征,按诊断结果出现的频次不同形成不同的多标记集,根据首次病程中部分信息进行辅助诊断,采用RAkEL、MLkNN、CC和BP-MLL方法进行多标记分类.实验结果表明采用融合特征的多标记分类方法能够提升中文产科电子病历辅助诊断的效果.
关键词:
中文产科电子病历
数据
清洗
辅助诊断
特征融合
多标记分类
来源:
评论
学校读者
我要写书评
暂无评论
基于
音系学模型的手语理解
基于音系学模型的手语理解
收藏
分享
引用
第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会
作者:
姚登峰
江铭虎
阿布都克力木.阿布力孜
李晗静
哈里旦木.阿布都克里木
北京市信息服务工程重点实验室(北京联合大学)
北京 100101
清华大学人文学院计算语言学实验室、心理学与认知科学研究中心
北京100084
清华大学人文学院计算语言学实验室、心理学与认知科学研究中心
北京100084
北京市信息服务工程重点实验室(北京联合大学)
北京 100101
清华大学计算机科学与技术系智能技术与系统国家重点实验室
北京100084
试图模拟人脑
处理
手势信号的过程,设计了一个混合的深层神经网络模型来解决
基于
音系学模型的手语理解问题,即手语音韵信息到文本转换的问题.为此首先综合了手语
语言学
里同时性和序列性这两个观点的长处,提出了一个手语音系学的改进模型...
详细信息
试图模拟人脑
处理
手势信号的过程,设计了一个混合的深层神经网络模型来解决
基于
音系学模型的手语理解问题,即手语音韵信息到文本转换的问题.为此首先综合了手语
语言学
里同时性和序列性这两个观点的长处,提出了一个手语音系学的改进模型.并针对难点设计了边感知边理解的算法,直接从
语言学
的音韵特征推断汉语文本,相比从视觉特征推断出汉语文本是一个很大的飞跃.实验验证了该认知
计算
技术的有效性,为实现类人智能奠定了技术基础.
关键词:
音韵参数
手语
深度学习
音系学模型
来源:
评论
学校读者
我要写书评
暂无评论
基于
CNN-BLSTM-CRF模型的生物医学命名实体识别
基于CNN-BLSTM-CRF模型的生物医学命名实体识别
收藏
分享
引用
第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会
作者:
李丽双
郭元凯
大连理工大学 计算机科学与技术学院
辽宁 大连 116023
命名实体识别是
自然语言处理
任务的重要步骤.近年来,不依赖人工特征的神经网络在新闻等通用领域命名实体识别方面表现了很好的性能.然而在生物医学领域,许多实验表明
基于
领域知识的人工特征对于神经网络模型的结果影响很大.因此,如何在...
详细信息
命名实体识别是
自然语言处理
任务的重要步骤.近年来,不依赖人工特征的神经网络在新闻等通用领域命名实体识别方面表现了很好的性能.然而在生物医学领域,许多实验表明
基于
领域知识的人工特征对于神经网络模型的结果影响很大.因此,如何在不依赖人工特征的情况下获得较好的生物医学命名实体识别性能是有待解决的问题.本文提出一种
基于
CNN-BLSTM-CRF的神经网络模型.首先利用卷积神经网络(CNN)训练出单词的具有形态特征的字符级向量,并从大规模背景语料训练得到具有语义特征信息的词向量,然后将二者进行组合作为输入,再构建适合生物医学命名实体识别的BLSTM-CRF深层神经网络模型.实验结果表明,不依赖任何人工特征,本文方法在BiocreativeⅡGM和JNLPBA2004生物医学语料上都达到了目前最好的结果,F-值分别为89.09%和74.40%.
关键词:
生物医学
命名实体识别
词向量
神经网络
CNN-BLSTM-CRF模型
来源:
评论
学校读者
我要写书评
暂无评论
融合概念对齐信息的中文AMR语料库的构建
融合概念对齐信息的中文AMR语料库的构建
收藏
分享
引用
第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会
作者:
李斌
闻媛
宋丽
卜丽君
曲维光
薛念文
南京师范大学 文学院
江苏省 南京市 210097
南京师范大学 计算机科学与技术学院
江苏省 南京市 210023
闽江学院 福建省信息处理与智能控制重点实验室
福建省 福州市 350121
布兰迪斯大学 计算机学院
美国 沃尔瑟姆市 02453
作为一种新的句子语义表示方法,抽象语义表示(AMR)将一个句子抽象为单根有向无环图,已经建立了较大规模的英文语料库.然而,句子中的词语和AMR图的概念对齐信息缺失,使得自动分析效果和语料
标注
质量受到影响,同时中文尚无较大规模的AMR...
详细信息
作为一种新的句子语义表示方法,抽象语义表示(AMR)将一个句子抽象为单根有向无环图,已经建立了较大规模的英文语料库.然而,句子中的词语和AMR图的概念对齐信息缺失,使得自动分析效果和语料
标注
质量受到影响,同时中文尚无较大规模的AMR语料库.本文介绍了中文AMR语料库的构建工作,针对汉语特点调整了AMR的
标注
体系,增加对复句关系的
标注
,提出了融合概念对齐的一体化
标注
方案,解决了中英文输入法频繁切换的问题,增加了错别字纠正和未
标注
词高亮功能,提高了
标注
效率.然后,从CTB中选取了6923句进行人工
标注
,形成中文AMR语料库,统计得到图和环的比例分别为48%和1%,以及利用对齐信息才能获取的非投影句的比例32%,为中文AMR的理论和自动分析研究奠定基础.
关键词:
抽象语义表示
语义图
句子语义
语言
知识库
来源:
评论
学校读者
我要写书评
暂无评论
没有更多数据了...
下一页
全选
清除本页
清除全部
题录导出
标记到“检索档案”
共6页
<<
<
1
2
3
4
5
6
>
>>
检索报告
对象比较
合并检索
0
隐藏
清空
合并搜索
回到顶部
执行限定条件
内容:
评分:
请选择保存的检索档案:
新增检索档案
确定
取消
请选择收藏分类:
新增自定义分类
确定
取消
订阅名称:
通借通还
温馨提示:
图书名称:
借书校区:
取书校区:
手机号码:
邮箱地址:
一卡通帐号:
电话和邮箱必须正确填写,我们会与您联系确认。
联 系 人:
所在院系:
联系邮箱:
联系电话:
暂无评论