咨询与建议

限定检索结果

文献类型

  • 3 篇 期刊文献
  • 3 篇 学位论文

馆藏范围

  • 6 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 6 篇 工学
    • 6 篇 计算机科学与技术...
    • 6 篇 软件工程

主题

  • 6 篇 无标注语料
  • 2 篇 命名实体识别
  • 2 篇 互信息
  • 2 篇 语言模型
  • 2 篇 五笔字形
  • 1 篇 主观性
  • 1 篇 级差线索
  • 1 篇 结构化机器学习
  • 1 篇 最大熵(me)
  • 1 篇 最大熵
  • 1 篇 语音合成
  • 1 篇 主体线索
  • 1 篇 汉字主观性
  • 1 篇 韵律短语边界
  • 1 篇 上下文相关字向量
  • 1 篇 统计学习
  • 1 篇 韵律短语
  • 1 篇 词义消歧
  • 1 篇 评级

机构

  • 2 篇 苏州大学
  • 2 篇 山西大学
  • 1 篇 计算语言学教育部...
  • 1 篇 国防科学技术大学
  • 1 篇 闽江学院
  • 1 篇 北京大学

作者

  • 2 篇 张栋
  • 2 篇 蔡滢滢
  • 1 篇 周云
  • 1 篇 蒙新泛
  • 1 篇 王铭涛
  • 1 篇 陈文亮
  • 1 篇 徐戈
  • 1 篇 王厚峰
  • 1 篇 钱揖丽

语言

  • 6 篇 中文
检索条件"主题词=无标注语料"
6 条 记 录,以下是1-10 订阅
排序:
采用无标注语料和词“粘连”剔除策略的韵律短语识别
收藏 引用
计算机科学 2016年 第2期43卷 51-56页
作者: 钱揖丽 蔡滢滢 山西大学计算机与信息技术学院 太原030006 山西大学计算智能与中文信息处理教育部重点实验室 太原030006
针对人工标注韵律结构获取大规模语料的困难和问题,利用标点符号能够表示停顿的性质,提出一种采用无标注语料和词"粘连"剔除策略的韵律短语识别方法。对标点符号划分等级,并在利用其模拟韵律边界时对其赋予不同的权重。基于... 详细信息
来源: 评论
采用无标注语料及词“粘连”剔除策略的韵律短语预测
采用无标注语料及词“粘连”剔除策略的韵律短语预测
收藏 引用
作者: 蔡滢滢 山西大学
学位级别:硕士
科技在进步,时代在发展。在这个"读图"和"听音"的时代,语音技术已不再陌生,让机器开口"说话"也不再是幻想。目前,语音合成的清晰度已达到人们的要求,流畅度却尚待提高,合成的语音自然度低、节奏感差。因... 详细信息
来源: 评论
结合五笔字形与上下文相关字向量的命名实体识别
收藏 引用
计算机工程 2021年 第3期47卷 94-101页
作者: 张栋 王铭涛 陈文亮 苏州大学计算机科学与技术学院 江苏苏州215006
命名实体识别(NER)作为自然语言处理的重要部分,在信息抽取和知识图谱等任务中得到广泛应用。然而目前中文预训练语言模型通常仅对上下文中的字符进行建模,忽略了中文字符的字形结构。提出2种结合五笔字形的上下文相关字向量表示方法,... 详细信息
来源: 评论
采用无标注语料的动词和形容词主观性评级
收藏 引用
软件学报 2013年 第5期24卷 1036-1050页
作者: 徐戈 蒙新泛 王厚峰 北京大学计算语言学研究所 北京100871 计算语言学教育部重点实验室(北京大学) 北京100871 闽江学院计算机科学系 福建福州350108
为了自动区分中文主观词和客观词,采用主观性线索和汉字的主观性两种手段对动词和形容词进行主观性度量.主观性的线索进一步被分成级差(gradability)线索和主体(subject)线索;根据这些线索,使用基于图的算法进行评级(ranking).在汉语主... 详细信息
来源: 评论
基于预训练语言模型的中文命名实体识别
基于预训练语言模型的中文命名实体识别
收藏 引用
作者: 张栋 苏州大学
学位级别:硕士
中文命名实体识别任务一般都被看作序列标注问题,目前常用的解决方案是基于神经网络的深度学习方法。字向量的初始化对于基于神经网络的中文命名实体识别模型的性能影响较大。传统的字向量通常在大规模无标注语料上采用预训练方式得到... 详细信息
来源: 评论
基于统计学习的词义消歧关键技术研究
基于统计学习的词义消歧关键技术研究
收藏 引用
作者: 周云 国防科学技术大学
学位级别:博士
自然语言的歧义性,是计算机处理和理解文本的重大难题之一。语言的各个层面都存在歧义性,包括语音、词法、句法、语义和语用等。本文重点关注词法层面歧义的处理,即自动词义消歧。自动词义消歧,即在特定的上下文中为单词选择合适的词义... 详细信息
来源: 评论