咨询与建议

限定检索结果

文献类型

  • 2 篇 期刊文献

馆藏范围

  • 2 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 2 篇 工学
    • 2 篇 计算机科学与技术...
    • 2 篇 软件工程

主题

  • 1 篇 半监督式方法
  • 1 篇 数据增强
  • 1 篇 图模型
  • 1 篇 中文语法错误检测
  • 1 篇 多任务学习
  • 1 篇 统计特征
  • 1 篇 中文关键短语抽取

机构

  • 2 篇 北大方正信息产业...
  • 2 篇 北京雁栖湖应用数...
  • 2 篇 北京大学

作者

  • 2 篇 lyu xiaoqing
  • 2 篇 谢海华
  • 2 篇 汤帜
  • 2 篇 吕肖庆
  • 2 篇 xie haihua
  • 2 篇 tang zhi
  • 1 篇 chen zhiyou
  • 1 篇 陈志优
  • 1 篇 chen xuefei
  • 1 篇 程静
  • 1 篇 du yimin
  • 1 篇 都仪敏
  • 1 篇 cheng jing
  • 1 篇 陈雪飞

语言

  • 2 篇 中文
检索条件"机构=北大方正信息产业集团有限公司数字出版技术国家重点实验室"
2 条 记 录,以下是1-10 订阅
排序:
结合统计特征和图模型的半监督式中文关键短语抽取方法
收藏 引用
中文信息学报 2022年 第4期36卷 57-65页
作者: 谢海华 陈雪飞 都仪敏 吕肖庆 汤帜 北大方正信息产业集团有限公司数字出版技术国家重点实验室 北京100871 北京大学王选计算机研究所 北京100871 北京雁栖湖应用数学研究院 北京101407
关键短语抽取,即从文档中抽取能够表达文档主题和内容的关键短语集合,对于信息检索和文档分类等文本处理任务具有重要意义。然而,现有文献缺乏针对中文特点的关键短语抽取算法的研究。为此,该文提出了一种半监督式中文关键短语抽取模型... 详细信息
来源: 评论
基于数据增强和多任务特征学习的中文语法错误检测方法
收藏 引用
中文信息学报 2022年 第12期36卷 36-43页
作者: 谢海华 陈志优 程静 吕肖庆 汤帜 北大方正信息产业集团有限公司数字出版技术国家重点实验室 北京100871 北京大学王选计算机研究所 北京100871 北京雁栖湖应用数学研究院 北京101408
由于中文语法的复杂性,中文语法错误检测(CGED)的难度较大,而训练语料和相关研究的缺乏,使得CGED的效果还远未达到实用的程度。该文提出一种CGED模型,APM-CGED,采用数据增强、预训练语言模型和基于语言学特征多任务学习的方式,弥补训练... 详细信息
来源: 评论