咨询与建议

限定检索结果

文献类型

  • 8 篇 期刊文献
  • 2 篇 学位论文

馆藏范围

  • 10 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 10 篇 工学
    • 10 篇 计算机科学与技术...
    • 9 篇 软件工程
    • 2 篇 控制科学与工程
  • 2 篇 管理学
    • 2 篇 管理科学与工程(可...

主题

  • 10 篇 多语言预训练模型
  • 2 篇 数据增强
  • 2 篇 低资源语言信息处...
  • 2 篇 自然语言处理
  • 2 篇 低资源语言
  • 1 篇 多语言事件探测
  • 1 篇 跨语言知识迁移
  • 1 篇 表征空间结构对齐
  • 1 篇 情感分类
  • 1 篇 生成式摘要
  • 1 篇 迁移学习
  • 1 篇 抽取式摘要
  • 1 篇 多目标学习
  • 1 篇 机器翻译
  • 1 篇 mbert模型
  • 1 篇 大模型微调
  • 1 篇 对比损失
  • 1 篇 大语言模型
  • 1 篇 双语对齐
  • 1 篇 敏感信息识别

机构

  • 2 篇 中央民族大学
  • 2 篇 中国科学院大学
  • 1 篇 广西大学
  • 1 篇 西藏自治区藏文信...
  • 1 篇 西藏大学
  • 1 篇 长春工业大学
  • 1 篇 昆明理工大学
  • 1 篇 中国科学院成都计...
  • 1 篇 新疆财经大学
  • 1 篇 华东理工大学
  • 1 篇 藏文信息技术教育...

作者

  • 2 篇 翁彧
  • 2 篇 刘征
  • 2 篇 董俊
  • 2 篇 超木日力格
  • 2 篇 罗皓予
  • 2 篇 刘轩
  • 1 篇 shi yaqing
  • 1 篇 hou yutao
  • 1 篇 余正涛
  • 1 篇 侯钰涛
  • 1 篇 张勇丙
  • 1 篇 ruan tong
  • 1 篇 liu ming
  • 1 篇 wang kunning
  • 1 篇 王菁
  • 1 篇 he zhiyi
  • 1 篇 宋雨秋
  • 1 篇 yu zheng-tao
  • 1 篇 halidanmu abuduk...
  • 1 篇 哈里旦木·阿布都克...

语言

  • 10 篇 中文
检索条件"主题词=多语言预训练模型"
10 条 记 录,以下是1-10 订阅
排序:
基于交替语言数据重构方法的跨语言文本相似度模型
收藏 引用
吉林大学学报(理学版) 2025年 第2期63卷 551-558页
作者: 王轶 王坤宁 刘铭 长春工业大学外国语学院 长春130012 长春工业大学数学与统计学院 长春130012
针对现有多语言模型训练过程中对多语言数据集的利用效率低,导致跨语言上下文学习能力不足,进而产生语言偏差的问题,提出一种基于交替语言数据重构方法的跨语言文本相似度模型.该方法通过对称地替换平行语料中的中英文词语,形成重... 详细信息
来源: 评论
基于对比损失的低资源语言情感分类
收藏 引用
电脑知识与技术 2025年 第6期21卷 9-11页
作者: 杜广进 拥措 西藏大学信息科学技术学院 西藏拉萨850000 西藏自治区藏文信息技术人工智能重点实验室 西藏拉萨850000 藏文信息技术教育部工程研究中心 西藏拉萨850000
随着自然语言处理技术的快速发展,跨语言训练模型为低资源语言处理提供了新的研究途径。然而,现有模型在马来语、豪萨语等低资源语言上的性能仍有待提升,主要受限于训练数据的匮乏和质量不均。特别是在情感分类任务中,传统的全参数微... 详细信息
来源: 评论
Lacmia:抗混淆的多民族语言生成式摘要模型
收藏 引用
中文信息学报 2024年 第10期38卷 80-94页
作者: 翁彧 罗皓予 刘征 超木日力格 刘轩 董俊 中央民族大学民族语言智能分析与安全治理教育部重点实验室 中央民族大学信息工程学院
该文提出了一种针对中国多民族低资源语言生成式摘要模型Lacmia(Language-Anti-confusioned Chinese Minority Abstractive Summarization Model)。为了克服以往模型只能处理单一语言的限制,Lacmia采用了一种统一的生成式架构来执行不... 详细信息
来源: 评论
多语言模型的优化及其在跨语言信息检索上的应用
多语言模型的优化及其在跨语言信息检索上的应用
收藏 引用
作者: 汪润川 中国科学院大学
学位级别:硕士
语言信息检索(Cross-lingualInformationRetrieve,CLIR)是一种特殊的信息检索任务,它的检索词和被检索文档并非使用同一种语言书写。传统的跨语言检索方法依赖于翻译系统将检索词和文档翻译成同一种语言,从而将跨语言检索转换为单... 详细信息
来源: 评论
面向“一带一路”的低资源语言机器翻译研究
收藏 引用
计算机工程 2024年 第4期50卷 332-341页
作者: 侯钰涛 阿布都克力木·阿布力孜 史亚庆 马依拉木·木斯得克 哈里旦木·阿布都克里木 新疆财经大学信息管理学院 新疆乌鲁木齐830012
随着“一带一路”倡议的深入推进,沿线国家和地区之间的跨语言沟通需求日渐增长,机器翻译技术逐渐成为各国之间深入交流的重要手段。然而,这些国家存在大量低资源语言,语料的稀缺性导致其机器翻译研究进展较为缓慢。针对该问题,提出一... 详细信息
来源: 评论
CINOSUM:面向多民族低资源语言的抽取式摘要模型
收藏 引用
计算机科学 2024年 第7期 296-302页
作者: 翁彧 罗皓予 超木日力格 刘轩 董俊 刘征 中央民族大学民族语言智能分析与安全治理教育部重点实验室 中央民族大学中国少数民族语言文学学院
针对现有的模型无法处理多民族低资源语言自动摘要生成的问题,基于CINO提出了一种面向多民族低资源语言的抽取式摘要模型CINOSUM。为扩大文本摘要的语言范围,首先构建了多种民族语言的摘要数据集MESUM。为解决以往模型在低资源语言上... 详细信息
来源: 评论
融合敏感词典和异构图的汉泰跨语言敏感信息识别
收藏 引用
计算机工程与设计 2024年 第7期45卷 2150-2156页
作者: 朱栩冉 余正涛 张勇丙 昆明理工大学信息工程与自动化学院 云南昆明650500 昆明理工大学云南省人工智能重点实验室 云南昆明650500
通用跨语言文本分类模型识别毒品、暴力和自然灾害等敏感信息不准确,且汉泰双语敏感词表示多样化、难对齐导致不同语言信息聚合能力较弱,为此提出一种融合敏感词典和异构图的汉泰跨语言敏感信息识别方法。利用汉泰敏感词典构建具有文档... 详细信息
来源: 评论
基于跨层级多视角特征的多语言事件探测
收藏 引用
计算机科学 2024年 第5期51卷 208-215页
作者: 张志远 张维彦 宋雨秋 阮彤 华东理工大学信息工程与科学学院 上海200237
多语言事件探测任务的目标是将多种语言的新闻文档集合组织成不同的关键事件,其中每个事件可以包含不同语言的新闻文档。该任务有助于各种下游任务应用,如多语言知识图谱构建、事件推理、信息检索等。目前,多语言事件探测主要分为先翻... 详细信息
来源: 评论
基于表征空间结构对齐的跨语言知识迁移方法
收藏 引用
计算机应用 2024年 第S2期44卷 18-23页
作者: 任思远 彭程 陈科 何智毅 中国科学院成都计算机应用研究所 成都610213 中国科学院大学 北京100049
在自然语言处理(NLP)领域中,对比学习作为一种高效的句子表征学习方法,有效缓解了基于Transformer的训练语言模型的各向异性,并显著提升了句子表征的质量。然而,现有研究集中在英语上,尤其是在有监督设置下的情况。由于缺乏有标签数据... 详细信息
来源: 评论
面向低资源环境下的神经机器翻译研究
面向低资源环境下的神经机器翻译研究
收藏 引用
作者: 王菁 广西大学
学位级别:硕士
机器翻译是指利用计算机将源语言句子翻译成目标语言句子的过程。随着深度学习技术的广泛应用和快速发展,神经机器翻译开始成为机器翻译领域的新范式。尽管神经机器翻译的出现有效提高了译文的翻译质量,但是低资源环境下的神经机器翻译... 详细信息
来源: 评论