检索结果-内蒙古大学图书馆

清华大学学报（自然科学版） 2024年第4期64卷 679-687页

作者：任俊飞朱桐陈文亮苏州大学计算机科学与技术学院苏州215006

多标签文本分类(multi-label text classification,MLTC)旨在从预定义的候选标签中选择一个或多个文本相关的类别,是自然语言处理(natural language processing,NLP)的一项基本任务。前人工作大多基于规范且全面的标注数据集,而这些规... 详细信息

多标签文本分类(multi-label text classification,MLTC)旨在从预定义的候选标签中选择一个或多个文本相关的类别,是自然语言处理(natural language processing,NLP)的一项基本任务。前人工作大多基于规范且全面的标注数据集,而这些规范数据集需要严格的质量控制,一般很难获取。在真实的标注过程中,难免会缺失标注一些相关标签,进而导致不完全标注问题。该文提出了一种基于部分标注的自训练多标签文本分类(partial labeling self-training for multi-label text classification,PST)框架,该框架利用教师模型自动地给大规模无标注数据分配标签,同时给不完全标注数据补充缺失标签,最后再利用这些数据反向更新教师模型。在合成数据集和真实数据集上的实验表明,PST框架兼容现有的各类多标签文本分类模型,并且可以缓解不完全标注数据对模型的影响。

关键词：多标签文本分类不完全标注自训练

来源：评论

学校读者我要写书评

暂无评论

文档级神经机器翻译综述

引用

软件学报 2025年第1期36卷 152-183页

作者：吕星林李军辉陶仕敏杨浩张民苏州大学计算机科学与技术学院江苏苏州215006 华为翻译中心北京100080

机器翻译(machine translation,MT)研究旨在构建一个自动转换系统,将给定源语言序列自动地转换为具有相同语义的目标语言序列.由于机器翻译广阔的应用场景,使其成为自然语言理解领域乃至人工智能领域的一个重要的研究方向.近年来,端到... 详细信息

机器翻译(machine translation,MT)研究旨在构建一个自动转换系统,将给定源语言序列自动地转换为具有相同语义的目标语言序列.由于机器翻译广阔的应用场景,使其成为自然语言理解领域乃至人工智能领域的一个重要的研究方向.近年来,端到端的神经机器翻译(neural machine translation,NMT)方法显著超越了统计机器翻译(statistical machine translation,SMT)方法,成为目前机器翻译研究的主流方法.然而,神经机器翻译系统通常以句子为翻译单位,在面向文档的翻译场景中,将文档中每个句子独立地进行翻译,会因脱离文档的篇章语境引起一些篇章级的错误,如词语错翻、句子间不连贯等.因此将文档级的信息融入到翻译的过程中去解决跨句的篇章级错误是更加自然和合理的做法,文档级的神经机器翻译(document-level neural machine translation,DNMT)的目标正是如此,成为机器翻译研究的热门方向.调研了近年来在文档级神经机器翻译研究方向的主要工作,从篇章评测方法、使用的数据集和模型方法等方面系统地对当前研究工作进行了归纳与阐述,目的是帮助研究者们快速了解文档级神经机器翻译研究现状以及未来的发展和研究方向.同时在文中也阐述了在文档级神经机器翻译的一些展望、困难和挑战,希望能带给研究者们一些启发.

关键词：神经机器翻译 Transformer模型文档上下文篇章评测

来源：评论

学校读者我要写书评

暂无评论

基于原型增强的元学习分类模型

引用

计算机工程与应用 2025年第6期61卷 273-281页

作者：翟文茜李凡长苏州大学计算机科学与技术学院江苏苏州215006

元学习旨在利用已有的知识经验快速获取新知识、适应新任务,是解决小样本分类问题常用的方法之一。现有的元学习方法在特征提取时通常会忽略任务中支持集样本和查询集样本之间的关系,从而无法获得最具鉴别性的特征,导致类原型不可靠。因... 详细信息

元学习旨在利用已有的知识经验快速获取新知识、适应新任务,是解决小样本分类问题常用的方法之一。现有的元学习方法在特征提取时通常会忽略任务中支持集样本和查询集样本之间的关系,从而无法获得最具鉴别性的特征,导致类原型不可靠。因此,提出一种基于原型增强的元学习分类模型。该模型主要由两部分组成:特征表示模块与原型修正模块。针对现有方法特征利用不足的问题,特征表示模块利用注意力机制捕捉支持集和查询集样本间的交互信息并更新其特征表示;而针对数据稀缺问题,原型修正模块利用部分查询集的无标签样本扩充支持集,进而对原型位置进行迭代修正。在mini-ImageNet和tiered-ImageNet数据集上的实验结果表明,该模型的分类准确率与其他元学习方法相比有较为显著的提升。

关键词：原型增强元学习小样本学习图像分类

来源：评论

学校读者我要写书评

暂无评论

基于YOLOv8n的表格线检测改进模型

引用

计算机工程与应用 2025年第2期61卷 112-123页

作者：韦超钱春雨黄启鹏杜林轩杨哲苏州大学计算机科学与技术学院江苏苏州215006

在表格识别重构任务中,分割和合并的重构方法需要通过检测表格线进而重构出电子表格,因此表格线检测结果的质量直接决定了表格重构的效果。针对已有方法存在误检漏检的问题,提出一种YOLOv8n改进模型,用于表格线检测。在主干网络中,利用S... 详细信息

在表格识别重构任务中,分割和合并的重构方法需要通过检测表格线进而重构出电子表格,因此表格线检测结果的质量直接决定了表格重构的效果。针对已有方法存在误检漏检的问题,提出一种YOLOv8n改进模型,用于表格线检测。在主干网络中,利用Swin Transformer的思想改进BottleneckCSP模块,可以捕捉到更长距离的上下文信息,提升对于大尺度表格线的识别能力;针对表格线细长密集的特点,引入蛇形动态卷积的思想改进C2f(CSPLayer_2Conv)模块,根据特征之间的空间关系自适应地调整卷积核的形状和位置,从而更好地捕获特征之间的相关性和局部细节,进而提高特征建模能力;通过CBAM(convolutional block attention module)注意力机制改造空间金字塔池化层,动态地调整特征图中每个通道和空间位置的重要性,从而增强特征图的区分能力;优化颈部结构,引入混洗卷积来改造颈部结构。实验结果表明,改进后的YOLOv8n模型在ICDAR_2013和PubTabNet数据集上,m AP@0.5:0.95、准确率、召回率分别提升了0.079、0.301、0.088,性能超过YOLO同系列模型。这些改进使得YOLOv8n模型在表格线检测任务中展现出了优异的性能,通过与合并方法结合,可以进一步提升表格重构的效果。

关键词：表格线 YOLOv8n 注意力机制动态蛇形卷积 Transformer 轻量化

来源：评论

学校读者我要写书评

暂无评论

面向低资源关系抽取的自训练方法

引用

软件学报 2025年第4期36卷 1620-1636页

作者：郁俊杰王星陈文亮张民苏州大学计算机科学与技术学院江苏苏州215006 腾讯AI Lab 广东深圳518000

自训练是缓解标注数据不足问题的常见方法,其通常做法是利用教师模型去获取高置信度的自动标注数据作为可靠数据.然而在低资源场景关系抽取任务上,该方法不仅存在教师模型泛化能力差的问题,而且受到关系抽取任务中易混淆关系类别的影响... 详细信息

自训练是缓解标注数据不足问题的常见方法,其通常做法是利用教师模型去获取高置信度的自动标注数据作为可靠数据.然而在低资源场景关系抽取任务上,该方法不仅存在教师模型泛化能力差的问题,而且受到关系抽取任务中易混淆关系类别的影响,导致难以从自动标注数据中有效地识别出可靠数据,同时产生大量难以利用的低置信度噪音数据.因此,提出一种有效利用低置信度数据的自训练方法ST-LRE(self-training approach for lowresource relation extraction).该方法一方面基于复述增强的预测方法来加强教师模型筛选可靠数据的能力;另一方面,基于部分标注模式从低置信度数据中提炼出可利用的模糊数据.基于模糊数据的候选类别集合,提出了基于负标签集合的负向训练方法.最后,为了支持可靠数据和模糊数据的融合训练,提出一种支持正负向训练的联合方法.在两个广泛使用的关系抽取数据集SemEval2010 Task-8和Re-TACRED的低资源场景上进行实验,ST-LRE方法取得显著且一致的提升.

关键词：自然语言处理信息抽取关系抽取低资源自训练

来源：评论

学校读者我要写书评

暂无评论

属性抽取研究综述

引用

软件学报 2023年第2期34卷 690-711页

作者：徐庆婷洪宇潘雨晨姚建民周国栋苏州大学计算机科学与技术学院江苏苏州215006

属性抽取是一种自动识别和提取属性表述文字的自然语言处理任务.首先重温了属性抽取的基本任务、权威数据资源和通用评测规范,并在此基础上全面回顾了现有前沿技术,包括基于统计策略和特征工程的传统抽取技术以及利用深度学习的神经抽... 详细信息

属性抽取是一种自动识别和提取属性表述文字的自然语言处理任务.首先重温了属性抽取的基本任务、权威数据资源和通用评测规范,并在此基础上全面回顾了现有前沿技术,包括基于统计策略和特征工程的传统抽取技术以及利用深度学习的神经抽取技术.特别地,以属性表述语言的本质为出发点,结合现有技术暴露出的不足,对该领域的技术难点和推演方向给出了详细解释.

关键词：自然语言处理属性抽取深度学习

来源：评论

学校读者我要写书评

暂无评论

基于跨语言图神经网络模型的属性级情感分类

引用

软件学报 2023年第2期34卷 676-689页

作者：鲍小异姜晓彤王中卿周国栋苏州大学计算机科学与技术学院江苏苏州215006

目前,在属性级情感分类任务上较为成熟的有标注数据集均为英文数据集,而有标注的中文数据集较少.为了能够更好地利用规模庞大但却缺乏成熟标注数据的中文语言数据集,针对跨语言属性级情感分类任务进行了研究.在跨语言属性级情感分类中,... 详细信息

目前,在属性级情感分类任务上较为成熟的有标注数据集均为英文数据集,而有标注的中文数据集较少.为了能够更好地利用规模庞大但却缺乏成熟标注数据的中文语言数据集,针对跨语言属性级情感分类任务进行了研究.在跨语言属性级情感分类中,一个核心问题为如何构建不同语言的文本之间的联系.针对该问题,在传统的单语言情感分类模型的基础上,使用图神经网络模型对跨语言词-词、词-句之间的关系信息进行建模,从而有效地刻画两种语言数据集之间的联系.通过构建单语词-句之间的联系和双语词-句之间的联系,将不同语言的文本关联起来,并利用图神经网络进行建模,从而实现利用英文数据集预测中文数据集的跨语言神经网络模型.实验结果表明:相较于其他基线模型,所提出的模型在F1值指标上有着较大的提升,从而说明使用图神经网络建立的模型能够有效地应用于跨语言的应用场.

关键词：图神经网络属性级情感分析跨语言

来源：评论

学校读者我要写书评

暂无评论

面向无人机视角下小目标检测的YOLOv8s改进模型

引用

计算机工程与应用 2024年第9期60卷 142-150页

作者：潘玮韦超钱春雨杨哲苏州大学计算机科学与技术学院江苏苏州215006

从无人机视角进行目标检测,面临图像目标小、分布密集、类别不均衡等难点,且由于无人机的硬件条件限制了模型的规模,导致模型的准确率偏低。提出一种融合多种注意力机制的YOLOv8s改进模型,在骨干网络中引入感受野注意力卷积和CBAM(conce... 详细信息

从无人机视角进行目标检测,面临图像目标小、分布密集、类别不均衡等难点,且由于无人机的硬件条件限制了模型的规模,导致模型的准确率偏低。提出一种融合多种注意力机制的YOLOv8s改进模型,在骨干网络中引入感受野注意力卷积和CBAM(concentration-based attention module)注意力机制改进卷积模块,解决注意力权重参数在感受野特征中共享问题的同时,在通道和空间维度加上注意力权重,增强特征提取能力;通过引入大型可分离卷积注意力思想,改造空间金字塔池化层,增加不同层级特征间的信息交融;优化颈部结构,增加具有丰富小目标语义信息的特征层;使用inner-IoU损失函数的思想改进MPDIoU(minimum point distance based IoU)函数,以innerMPDIoU代替原损失函数,提升对困难样本的学习能力。实验结果表明,改进后的YOLOv8s模型在VisDrone数据集上mAP、P、R分别提升了16.1%、9.3%、14.9%,性能超过YOLOv8m,可以有效应用于无人机平台上的目标检测任务。

关键词：无人机小目标检测 YOLOv8s 感受野注意力大型可分离卷积

来源：评论

学校读者我要写书评

暂无评论

常识问答研究综述

引用

软件学报 2024年第1期35卷 236-265页

作者：范怡帆邹博伟徐庆婷李志峰洪宇苏州大学计算机科学与技术学院江苏苏州215006 Infocomm Research Institute of Singapore Singapore 138635Singapore

常识问答是一项重要的自然语言理解任务,旨在利用常识知识对自然语言问句进行自动求解,以得到准确答案.常识问答在虚拟助手或社交聊天机器人等领域有着广泛的应用前景,且其蕴涵了知识挖掘与表示、语言理解与计算、答案推理和生成等关键... 详细信息

常识问答是一项重要的自然语言理解任务,旨在利用常识知识对自然语言问句进行自动求解,以得到准确答案.常识问答在虚拟助手或社交聊天机器人等领域有着广泛的应用前景,且其蕴涵了知识挖掘与表示、语言理解与计算、答案推理和生成等关键科学问题,因而受到工业界和学术界的广泛关注.首先介绍常识问答领域的主要数据集;其次,归纳不同常识知识源在构建方式、常识来源和表现形式上的区别;同时,重点分析并对比前沿常识问答模型,以及融合常识知识的特色方法.特别地,根据不同问答任务场景中常识知识的共性和特性,建立包含属性、语义、因果、语境、抽象和意图6大类的知识分类体系.以此为支撑,针对常识知识数据集建设,感知知识融合和预训练语言模型的协作机制,以及在此基础上的常识知识预分类技术,进行前瞻性的研究,并具体报告上述模型在跨数据集迁移场景下的性能变化,及其在常识答案推理中的潜在贡献.总体上,包含对现有数据和前沿技术的回顾,也包含面向跨数据知识体系建设、技术迁移与通用化的预研内容,借以在汇报领域技术积累的前提下,为其理论和技术的进一步发展提供参考意见.

关键词：常识问答常识知识源常识知识类型

来源：评论

学校读者我要写书评

暂无评论

基于双视角建模的多智能体协作强化学习方法

引用

计算机学报 2024年第7期47卷 1582-1594页

作者：刘全施眉龙黄志刚张立华苏州大学计算机科学与技术学院江苏苏州215006 苏州大学江苏省计算机信息处理技术重点实验室江苏苏州215006

在多智能体协作领域,强化学习算法通过共享智能体的局部信息来实现智能体间的协作.但共享协作机制极易引发过度协作问题,导致智能体忽视自身局部观测信息,丧失策略多样性,最终陷入低效协作的困境.为了解决该问题,本文提出基于双视角建... 详细信息

在多智能体协作领域,强化学习算法通过共享智能体的局部信息来实现智能体间的协作.但共享协作机制极易引发过度协作问题,导致智能体忽视自身局部观测信息,丧失策略多样性,最终陷入低效协作的困境.为了解决该问题,本文提出基于双视角建模的多智能体协作强化学习方法(Bi-View Modeling Collaborative Multi-Agent Reinforcement Learning,简称BVM-CMARL).该方法从局部和全局两个视角对智能体进行建模,分别用于产生多样性的策略和激励协作.在局部视角最大化局部变分与自身轨迹的互信息,激励智能体的策略多样性;同时在全局视角最大化全局变分与其他智能体动作的互信息,提高智能体协作水平.最后将局部变分训练出的局部Q值与全局变分训练出的全局Q值合并,避免低效协作.将BVM-CMARL算法应用于星际争霸多智能体挑战赛(StarCraft Multi-Agent Challenge,SMAC)中的等级觅食(Level-Based Foraging,LBF)和走廊(Hallway)等环境,与QMIX、QPLEX、RODE、EOI和MAVEN等5种目前优秀的强化学习算法相比,BVM-CMARL算法具有更好的稳定性和性能表现,在SMAC上的平均胜率为82.81%,比次优算法RODE高13.42%.通过设计模型变体,在消融实验中证明了双视角建模对BVM-CMARL的必要性.

关键词：深度强化学习多智能体系统多智能体协作协作建模对比学习

来源：评论

学校读者我要写书评

暂无评论

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案：

请选择收藏分类：

通借通还

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案： 新增检索档案 确定 取消

请选择收藏分类： 新增自定义分类 确定 取消

通借通还

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

请选择保存的检索档案：

请选择收藏分类：