检索结果-内蒙古大学图书馆

小型微型计算机系统 2025年第3期46卷 513-519页

作者：曾鹏武谢志鹏复旦大学计算机科学技术学院上海200438

现有的命名实体识别方法需要大量训练数据,在小样本场景下容易过拟合.针对该问题,提出一种基于预训练模型掩码预测的方法,引入上下文信息改善模型泛化能力.首先使用两路BERT(Bidirectional Encoder Representation from Transformers)... 详细信息

现有的命名实体识别方法需要大量训练数据,在小样本场景下容易过拟合.针对该问题,提出一种基于预训练模型掩码预测的方法,引入上下文信息改善模型泛化能力.首先使用两路BERT(Bidirectional Encoder Representation from Transformers)预训练模型,通过掩码替换计算当前词汇的词元表征和上下文表征;随后计算两者在BERT词表上的概率向量,使用自适应门控机制加权求和获得融合概率.若预测概率最大的词为本文预定义的类别标签词,则将当前词元分类为实体,否则分类为非实体.在来自不同领域的CoNLL03、OntoNotes5.0以及MIT-Movie数据集上的实验结果表明,所提算法的平均F1值相较于基准方法提升了12%,相较于提示词方法提升了4%~11%,有效改善了小样本下的泛化性能,证明引入上下文信息的有效性.

关键词：小样本学习命名实体识别 BERT 掩码预测

来源：评论

学校读者我要写书评

暂无评论

面向内核漏洞利用的堆喷对象控制代码自动化生成技术

引用

计算机工程 2025年第4期51卷 178-187页

作者：刘壮顾康正谈心张源复旦大学计算机科学技术学院上海200438

开发漏洞利用程序是评估内核漏洞可利用性的主要方式。堆喷对象在漏洞利用过程中被广泛使用,以完成数据注入、内存布局等恶意行为。现有堆喷对象的研究忽略了基本类型的堆喷对象,无法生成能够编辑堆喷对象内容的代码。为此,提出面向内... 详细信息

开发漏洞利用程序是评估内核漏洞可利用性的主要方式。堆喷对象在漏洞利用过程中被广泛使用,以完成数据注入、内存布局等恶意行为。现有堆喷对象的研究忽略了基本类型的堆喷对象,无法生成能够编辑堆喷对象内容的代码。为此,提出面向内核漏洞利用的堆喷对象控制代码自动化生成技术。该技术包含了基于使用-定义链分析的堆喷对象识别和基于导向式模糊测试的堆喷对象控制代码生成。通过使用-定义链分析静态识别出目标内核中的堆喷对象及能够操控这些对象的关键代码位置;将识别到的关键代码作为目标点,利用导向式模糊测试技术动态生成目标堆喷对象的控制代码,以辅助漏洞利用。实验结果表明,该技术能够在Linux 5.15版本的内核中识别并生成28个堆喷对象的控制代码,覆盖了现有研究识别到的所有堆喷对象。生成的控制代码中共有23个能控制堆喷对象完成预期目标,成功率为82.1%。案例分析表明,该技术生成的控制代码应用于真实内核漏洞的利用程序开发中。

关键词：内核安全内核漏洞漏洞利用堆喷对象控制代码生成

来源：评论

学校读者我要写书评

暂无评论

文档级神经机器翻译综述

引用

软件学报 2025年第1期36卷 152-183页

作者：吕星林李军辉陶仕敏杨浩张民苏州大学计算机科学与技术学院江苏苏州215006 华为翻译中心北京100080

机器翻译(machine translation,MT)研究旨在构建一个自动转换系统,将给定源语言序列自动地转换为具有相同语义的目标语言序列.由于机器翻译广阔的应用场景,使其成为自然语言理解领域乃至人工智能领域的一个重要的研究方向.近年来,端到... 详细信息

机器翻译(machine translation,MT)研究旨在构建一个自动转换系统,将给定源语言序列自动地转换为具有相同语义的目标语言序列.由于机器翻译广阔的应用场景,使其成为自然语言理解领域乃至人工智能领域的一个重要的研究方向.近年来,端到端的神经机器翻译(neural machine translation,NMT)方法显著超越了统计机器翻译(statistical machine translation,SMT)方法,成为目前机器翻译研究的主流方法.然而,神经机器翻译系统通常以句子为翻译单位,在面向文档的翻译场景中,将文档中每个句子独立地进行翻译,会因脱离文档的篇章语境引起一些篇章级的错误,如词语错翻、句子间不连贯等.因此将文档级的信息融入到翻译的过程中去解决跨句的篇章级错误是更加自然和合理的做法,文档级的神经机器翻译(document-level neural machine translation,DNMT)的目标正是如此,成为机器翻译研究的热门方向.调研了近年来在文档级神经机器翻译研究方向的主要工作,从篇章评测方法、使用的数据集和模型方法等方面系统地对当前研究工作进行了归纳与阐述,目的是帮助研究者们快速了解文档级神经机器翻译研究现状以及未来的发展和研究方向.同时在文中也阐述了在文档级神经机器翻译的一些展望、困难和挑战,希望能带给研究者们一些启发.

关键词：神经机器翻译 Transformer模型文档上下文篇章评测

来源：评论

学校读者我要写书评

暂无评论

基于原型增强的元学习分类模型

引用

计算机工程与应用 2025年第6期61卷 273-281页

作者：翟文茜李凡长苏州大学计算机科学与技术学院江苏苏州215006

元学习旨在利用已有的知识经验快速获取新知识、适应新任务,是解决小样本分类问题常用的方法之一。现有的元学习方法在特征提取时通常会忽略任务中支持集样本和查询集样本之间的关系,从而无法获得最具鉴别性的特征,导致类原型不可靠。因... 详细信息

元学习旨在利用已有的知识经验快速获取新知识、适应新任务,是解决小样本分类问题常用的方法之一。现有的元学习方法在特征提取时通常会忽略任务中支持集样本和查询集样本之间的关系,从而无法获得最具鉴别性的特征,导致类原型不可靠。因此,提出一种基于原型增强的元学习分类模型。该模型主要由两部分组成:特征表示模块与原型修正模块。针对现有方法特征利用不足的问题,特征表示模块利用注意力机制捕捉支持集和查询集样本间的交互信息并更新其特征表示;而针对数据稀缺问题,原型修正模块利用部分查询集的无标签样本扩充支持集,进而对原型位置进行迭代修正。在mini-ImageNet和tiered-ImageNet数据集上的实验结果表明,该模型的分类准确率与其他元学习方法相比有较为显著的提升。

关键词：原型增强元学习小样本学习图像分类

来源：评论

学校读者我要写书评

暂无评论

抢占AI话语权：DeepSeek的技术优势、战略布局与未来生态图景

引用

新疆师范大学学报(哲学社会科学版) 2025年第4期 109-125页

作者：段玉聪海南大学计算机科学与技术学院

文本以全球AI话语权争夺为背景，探讨了中国初创公司Deep Seek在大规模语言模型领域中的技术突破与战略布局。一是解析Deep Seek在算法架构上的创新优势——包括混合专家（Mo E）架构、多头潜在注意力（MLA）机制以及基于DIKWP理念的知... 详细信息

文本以全球AI话语权争夺为背景，探讨了中国初创公司Deep Seek在大规模语言模型领域中的技术突破与战略布局。一是解析Deep Seek在算法架构上的创新优势——包括混合专家（Mo E）架构、多头潜在注意力（MLA）机制以及基于DIKWP理念的知识蒸馏与模型压缩技术，这些技术使其在性能与成本控制上具有显著竞争力；二是论述Deep Seek如何通过开源模式构建开放生态，与产业伙伴和标准制定机构广泛合作，进而在全球AI竞争中打破西方闭源模型的垄断；三是讨论国际标准化组织对AI能力评测的影响以及各国监管与合规挑战，通过对比分析Open AI、Anthropic和Google DeepMind，展望未来AI生态图景及市场竞争态势。文本认为，Deep Seek凭借“技术+生态”双重优势，有望引领开源大模型发展，重塑全球AI话语权格局，推动AI技术向更加开放、透明和普惠的方向演进。

关键词： DeepSeek AI话语权开源大模型算法创新生态构建监管合规 OpenAI

来源：评论

学校读者我要写书评

暂无评论

基于YOLOv8n的表格线检测改进模型

引用

计算机工程与应用 2025年第2期61卷 112-123页

作者：韦超钱春雨黄启鹏杜林轩杨哲苏州大学计算机科学与技术学院江苏苏州215006

在表格识别重构任务中,分割和合并的重构方法需要通过检测表格线进而重构出电子表格,因此表格线检测结果的质量直接决定了表格重构的效果。针对已有方法存在误检漏检的问题,提出一种YOLOv8n改进模型,用于表格线检测。在主干网络中,利用S... 详细信息

在表格识别重构任务中,分割和合并的重构方法需要通过检测表格线进而重构出电子表格,因此表格线检测结果的质量直接决定了表格重构的效果。针对已有方法存在误检漏检的问题,提出一种YOLOv8n改进模型,用于表格线检测。在主干网络中,利用Swin Transformer的思想改进BottleneckCSP模块,可以捕捉到更长距离的上下文信息,提升对于大尺度表格线的识别能力;针对表格线细长密集的特点,引入蛇形动态卷积的思想改进C2f(CSPLayer_2Conv)模块,根据特征之间的空间关系自适应地调整卷积核的形状和位置,从而更好地捕获特征之间的相关性和局部细节,进而提高特征建模能力;通过CBAM(convolutional block attention module)注意力机制改造空间金字塔池化层,动态地调整特征图中每个通道和空间位置的重要性,从而增强特征图的区分能力;优化颈部结构,引入混洗卷积来改造颈部结构。实验结果表明,改进后的YOLOv8n模型在ICDAR_2013和PubTabNet数据集上,m AP@0.5:0.95、准确率、召回率分别提升了0.079、0.301、0.088,性能超过YOLO同系列模型。这些改进使得YOLOv8n模型在表格线检测任务中展现出了优异的性能,通过与合并方法结合,可以进一步提升表格重构的效果。

关键词：表格线 YOLOv8n 注意力机制动态蛇形卷积 Transformer 轻量化

来源：评论

学校读者我要写书评

暂无评论

一种线性迁移元学习算法的研究

引用

计算机工程与应用 2025年第5期61卷 177-186页

作者：王佳恬李凡长苏州大学计算机科学与技术学院江苏苏州215000

元学习被认为是一种重要的解决小样本学习任务的工作,但其使用的浅层神经网络具有局限性,最近的工作表明深度神经网络模型虽然具有强大的特征提取能力,但存在一定程度的过度拟合问题,无法快速适应样本稀缺的新任务。为了更好地适应新任... 详细信息

元学习被认为是一种重要的解决小样本学习任务的工作,但其使用的浅层神经网络具有局限性,最近的工作表明深度神经网络模型虽然具有强大的特征提取能力,但存在一定程度的过度拟合问题,无法快速适应样本稀缺的新任务。为了更好地适应新任务,提出了一种线性迁移的元学习方法,通过对深度神经网络进行大量任务的训练,将其线性迁移到小样本场景中,来缓解过度拟合的问题,并且获得快速适应新任务的能力;随后再通过引入课程学习的分段批操作来进一步提高模型的鲁棒性。实验结果证明该方法在四种小样本数据集Mini-ImageNet、Fewshot-CIFAR100、TieredImageNet和Omniglot上取得了良好的分类效果。

关键词：小样本学习元学习迁移学习深度神经网络课程学习

来源：评论

学校读者我要写书评

暂无评论

基于密度的多度量空间数据聚类算法

引用

软件学报 2025年第2期36卷 851-873页

作者：朱轶凡罗程阳马瑞遥陈璐毛玉仁高云君浙江大学计算机科学与技术学院浙江杭州310027 浙江大学软件学院浙江宁波315048

具有噪声的基于密度的数据聚类(DBSCAN)算法是数据挖掘领域中的经典方法之一,其不仅能发现数据中潜藏的复杂关系,还能过滤其中的数据噪声,从而获得高质量的数据聚类.然而,现有的基于密度的数据聚类算法仅支持单模态(类型)数据的聚类,难... 详细信息

具有噪声的基于密度的数据聚类(DBSCAN)算法是数据挖掘领域中的经典方法之一,其不仅能发现数据中潜藏的复杂关系,还能过滤其中的数据噪声,从而获得高质量的数据聚类.然而,现有的基于密度的数据聚类算法仅支持单模态(类型)数据的聚类,难以应对多模态(类型)数据并存的应用场景.随着信息技术的快速发展,数据呈现多模态化的发展态势,现实生活中的数据不再是单一的数据类型,而是多种数据模态(类型)的组合,如文本、图像、地理坐标、数据特征等.因此,现有的数据聚类方法难以对复杂的多模态数据进行有效的数据建模,更无法进行高效的多模态数据聚类.基于此,提出一种基于密度的多度量空间聚类算法.首先,为了刻画多模态数据间的复杂关系,利用多度量空间表征数据之间的相似性关系,并且利用聚合多度量图索引(AMG)实现多模态数据建模.接着,利用差分化的相似性关系优化聚合多度量图的图结构,并且结合最优策略优先的搜索策略进行剪枝,以实现高效的多模态数据聚类.最后,在真实与合成数据集上针对多种参数设置进行实验.实验结果验证了所提方法运行效率提升了至少1个数量级,并具有较高的聚类精度与良好的可扩展性.

关键词：多度量空间多度量图基于密度的数据聚类数据挖掘多模态数据

来源：评论

学校读者我要写书评

暂无评论

无人机网络中基于无证书的群组认证密钥协商协议

引用

工程科学与技术 2025年第1期57卷 213-224页

作者：王钺程朱友文张志强南京航空航天大学计算机科学与技术学院江苏南京210016

随着无人机技术在物流行业等场景下的应用越来越广泛,在一些需要多无人机协同工作的场景下无人机之间需要对收集的数据进行交换,使用对称密钥进行加密和解密操作时,由于网络的通信环境是开放的,极易遭到第三方的窃听,通信前无人机协商... 详细信息

随着无人机技术在物流行业等场景下的应用越来越广泛,在一些需要多无人机协同工作的场景下无人机之间需要对收集的数据进行交换,使用对称密钥进行加密和解密操作时,由于网络的通信环境是开放的,极易遭到第三方的窃听,通信前无人机协商的会话密钥也容易遭到泄露。因此,本文面向无人机网络通信中的身份认证及数据隐私需求,提出一种基于无证书密钥体系的群组认证密钥协商协议。本文协议将无人机群组分为一个高算力的中心节点和多个低算力的节点,以降低通信开销及计算开销。协议共分为注册、协商、加入/退出3个阶段。注册阶段会为每个节点生成密钥对;协商阶段进行会话密钥的计算,群组中高算力中心节点是中枢节点,承担大部分的计算与通信任务,所有节点在注册阶段计算好密钥对后,只需进行高算力的中心节点与低算力节点的两轮交互即可完成密钥协商;此外,在有无人机退出或加入群组的情况下,该协议支持无人机单元及群组密钥的动态变更。本文对所提协议进行了安全性分析并在eCK模型下进行了安全证明,分析结果表明,该协议满足不可否认性、前后向保密性以及抗公钥替换攻击。在模拟实验中与同类型协议进行了计算开销和通信开销的对比,实验结果表明,该协议具有较低的计算开销和通信开销。由于该协议不基于双线性配对构造,所以更适合轻量化的无人机通信场景。

关键词：无人机无证书公钥体系身份认证群密钥协商椭圆曲线加密

来源：评论

学校读者我要写书评

暂无评论

面向低资源关系抽取的自训练方法

引用

软件学报 2025年第4期36卷 1620-1636页

作者：郁俊杰王星陈文亮张民苏州大学计算机科学与技术学院江苏苏州215006 腾讯AI Lab 广东深圳518000

自训练是缓解标注数据不足问题的常见方法,其通常做法是利用教师模型去获取高置信度的自动标注数据作为可靠数据.然而在低资源场景关系抽取任务上,该方法不仅存在教师模型泛化能力差的问题,而且受到关系抽取任务中易混淆关系类别的影响... 详细信息

自训练是缓解标注数据不足问题的常见方法,其通常做法是利用教师模型去获取高置信度的自动标注数据作为可靠数据.然而在低资源场景关系抽取任务上,该方法不仅存在教师模型泛化能力差的问题,而且受到关系抽取任务中易混淆关系类别的影响,导致难以从自动标注数据中有效地识别出可靠数据,同时产生大量难以利用的低置信度噪音数据.因此,提出一种有效利用低置信度数据的自训练方法ST-LRE(self-training approach for lowresource relation extraction).该方法一方面基于复述增强的预测方法来加强教师模型筛选可靠数据的能力;另一方面,基于部分标注模式从低置信度数据中提炼出可利用的模糊数据.基于模糊数据的候选类别集合,提出了基于负标签集合的负向训练方法.最后,为了支持可靠数据和模糊数据的融合训练,提出一种支持正负向训练的联合方法.在两个广泛使用的关系抽取数据集SemEval2010 Task-8和Re-TACRED的低资源场景上进行实验,ST-LRE方法取得显著且一致的提升.

关键词：自然语言处理信息抽取关系抽取低资源自训练

来源：评论

学校读者我要写书评

暂无评论

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案：

请选择收藏分类：

通借通还

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案： 新增检索档案 确定 取消

请选择收藏分类： 新增自定义分类 确定 取消

通借通还

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

请选择保存的检索档案：

请选择收藏分类：