检索结果-内蒙古大学图书馆

计算机研究与发展 2025年第3期62卷 662-671页

作者：王苑铮孙文祥范意兴廖华明郭嘉丰中国科学院网络数据科学与技术重点实验室(中国科学院计算技术研究所) 北京100190 中国科学院大学北京100049

图文跨模态实体链接是对传统实体链接任务的扩展,其输入为包含实体的图像,目标是将其链接到文本模态的知识库实体上.现有模型通常采用双编码器架构,将图像、文本模态的实体分别编码为向量,利用点乘计算两者的相似度,从而链接到与图像实... 详细信息

图文跨模态实体链接是对传统实体链接任务的扩展,其输入为包含实体的图像,目标是将其链接到文本模态的知识库实体上.现有模型通常采用双编码器架构,将图像、文本模态的实体分别编码为向量,利用点乘计算两者的相似度,从而链接到与图像实体相似度最高的文本实体.其训练过程通常采用基于Info NCE损失的对比学习任务,即提高一个实体某模态与自身另一模态的向量相似度,降低与其他实体另一模态的向量相似度.然而此模型忽视了图文2个模态内部表示难度的差异:图像模态中的相似实体,通常比文本模态中的相似实体更难以区分,导致外观相似的图像实体很容易链接错误.因此,提出2个新的对比学习任务来提升向量的判别能力.一个是自对比学习,用于提升图像向量之间的区分度;另一个是难负例对比学习,让文本向量更容易区分几个相似的图像向量.在开源数据集Wiki Person上进行实验,在12万规模的实体库上,相比于采用Info NCE损失的最佳基线模型,模型正确率提升了4.5个百分点.

关键词：实体链接模型多模态跨模态对比学习视觉信息

来源：评论

学校读者我要写书评

暂无评论

融合营养知识和偏好-健康多目标优化的膳食推荐

引用

食品科学 2025年第6期46卷 29-37页

作者：金颖闵巍庆周鹏飞梅舒欢蒋树强中国科学院智能信息处理重点实验室北京 100190 中国科学院计算技术研究所北京 100190 中国科学院大学北京 100049 中科苏州智能计算技术研究院江苏苏州 215009

本实验提出一种融合营养知识和偏好-健康多目标优化的膳食推荐方法.该方法通过食品营养知识嵌入引导学习用户的偏好,并利用多目标优化算法平衡用户饮食偏好与营养健康需求.首先,基于营养引导的食品知识感知网络(nutrition-guided food k... 详细信息

本实验提出一种融合营养知识和偏好-健康多目标优化的膳食推荐方法.该方法通过食品营养知识嵌入引导学习用户的偏好,并利用多目标优化算法平衡用户饮食偏好与营养健康需求.首先,基于营养引导的食品知识感知网络(nutrition-guided food knowledge-aware network,NG-FKN)进行个性化菜谱推荐,再进行营养套餐推荐(nutritional food combination recommendation,NFCR).NG-FKN从食品营养知识图谱中提取营养信息,引导捕捉用户偏好,实现个性化菜谱推荐.NFCR结合用户饮食偏好与营养需求,采用基于营养支配的非劣排序遗传算法优化多个目标,获得营养套餐推荐列表.此外,构建食品营养知识图谱与食品-用户的交互数据集,包含19 669 条菜谱数据,并在该数据集上对所提方法进行评估.同时还引入中国健康膳食指数和食物多样性评分两个指标用于评估推荐套餐的营养价值.在所提数据集上的实验结果表明,本研究方法优于目前主流的方法,可以提升膳食营养推荐的性能.

关键词：膳食推荐营养套餐知识图谱多目标优化遗传算法

来源：评论

学校读者我要写书评

暂无评论

智能算法安全：内涵、科学问题与展望

引用

中国科学院院刊 2025年第3期40卷 419-428页

作者：程学旗陈薇沈华伟山世光陈熙霖李国杰中国科学院计算技术研究所智能算法安全重点实验室中国科学院大学计算机科学与技术学院

智能算法是指实现智能的计算过程所体现的方法，大多具备数据驱动、不确定性计算、模型推断难解释等特性，而这些特性同时也给智能算法应用带来了潜在的安全风险。文章首先探讨智能算法安全的内涵。具体地，智能算法安全的内涵依据人机... 详细信息

智能算法是指实现智能的计算过程所体现的方法，大多具备数据驱动、不确定性计算、模型推断难解释等特性，而这些特性同时也给智能算法应用带来了潜在的安全风险。文章首先探讨智能算法安全的内涵。具体地，智能算法安全的内涵依据人机融合的程度，由算法自身的一元内生性安全，延伸到算法服务于人时的人机二元应用性安全，最终拓展为人机共生的复杂社会系统中多元系统性安全，故据此提出智能算法安全层级范式（以下简称“TRC范式”），分别涵盖内生决策可信（trustworthiness）的一元安全目标、应用服务可管（regulatability）的二元安全目标和系统风险可控（controllability）的多元安全目标。进一步，基于当前实现TRC范式中的技术难点与智能算法可信、可管、可控的目标，文章提出实现智能算法安全需要重点突破的不确定性算法的可信域判定、黑箱模型的透明化监测与人机共生智能系统的风险临界点感知3个重大科学问题。最后，围绕TRC范式的“度量—评估—增强”技术体系，提出7项研究方向建议与4个方面智能算法安全相关的发展建议，并展望其助力实现人机共治的未来愿景。

关键词：大数据智能算法智能算法安全人工智能伦理与安全智能算法安全层级范式

来源：评论

学校读者我要写书评

暂无评论

Puzzle:面向深度学习集成芯片的可扩展框架

引用

计算机研究与发展 2023年第6期60卷 1216-1231页

作者：王梦迪王颖刘成常开颜高成思韩银和李华伟张磊中国科学院计算技术研究所北京100190 中国科学院大学北京100190 处理器芯片全国重点实验室(中国科学院计算技术研究所) 北京100190 移动计算与新型终端北京市重点实验室(中国科学院计算技术研究所) 北京100190

芯粒集成逐渐成为不同场景下敏捷定制深度学习芯片的高可扩展性的解决方案,芯片设计者可以通过集成设计、验证完成的第三方芯粒来降低芯片开发周期和成本,提高芯片设计的灵活性和芯片良率.在传统的芯片设计和商业模式中,编译器等专用软... 详细信息

芯粒集成逐渐成为不同场景下敏捷定制深度学习芯片的高可扩展性的解决方案,芯片设计者可以通过集成设计、验证完成的第三方芯粒来降低芯片开发周期和成本,提高芯片设计的灵活性和芯片良率.在传统的芯片设计和商业模式中,编译器等专用软件工具链是芯片解决方案的组成部分,并在芯片性能和开发中发挥重要作用.然而,当使用第三方芯粒进行芯片敏捷定制时,第三方芯粒所提供的专用工具链无法预知整个芯片的资源,因此无法解决敏捷定制的深度学习芯片的任务部署问题,而为敏捷定制的芯片设计全新的工具链需要大量的时间成本,失去了芯片敏捷定制的优势.因此,提出一种面向深度学习集成芯片的可扩展框架(scalable framework for integrated deep learning chips)--Puzzle,它包含从处理任务输入到运行时管理芯片资源的完整流程,并自适应地生成高效的任务调度和资源分配方案,降低冗余访存和芯粒间通信开销.实验结果表明,该可扩展框架为深度学习集成芯片生成的任务部署方案可自适应于不同的工作负载和硬件资源配置,与现有方法相比平均降低27.5%的工作负载运行延迟.

关键词：芯片敏捷定制芯粒深度学习芯片神经网络处理器任务调度

来源：评论

学校读者我要写书评

暂无评论

HVMS:基于混合向量化的SpMV优化机制

引用

计算机研究与发展 2024年第12期61卷 2969-2984页

作者：颜志远解壁伟包云岗处理器芯片全国重点实验室(中国科学院计算技术研究所) 北京100190 中国科学院大学北京100049

在科学计算和系统工程等领域,稀疏矩阵向量乘(sparse matrix-vector multiplication,SpMV)占据着极其重要的位置.受限于矩阵稀疏性所导致的访存不规则性,向量优化一直是SpMV的难点.针对此问题,进行深入分析并且总结影响SpMV向量化效率... 详细信息

在科学计算和系统工程等领域,稀疏矩阵向量乘(sparse matrix-vector multiplication,SpMV)占据着极其重要的位置.受限于矩阵稀疏性所导致的访存不规则性,向量优化一直是SpMV的难点.针对此问题,进行深入分析并且总结影响SpMV向量化效率的主要因素.除却稀疏矩阵内非零元分布的不规则,不同稀疏矩阵之间的非零元分布特征亦有明显不同,导致单一的向量优化策略难以适用于多种不同特征的稀疏矩阵.另一方面,多样化向量硬件在向量特性和指令上的差异,影响了SpMV向量优化方法的通用性.把不规则的稀疏矩阵映射到规则的向量硬件上进行计算,是SpMV向量化面临的最主要挑战.基于此,提出一种基于混合向量化方法的SpMV优化机制(hybrid vectorization-optimized mechanism of SpMV,HVMS).HVMS首先对向量硬件的特性进行抽象建模,并基于抽象出的基本操作,设计相应的规则指导稀疏矩阵进行规则化转换.按照不同的矩阵特征,HVMS将稀疏矩阵划分为不同的部分,弱化稀疏矩阵的不规则程度,并引入不同的优化策略最大化SpMV的向量化效率,从而提升性能.基于Intel Xeon平台,在30个常用稀疏矩阵上对HVMS进行实验分析.结果表明,相比现有代表性工作如CVR,SELL-C-σ,Intel MKL,HVMS分别获得1.60倍、1.72倍和1.93倍的平均加速比.

关键词：稀疏矩阵向量乘向量优化稀疏矩阵 SIMD 多核系统

来源：评论

学校读者我要写书评

暂无评论

面向高密度混部的动态资源分配方法

引用

计算机研究与发展 2024年第9期61卷 2384-2399页

作者：郭静胡存琛包云岗处理器芯片全国重点实验室(中国科学院计算技术研究所) 北京100190 中国科学院大学北京100190

当前的无服务计算提供商采用了一种灵活度低、固定CPU和内存分配比例的耦合式资源分配策略.随着更多类型应用被部署在无服务计算平台中,该策略已无法满足函数应用的多样化资源需求.由于函数应用的资源分配粒度小、部署密度高,若将CPU与... 详细信息

当前的无服务计算提供商采用了一种灵活度低、固定CPU和内存分配比例的耦合式资源分配策略.随着更多类型应用被部署在无服务计算平台中,该策略已无法满足函数应用的多样化资源需求.由于函数应用的资源分配粒度小、部署密度高,若将CPU与内存资源的分配进行解耦,需解决资源配置空间爆炸问题.提出Semi-Share,一个面向无服务计算的解耦式资源管理系统,为函数寻找最优资源配置的同时降低混部函数之间的干扰.为解决资源配置空间爆炸问题,Semi-Share构建了一个2层资源分配架构,将资源配置空间划分为多个子空间来降低问题复杂度.第1层是函数分组,基于函数的资源使用特征和历史负载信息进行函数分组,根据分组将资源配置空间划分为多个子空间.第2层是资源分配,利用贝叶斯优化和加权打分函数来指导模型在资源配置空间中朝正确的方向搜索,降低时间开销.实验结果显示,Semi-Share相较于被广泛使用的梯度下降搜索法降低了平均85.77%的时间开销,并为函数带来平均42.72%的性能提升;与同样使用贝叶斯优化的耦合式资源分配系统COSE相比,Semi-Share能带来平均32.25%的性能提升.

关键词：无服务计算混部性能保障服务质量资源分配高部署密度

来源：评论

学校读者我要写书评

暂无评论

基于超低延迟SSD的页交换机制关键技术

引用

计算机研究与发展 2024年第3期61卷 557-570页

作者：王紫芮蒋德钧中国科学院计算技术研究所先进计算机系统研究中心北京100190 处理器芯片全国重点实验室(中国科学院计算技术研究所) 北京100190 中国科学院大学计算机科学与技术学院北京100049

随着内存密集型应用的快速发展,应用对单机内存容量的需求日益增大.然而,受到颗粒密度的限制,内存容量的扩展度较低.页交换机制是进行内存扩展的经典技术,该机制通过将较少使用的内存页面暂存在存储设备,以达到扩展内存的目的.过去页交... 详细信息

随着内存密集型应用的快速发展,应用对单机内存容量的需求日益增大.然而,受到颗粒密度的限制,内存容量的扩展度较低.页交换机制是进行内存扩展的经典技术,该机制通过将较少使用的内存页面暂存在存储设备,以达到扩展内存的目的.过去页交换机制由于慢速磁盘的读写速度限制,无法被广泛应用.近年来,得益于超低延迟固态硬盘(solid state drive,SSD)的快速发展,页交换机制可以利用其低延迟的读写特性,提升页交换效率.然而,在低I/O延迟的情况下,传统页交换机制的I/O栈存在巨大的软件开销.首先对使用超低延迟SSD的Linux页交换机制进行测试与分析,发现现有页交换机制的主要瓶颈在于发送请求时存在队头阻塞问题、I/O合并和调度开销,以及内核返回路径上的中断处理和直接内存回收开销.基于分析结果,提出基于超低延迟SSD的页交换机制***在Linux I/O栈的基础上增加对轮询请求的处理,并降低I/O合并与调度开销,实现轻量级的I/O栈.基于Ultraswap的I/O栈,对内核页交换机制的换入与换出路径进一步优化.通过优化对缺页、直接内存回收的处理,降低页交换机制关键路径上的时间开销.实验结果表明Ultraswap在应用测试场景下相比Linux页交换机制能够提升19%的平均性能;在可使用内存比例为20%的情况下,Ultraswap可达到33%的性能提升.

关键词：页交换 I/O栈超低延迟SSD 轮询 NVMe SSD

来源：评论

学校读者我要写书评

暂无评论

EchoGPK:基于先验知识引导的超声心动图轻量级图卷积分析方法

引用

电子学报 2024年第4期52卷 1296-1304页

作者：王博荣叶剑中国科学院计算技术研究所北京100190 中国科学院大学北京101408 移动计算与新型终端北京市重点实验室北京100190

根据超声心动图准确分析左心室轮廓和射血分数对于心血管疾病诊断意义重大.但现有方法存在左心室分割和射血分数预测之间缺乏关联性、左心室分割关键点易于出现离群点和突变点、方法存储和计算开销大、解释性不佳等问题,为此提出一种基... 详细信息

根据超声心动图准确分析左心室轮廓和射血分数对于心血管疾病诊断意义重大.但现有方法存在左心室分割和射血分数预测之间缺乏关联性、左心室分割关键点易于出现离群点和突变点、方法存储和计算开销大、解释性不佳等问题,为此提出一种基于先验知识引导的轻量级图卷积方法EchoGPK(Echo Guided by Priori Knowledge),以心脏的结构和运动特性、相邻心肌的相似性等先验知识为引导,设计了计算高效的螺旋聚合函数和深度压缩的多头偏心聚合解码器,实现了图卷积结构的轻量化.方法基于临床医生的普遍经验提出了适度利用左心室轮廓的多任务射血分数预测网络,建立了左心室分割和射血分数预测之间的关联性,增强了推理的可解释性;基于图卷积神经网络的传递特性约束邻居点的行为,减少了边界离群点和突变点的产生.EchoGPK在大型公开数据集EchoNet-Dynamic上的实验结果表明,左心室分割的Dice分数达92.13%,射血分数预测的MAE达3.92%;方法表现出准确率高、参数量和算力需求低等特点,证明了先验知识在超声医学图像分析中的有效性.

关键词：关键超声心动图左心室分割射血分数预测图卷积神经网络

来源：评论

学校读者我要写书评

暂无评论

基于软硬协同的程序运行时安全保护机制

引用

计算机学报 2023年第1期46卷 180-201页

作者：李亚伟章隆兵张福新王剑计算机体系结构国家重点实验室(中国科学院计算技术研究所) 北京100190 中国科学院计算技术研究所北京100190 中国科学院大学北京100049

内存篡改(Memory Corruption)是现代各类攻击的主要原因,通过修改内存中的数据,达到劫持控制流的目的.使用不安全语言暴露内存细节给开发者,导致很多的敏感数据可以任意被修改.现有的解决方案针对安全攻击主要包括两个方面,软件检查和... 详细信息

内存篡改(Memory Corruption)是现代各类攻击的主要原因,通过修改内存中的数据,达到劫持控制流的目的.使用不安全语言暴露内存细节给开发者,导致很多的敏感数据可以任意被修改.现有的解决方案针对安全攻击主要包括两个方面,软件检查和硬件机制保护.基于软件检查的机制虽然灵活,但是存在严重的性能问题.基于硬件的方法可以大幅度解决性能问题,而且要比软件的方式安全性更高.因此提出了很多的硬件相关的保护机制.但现有的硬件机制大都仅仅针对单一的攻击,而且缺乏灵活性.在本文中,我们提出了一种软硬件结合的解决方案,通过对程序运行时敏感数据进行加密隐藏,在访问这些敏感数据时进行解密,然后做安全检查,判断敏感数据是否被修改.在硬件实现上,本文设计了安全的Load和Store类指令,以及硬件加密解密模块.同时在软件编译器上对此类安全指令支持,针对不同的使用场景提出了两种安全策略:全局约束策略和上下文执行约束策略.相比于前者,后者提供了更加严格的约束,可适用于安全度更高的程序保护.本文的安全机制能够抵御多种攻击向量,比如针对CFI类攻击,最近的DOP攻击,GOT表和虚函数表指针感染攻击等.还可以抵御缓冲区溢出类的攻击,支持信息隐藏等.通过SPEC2006的测试程序表明,本文提出的安全机制性能损耗仅仅为4.5%.

关键词：内存篡改敏感数据加解密运行时保护

来源：评论

学校读者我要写书评

暂无评论

面向YOLO神经网络的数据流架构优化研究

引用

计算机学报 2025年第1期48卷 82-99页

作者：穆宇栋李文明范志华吴萌吴海彬安学军叶笑春范东睿处理器芯片全国重点实验室(中国科学院计算技术研究所) 北京100190 中国科学院大学计算机科学与技术学院北京100049

YOLO目标检测算法具有速度快、精度高、结构简单、性能稳定等优点,因此在多种对实时性要求较高的场景中得到广泛应用。传统的控制流架构在执行YOLO神经网络时面临计算部件利用率低、功耗高、能效较低等挑战。相较而言,数据流架构的执行... 详细信息

YOLO目标检测算法具有速度快、精度高、结构简单、性能稳定等优点,因此在多种对实时性要求较高的场景中得到广泛应用。传统的控制流架构在执行YOLO神经网络时面临计算部件利用率低、功耗高、能效较低等挑战。相较而言,数据流架构的执行模式与神经网络算法匹配度高,更能充分挖掘其中的数据并行性。然而,在数据流架构上部署YOLO神经网络时面临三个问题:(1)数据流架构的数据流图映射并不能结合YOLO神经网络中卷积层卷积核较小的特点,造成卷积运算数据复用率过低的问题,并进一步降低计算部件利用率;(2)数据流架构在算子调度时无法利用算子间结构高度耦合的特点,导致大量数据重复读取;(3)数据流架构上的数据存取与执行高度耦合、串序执行,导致数据存取延迟过高。为解决这些问题,本文设计了面向YOLO神经网络的数据流加速器DFU-Y。首先,结合卷积嵌套循环的执行模式,本文分析了小卷积核卷积运算的数据复用特征,并提出了更有利于执行单元内部数据复用的数据流图映射算法,从而整体提升卷积运行效率;然后,为充分利用结构耦合的算子间的数据复用,DFU-Y提出数据流图层次上的算子融合调度机制以减少数据存取次数、提升神经网络运行效率;最后,DFU-Y通过双缓存解耦合数据存取与执行,从而并行执行数据存取与运算,掩盖了程序间的数据传输延迟,提高了计算部件利用率。实验表明,相较数据流架构(DFU)和GPU(NVIDIA Xavier NX),DFU-Y分别获得2.527倍、1.334倍的性能提升和2.658倍、3.464倍的能效提升;同时,相较YOLO专用加速器(Arria-YOLO),DFU-Y在保持较好通用性的同时,达到了其性能的72.97%、能效的87.41%。

关键词： YOLO算法数据流架构数据流图优化卷积神经网络神经网络加速

来源：评论

学校读者我要写书评

暂无评论

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案：

请选择收藏分类：

通借通还

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案： 新增检索档案 确定 取消

请选择收藏分类： 新增自定义分类 确定 取消

通借通还

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

请选择保存的检索档案：

请选择收藏分类：