检索结果-内蒙古大学图书馆

中国科学：信息科学 2014年第10期44卷 1239-1252页

作者：刘辉聪孟海波李华伟邓家超李晓维计算机体系结构国家重点实验室中国科学院计算技术研究所北京100190 中国科学院大学计算机与控制学院北京100049

随着集成电路工艺的发展,系统芯片(SoC)集成已成为超大规模集成电路的主流设计方法.SoC设计具有强调自顶向下设计、突出设计重用性、重视低功耗的特点,给集成电路的可测试性设计带来了严峻的挑战.本文针对一款用于多媒体处理的异构多核... 详细信息

随着集成电路工艺的发展,系统芯片(SoC)集成已成为超大规模集成电路的主流设计方法.SoC设计具有强调自顶向下设计、突出设计重用性、重视低功耗的特点,给集成电路的可测试性设计带来了严峻的挑战.本文针对一款用于多媒体处理的异构多核系统芯片DPU-m,提出了一套完整的可测试性设计方案,支持3种工作模式:功能模式、存储器内建自测试模式以及扫描测试模式,并进行了设计实现和评估.针对逻辑电路的可测试性设计,采用自顶向下的模块化设计思想,提出并实现了一种分布式与多路选择器相结合的测试访问机制,实验结果表明,DPU-m逻辑电路单固定型故障的测试覆盖率为98.58%,满足设计方要求;针对实速时延测试的需求,设计并实现了基于片上时钟生成器的时钟控制单元,可在片上支持不同时钟域、6种时钟频率的实速时延测试;针对存储器电路的自测试,设计并实现了串并行结合的存储器内建自测试结构,在最大测试功耗的约束下有效地减少了测试时间;进一步设计了顶层测试结果输出电路,满足了设计方要求的诊断分辨率,若以100 MHz的频率进行测试,测试时间为14 ms.

关键词：可测试性设计测试访问机制测试调度片上时钟控制单元存储器内建自测试

来源：评论

学校读者我要写书评

暂无评论

一种超低损失的深度神经网络量化压缩方法

引用

软件学报 2021年第8期32卷 2391-2407页

作者：龚成卢冶代素蓉刘方鑫陈新伟李涛南开大学计算机学院天津300350 天津市网络和数据安全技术重点实验室(南开大学) 天津300350 工业机器人应用福建省高校工程研究中心(闽江学院) 福建福州350121 计算机体系结构国家重点实验室(中国科学院计算技术研究所) 北京100190

深度神经网络(deep neural network,简称DNN)量化是一种高效的模型压缩方法,使用少量位宽表示模型计算过程中的参数和中间结果数据.数据位宽会直接影响内存占用、计算效率和能耗.以往的模型量化研究缺乏有效的定量分析,这导致量化损失... 详细信息

深度神经网络(deep neural network,简称DNN)量化是一种高效的模型压缩方法,使用少量位宽表示模型计算过程中的参数和中间结果数据.数据位宽会直接影响内存占用、计算效率和能耗.以往的模型量化研究缺乏有效的定量分析,这导致量化损失难以预测.提出了一种超低损失的DNN量化方法(ultra-low loss quantization,简称μL2Q),以揭示量化位宽与量化损失之间的内在联系,指导量化位宽选择并降低量化损失.首先,将原始数据映射为标准正态分布的数据;然后,在等宽的量化区间中搜索最优量化参数;最后,将μL2Q方法融合进DNN的训练过程,并嵌入到主流的机器学习框架Caffe及Keras中,以支撑端到端模型压缩的设计和训练.实验结果表明,与最新的研究方法相比,在相同的位宽条件下,μL2Q方法能够保证更高的模型精度,在典型的神经网络模型上精度分别提高了1.94%,3.73%和8.24%.显著性物体检测实验结果表明,μL2Q方法能够胜任复杂的计算机视觉任务.

关键词：神经网络压缩神经网络量化权值分布均匀量化量化损失最优解

来源：评论

学校读者我要写书评

暂无评论

一种基于硬件的快速确定性重放方法

引用

高技术通讯 2017年第6期27卷 487-494页

作者：章隆兵李磊肖俊华贺晓王剑计算机体系结构国家重点实验室(中国科学院计算技术研究所) 北京100190 中国科学院大学北京100049 中国科学院计算技术研究所北京100190 龙芯中科技术有限公司北京100190 华为技术有限公司深圳518129

针对多核处理器上并行程序执行不确定性所造成的并行调试难问题,提出了一种基于硬件的快速确定性重放方法——时间切割者。该方法采用面向并行的记录机制来区分出原执行中并行执行的访存指令块和非并行执行的指令块,并在重放执行中避免... 详细信息

针对多核处理器上并行程序执行不确定性所造成的并行调试难问题,提出了一种基于硬件的快速确定性重放方法——时间切割者。该方法采用面向并行的记录机制来区分出原执行中并行执行的访存指令块和非并行执行的指令块,并在重放执行中避免串行执行那些在原执行中并行执行的访存指令块,从而使得重放执行的性能开销小。在多核模拟器Sim-Godson上的仿真实验结果表明:该方法的重放速度快,其性能开销仅为2%左右。此外,该方法还具有硬件支持简单特点,未来有望应用于国产多核处理器研制中。

关键词：多核处理器并行调试确定性重放多核模拟器全局时钟

来源：评论

学校读者我要写书评

暂无评论

MFTL:一种基于固态盘系统非对齐更新数据的合并策略

引用

小型微型计算机系统 2018年第6期39卷 1359-1365页

作者：黄耀钦邓玉辉暨南大学信息学院计算机科学系广州510632 中国科学院计算技术研究所计算机体系结构国家重点实验室北京100190

基于NAND的闪存中由于其特殊的物理读写特性,使得固态盘内部广泛存在非对齐的数据存储,而这部分非对齐数据会导致系统产生额外的性能损耗和造成物理可用存储空间的浪费.基于固态盘中存在非对齐写更新操作提出一种MFTL缓存架构,其核心的... 详细信息

基于NAND的闪存中由于其特殊的物理读写特性,使得固态盘内部广泛存在非对齐的数据存储,而这部分非对齐数据会导致系统产生额外的性能损耗和造成物理可用存储空间的浪费.基于固态盘中存在非对齐写更新操作提出一种MFTL缓存架构,其核心的思想是利用写更新数据存储不对齐的特性,通过重新设计页级映射的FTL将缓存中不同逻辑数据页存在的非对齐更新数据合并为闪存页规格的大小后写回至闪存阵列中,可以节省由于写更新操作导致的额外读取操作的同时也充分减少实际的闪存写入次数,因而降低了底层处理请求队列的负载压力和相应增加了闪存的物理可用容量.通过SSDsim实现并测试相关负载后实验结果表明,与原FTL系统相比,提出的MFTL结构能够省略100%的非对齐写更新导致的额外读操作开销,并且充分减少了固态盘写入次数,从而扩大了可用存储容量和提高固态盘的写性能.

关键词：固态盘数据更新闪存缓存闪存转换层

来源：评论

学校读者我要写书评

暂无评论

面向门级网表的VLSI三模冗余加固设计

引用

计算机工程与科学 2014年第12期36卷 2355-2360页

作者：徐冉冉孟海波桂小琰申小伟安述倩中国科学院计算技术研究所计算机体系结构国家重点实验室北京100190 北京理工大学信息与电子学院北京100081

航天器在宇宙空间易受粒子的影响而产生错误,三模冗余技术是一种有效的容错机制。但是,现有的三模冗余加固设计一般是一款芯片定制一套加固方案,无法做到通用性。提出一种功能无关的VLSI门级网表三模冗余加固通用设计方案。通过对时序... 详细信息

航天器在宇宙空间易受粒子的影响而产生错误,三模冗余技术是一种有效的容错机制。但是,现有的三模冗余加固设计一般是一款芯片定制一套加固方案,无法做到通用性。提出一种功能无关的VLSI门级网表三模冗余加固通用设计方案。通过对时序器件和组合逻辑器件进行不同的加固设计,实现三模冗余。根据对不同的工艺库的识别与理解,本方案还进行了驱动能力优化等。通过将上述方案工具化,并利用已有的众核处理器网表进行实验评估,全局时序器件加固面积增加为原始网表面积的185%,局部时序器件加固面积增加为原网表的1%-80%,加固方案可按设计需求配置。实验数据表明,加固后的网表中关键路径的平均时延增加为22.15%-22.86%,在设计需求配置下,性能可满足用户要求。

关键词：可靠性三模冗余时序单元组合逻辑门级网表

来源：评论

学校读者我要写书评

暂无评论

EOFDM:一种面向众核架构的最低能耗搜索方法

引用

计算机研究与发展 2015年第6期52卷 1303-1315页

作者：朱亚涛张帅王达叶笑春张洋胡九川张志敏范东睿李宏亮计算机体系结构国家重点实验室(中国科学院计算技术研究所) 北京100190 中国科学院大学计算机与控制学院北京100049 河北农业大学信息科学与技术学院河北保定071001 国家计算机网络应急技术处理协调中心北京100029 北京交通大学计算机与信息技术学院北京100044 数学工程与先进计算国家重点实验室江苏无锡214125

面向能耗优化的面积(核数)-功率(频率)分配问题是当前众核处理器研究热点之一.通过性能-功耗模型了解其在核数-频率空间的分布规律,然后在核数和频率级别这2个维度上通过实测执行逐步搜索,可以获取"核数-频率"配置的最优解,... 详细信息

面向能耗优化的面积(核数)-功率(频率)分配问题是当前众核处理器研究热点之一.通过性能-功耗模型了解其在核数-频率空间的分布规律,然后在核数和频率级别这2个维度上通过实测执行逐步搜索,可以获取"核数-频率"配置的最优解,从而达到能耗优化的目的;然而本领域现有方法在核数-频率空间内实测搜索最低能耗时收敛速度慢、搜索开销大、可扩展性差.针对此问题,提出了一种基于求解最优化问题的经典数学方法——可行方向法的最低能耗搜索方法(energy-efficient optimization based on feasible direction method,EOFDM),每次执行都能从核数和频率2个维度上同时减小搜索空间,在迭代执行中快速收敛至最低能耗点.该方法与现有研究中最优的启发式爬山法(hill-climbing heuristic,HCH)进行了对比实验,平均执行次数、执行时间和能耗分别降低39.5%,46.8%,48.3%,提高了收敛速度,降低了搜索开销;当核数增加一倍时,平均执行次数、执行时间和能耗分别降低48.8%,51.6%,50.9%;当频率级数增加一倍时,平均执行次数、执行时间和能耗分别降低45.5%,49.8%,54.4%,在收敛速度、搜索开销和可扩展性方面均有提高.

关键词：能耗优化众核最优解可行方向法启发式爬山法

来源：评论

学校读者我要写书评

暂无评论

面向大数据应用的众核处理器缓存结构设计

引用

计算机工程与科学 2015年第1期37卷 28-35页

作者：万虎徐远超孙凤芸闫俊峰首都师范大学信息工程学院北京100048 中国科学院计算技术研究所计算机体系结构国家重点实验室北京100190

大规模数据排序、搜索引擎、流媒体等大数据应用在面向延迟的多核/众核处理器上运行时资源利用率低下,一级缓存命中率高,二级/三级缓存命中率低,LLC容量的增加对IPC的提升并不明显。针对缓存资源利用率低的问题,分析了大数据应用的访存... 详细信息

大规模数据排序、搜索引擎、流媒体等大数据应用在面向延迟的多核/众核处理器上运行时资源利用率低下,一级缓存命中率高,二级/三级缓存命中率低,LLC容量的增加对IPC的提升并不明显。针对缓存资源利用率低的问题,分析了大数据应用的访存行为特点,提出了针对大数据应用的两种众核处理器缓存结构设计方案,两种结构均只有一级缓存,Share结构为完全共享缓存,Partition结构为部分共享缓存。评估结果表明,两种方案在访存延迟增加不多的前提下能大幅节省芯片面积,其中缓存容量较低时,Partition结构优于Share结构,缓存容量较高时,Share结构要逐渐优于Partition结构。由于众核处理器中分配到每个处理器核的容量有限,因此Partition结构有一定的优势。

关键词：众核处理器大数据应用缓存设计访存行为数据中心

来源：评论

学校读者我要写书评

暂无评论

面向光流估计的高效加速器架构设计

引用

中国科学：信息科学 2021年第5期51卷 795-807页

作者：刘博生陈晓明韩银和常亮广东工业大学计算机学院广州510006 桂林电子科技大学计算机与信息安全学院广西可信软件重点实验室桂林541004 中国科学院计算技术研究所计算机体系结构国家重点实验室北京100190 中国科学院大学北京100190

光流(optical flow)为同一对象在视频中运动到下一帧的移动量.从视频中估计光流已广泛应用于各类移动智能系统,如运动估计和机器人导航.最近的研究表明,卷积神经网络(convolutional neural network,CNN)能提供可靠的光流估计结果.然而,... 详细信息

光流(optical flow)为同一对象在视频中运动到下一帧的移动量.从视频中估计光流已广泛应用于各类移动智能系统,如运动估计和机器人导航.最近的研究表明,卷积神经网络(convolutional neural network,CNN)能提供可靠的光流估计结果.然而,现有的硬件加速器无法支持面向光流估计的CNN复杂计算.具体而言,这些类型的CNN不仅包括常规的卷积(convolution)和反卷积(deconvolution)运算,还包括双线性插值(bilinear interpolation)和/或关联(correlation)运算.双线性插值和关联操作主要探索两个连续图像帧之间的关联关系.为解决这一问题,本项工作提出面向光流的CNN硬件加速设计方案(称为Swan-AOE),即通过支持卷积、反卷积、双线性插值和关联操作解决这类神经网络的硬件加速计算问题.Swan-AOE包括可配置的硬件计算架构和自适应的调度策略,通过提供灵活的并行调度实现最优化吞吐量计算.此外,Swan-AOE还进行设计空间探索,探索可用片上缓存资源在提高能耗–面积效率的潜在能力.实验结果表明,与基准加速器相比,所提出的设计能有效提升性能、能效和面积效率.

关键词：加速器光流估计能效卷积神经网络

来源：评论

学校读者我要写书评

暂无评论

分离真伪时钟的处理器FPGA原型性能校准方法

引用

高技术通讯 2022年第5期32卷 462-470页

作者：郑雅文吴瑞阳陈天奇汪文祥章隆兵王剑计算机体系结构国家重点实验室(中国科学院计算技术研究所) 北京100190 中国科学院计算技术研究所北京100190 中国科学院大学北京100049 龙芯中科技术有限公司北京100190

针对现场可编程门阵列(FPGA)原型系统中内存刷新频率过高导致内存延迟变大的问题,提出了一种校准处理器FPGA原型系统性能的方法,搭建了一个精确的FPGA原型性能验证平台,可用于硅前快速准确地评估处理器系统性能。问题的根本原因是FPGA... 详细信息

针对现场可编程门阵列(FPGA)原型系统中内存刷新频率过高导致内存延迟变大的问题,提出了一种校准处理器FPGA原型系统性能的方法,搭建了一个精确的FPGA原型性能验证平台,可用于硅前快速准确地评估处理器系统性能。问题的根本原因是FPGA原型系统同时存在真实墙上时钟和由运行频率降低导致的伪墙上时钟,且在内存系统中刷新和访问请求分别按照两个时钟进行,然而真实机器上这两种请求都是按照真墙上时钟进行,因此FPGA内存系统有性能误差。本文通过将两个墙上时钟分离来实现校准,该校准方法准确度高、通用性强,校准后的FPGA原型系统运行SPEC CPU 2006基准测试程序性能分值平均误差由7.49%降至0.36%,最高误差降至2%以下,可快速有效地指导硅前性能优化。

关键词：硅前验证现场可编程门阵列(FPGA)原型内存系统性能评估校准方法

来源：评论

学校读者我要写书评

暂无评论

CRYSTAL-KYBER硬件设计优化空间探索

引用

信息安全学报 2021年第6期6卷 51-63页

作者：穆嘉楠赵艺璇严寒宋金峰叶靖李华伟李晓维中国科学院计算技术研究所体系结构国家重点实验室中国北京100094 中国科学院大学计算机学院中国北京101408

公钥密码学对全球数字信息系统的安全起着至关重要的作用。然而,随着量子计算机研究的发展和Shor算法等的出现,公钥密码学的安全性受到了潜在的极大的威胁。因此,能够抵抗量子计算机攻击的密码算法开始受到密码学界的关注,美国国家标准... 详细信息

公钥密码学对全球数字信息系统的安全起着至关重要的作用。然而,随着量子计算机研究的发展和Shor算法等的出现,公钥密码学的安全性受到了潜在的极大的威胁。因此,能够抵抗量子计算机攻击的密码算法开始受到密码学界的关注,美国国家标准与技术研究院(National Institute of Standards and Technology,NIST)发起了后量子密码(Post-quantum cryptography,PQC)算法标准全球征集竞赛。在参选的算法中,基于格的算法在安全性、公钥私钥尺寸和运算速度中达到了较好的权衡,因此是最有潜力的后量子加密算法体制。而CRYSTALS-KYBER作为基于格的密钥封装算法(Key encapsulation mechanism,KEM),通过了该全球征集竞赛的三轮遴选。对于后量子密码算法,算法的硬件实现效率是一个重要评价指标。因此,本文使用高层次综合工具(High-level synthesis,HLS),针对CRYSTALS-KYBER的三个主模块(密钥生成,密钥封装和密钥解封装),在不同参数集下探索了硬件设计的实现和优化空间。作为一种快速便捷的电路设计方法,HLS可以用来对不同算法的硬件实现进行高效和便捷的探索。本文利用该工具,对CRYSTALS-KYBER的软件代码进行了分析,并尝试不同的组合策略来优化HLS硬件实现结果,并最终获得了最优化的电路结构。同时,本文编写了tcl-perl协同脚本,以自动化地搜索最优优化策略,获得最优电路结构。实验结果表明,适度优化循环和时序约束可以大大提高HLS综合得到的KYBER电路性能。与已有的软件实现相比,本文具有明显的性能优势。与HLS实现工作相比,本文对Kyber-512的优化使得封装算法的性能提高了75%,解封装算法的性能提高了55.1%。与基准数据相比,密钥生成算法的性能提高了44.2%。对于CRYSTALS-KYBER的另外两个参数集(Kyber-768和Kyber-1024),本文也获得了类似的优化效果。

关键词：公钥密码学后量子密码学 CRYSTALS-KYBER 高层次综合优化设计

来源：评论

学校读者我要写书评

暂无评论

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案：

请选择收藏分类：

通借通还

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案： 新增检索档案 确定 取消

请选择收藏分类： 新增自定义分类 确定 取消

通借通还

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

请选择保存的检索档案：

请选择收藏分类：