您好,读者! 请
登录
内蒙古大学图书馆
首页
概况
本馆概况
组织机构
入馆须知
规章制度
馆藏布局
参观与访问图书馆
党建
资源
馆藏资源
电子资源
数据库导航
特色资源
服务
办证服务
图书借阅
阅读推广
文献传递与馆际互借
空间与设施
开放时间
iThenticate论文原创性检测服务
科研支持
论文收录引用证明
科技查新
知识产权
档案馆
帮助
联系我们
地理位置
新生指南
常见问题
图书捐赠
咨询与建议
建议与咨询
留下您的常用邮箱和电话号码,以便我们向您反馈解决方案和替代方法
您的常用邮箱:
*
您的手机号码:
*
问题描述:
当前已输入0个字,您还可以输入200个字
全部搜索
期刊论文
图书
学位论文
标准
纸本馆藏
外文资源发现
数据库导航
超星发现
本站搜索
搜 索
高级检索
分类表
所选分类
----=双击删除一行=----
>>
<<
限定检索结果
标题
作者
主题词
出版物名称
出版社
机构
学科分类号
摘要
ISBN
ISSN
基金资助
索书号
标题
标题
作者
主题词
出版物名称
出版社
机构
学科分类号
摘要
ISBN
ISSN
基金资助
索书号
作者
标题
主题词
出版物名称
出版社
机构
学科分类号
摘要
ISBN
ISSN
基金资助
索书号
作者
作者
标题
主题词
出版物名称
出版社
机构
学科分类号
摘要
ISBN
ISSN
基金资助
索书号
确 定
文献类型
207 篇
期刊文献
79 篇
学位论文
22 篇
专利
21 篇
会议
馆藏范围
329 篇
电子文献
0 种
纸本馆藏
日期分布
学科分类号
296 篇
工学
149 篇
计算机科学与技术...
92 篇
软件工程
74 篇
机械工程
26 篇
控制科学与工程
24 篇
信息与通信工程
22 篇
电子科学与技术(可...
18 篇
仪器科学与技术
15 篇
地质资源与地质工...
15 篇
网络空间安全
14 篇
航空宇航科学与技...
9 篇
测绘科学与技术
6 篇
环境科学与工程(可...
6 篇
生物医学工程(可授...
5 篇
光学工程
4 篇
船舶与海洋工程
2 篇
力学(可授工学、理...
2 篇
电气工程
2 篇
兵器科学与技术
2 篇
核科学与技术
18 篇
理学
9 篇
系统科学
3 篇
数学
2 篇
物理学
1 篇
天文学
16 篇
管理学
15 篇
管理科学与工程(可...
6 篇
医学
4 篇
基础医学(可授医学...
4 篇
临床医学
4 篇
医学技术(可授医学...
2 篇
中西医结合
2 篇
军事学
2 篇
军队指挥学
2 篇
艺术学
2 篇
设计学(可授艺术学...
主题
307 篇
统一计算设备架构
121 篇
图形处理器
68 篇
并行计算
27 篇
图形处理单元
12 篇
并行算法
7 篇
并行处理
7 篇
gpu
6 篇
图像处理器
6 篇
图形处理器的通用...
6 篇
并行
5 篇
合成孔径雷达
5 篇
消息传递接口
5 篇
光线投射
5 篇
粒子群优化
5 篇
细粒度并行计算
5 篇
单指令多线程
4 篇
gpu通用计算
4 篇
加速比
4 篇
机器视觉
4 篇
边缘检测
机构
10 篇
武汉大学
9 篇
华中科技大学
9 篇
湖南大学
7 篇
南京大学
7 篇
郑州师范学院
7 篇
西安电子科技大学
7 篇
哈尔滨工业大学
6 篇
大连理工大学
6 篇
中国科学院大学
6 篇
上海理工大学
6 篇
中国石油化工股份...
6 篇
电子科技大学
5 篇
国防科技大学
5 篇
装备学院
5 篇
西北工业大学
5 篇
杭州电子科技大学
5 篇
江苏科技大学
4 篇
暨南大学
4 篇
海军工程大学
4 篇
天津大学
作者
9 篇
肖汉
6 篇
刘伟峰
6 篇
吴玲达
6 篇
冯晓萌
4 篇
杨超
4 篇
胡祥涛
4 篇
魏一雄
4 篇
陈风
4 篇
张红旗
4 篇
陈帝江
4 篇
陈庆奎
4 篇
程五四
3 篇
李肯立
3 篇
田雨波
3 篇
周波
3 篇
刘丹
3 篇
孟凡密
3 篇
刘大刚
3 篇
钱育蓉
3 篇
曹邦功
语言
329 篇
中文
检索条件
"主题词=统一计算设备架构"
共
329
条 记 录,以下是51-60
订阅
全选
清除本页
清除全部
题录导出
标记到"检索档案"
详细
简洁
排序:
相关度排序
时效性降序
时效性升序
相关度排序
相关度排序
时效性降序
时效性升序
基于嵌入式平台双目测量的CUDA优化
收藏
分享
引用
计算
机工程与设计
2019年 第3期40卷 667-671页
作者:
尚裕之
韩军
陈方杰
王祖武
上海大学通信与信息工程学院
上海200444
为提高双目测量算法运算的速度,提出
一
种包括减少搬移、增大并行度和异步工作的方法来进行优化。基于快速双边滤波算法(fast bilateral stereo matching),它的匹配精度接近于全局匹配算法。对于标准测试样本,实现的方法在NVDIA TX1开发...
详细信息
为提高双目测量算法运算的速度,提出
一
种包括减少搬移、增大并行度和异步工作的方法来进行优化。基于快速双边滤波算法(fast bilateral stereo matching),它的匹配精度接近于全局匹配算法。对于标准测试样本,实现的方法在NVDIA TX1开发板上
计算
得到视差图所需要的时间更短,相比原来的CPU
计算
方法,代价聚合的效率有80倍的提升。实时双目测量方法为在嵌入式平台获取高质量双目视觉深度信息提供了有效、可靠的途径。
关键词:
无人机
实时性
双目测量
统一计算设备架构
并行编程
来源:
评论
学校读者
我要写书评
暂无评论
并行
计算
在动态摄影测量边缘提取算法中应用
收藏
分享
引用
计算
机工程与设计
2019年 第1期40卷 97-102页
作者:
刘振涛
燕必希
董明利
孙鹏
王君
北京信息科技大学仪器科学与光电工程学院
北京100192
北京邮电大学信息光子学与光通讯研究院
北京100876
为满足动态摄影测量速度需求,设计
一
种将Hyper-Q技术应用于双站位相机图像Canny边缘提取算法中的实现方案。通过两个流对采集到的两幅图像分别处理,充分利用GPU
计算
资源,实现高效并行
计算
。对300个特征点3种不同分辨率图像进行特征点的C...
详细信息
为满足动态摄影测量速度需求,设计
一
种将Hyper-Q技术应用于双站位相机图像Canny边缘提取算法中的实现方案。通过两个流对采集到的两幅图像分别处理,充分利用GPU
计算
资源,实现高效并行
计算
。对300个特征点3种不同分辨率图像进行特征点的Canny边缘检测,实验结果表明,在同样分辨率图像下,基于CUDA的边缘检测算法
计算
比串行
计算
算法速度提高了8.8倍,应用Hyper-Q技术后的CUDA程序比串行
计算
速度提高了11.6倍,图像处理速度显著提高,为双相机动态摄影测量系统在分辨率为4288×2848下实现3Hz测量速度提供思路。
关键词:
动态摄影测量
并行
计算
统一计算设备架构
Hyper-Q
边缘提取
来源:
评论
学校读者
我要写书评
暂无评论
基于线程池的GPU任务并行
计算
模式研究
收藏
分享
引用
计算
机学报
2018年 第10期41卷 2175-2192页
作者:
李涛
董前琨
张帅
孔令晏
康宏
杨愚鲁
南开大学计算机与控制工程学院
天津300071
中国科学院计算技术研究所计算机体系结构国家重点实验室
北京100109
GPU已经成为具有高并发高内存带宽的通用协处理器,但是GPU与CPU在体系结构和编程模型上存在很大差异,导致CPU-GPU异构
计算
系统的编程复杂度提高,即使采用
统一计算设备架构
(CUDA)提供的kernel并发技术和多流技术也较难充分控制和利用GPU...
详细信息
GPU已经成为具有高并发高内存带宽的通用协处理器,但是GPU与CPU在体系结构和编程模型上存在很大差异,导致CPU-GPU异构
计算
系统的编程复杂度提高,即使采用
统一计算设备架构
(CUDA)提供的kernel并发技术和多流技术也较难充分控制和利用GPU上的
计算
资源,难以有效地处理不规则的并行应用问题.为从体系结构角度探索GPU硬件支持的页锁定内存和
统一
虚拟地址空间等特征,该文提出了CPU辅助任务调度管理下的基于线程池技术的GPU任务并行
计算
模型CAGTP,实现了CPU-GPU异构
计算
系统上的共享内存式程序设计.提出并设计了CPU端的任务队列、
计算
线程块级任务调度器、任务槽和GPU端的任务复用kernel函数等机制,实现了CPU与GPU间的高效细粒度任务交互,避免了原生CUDA程序中多次启停kernel函数的开销,有效地支持了GPU上的细粒度不规则并行任务
计算
,而且利用模型API接口函数能够降低CPU-GPU异构
计算
系统的编程难度.实验结果表明,CAGTP模型中任务调度的开销是kernel函数调用的5%,有效提升了通用矩阵乘、乔列斯基分解和K均值、T近邻等典型线性代数和机器学习算法的
计算
性能;CAGTP模型易于扩展使用多块GPU,且在性能差异较大的多个GPU之间达到负载均衡,能够高效求解混合任务和具有不规则并行性的应用问题.
关键词:
异构
计算
系统
统一计算设备架构
线程池
任务并行
任务复用函数
来源:
评论
学校读者
我要写书评
暂无评论
基于CUDA的并行SM4-GCM设计与实现
基于CUDA的并行SM4-GCM设计与实现
收藏
分享
引用
作者:
张才贤
西安电子科技大学
学位级别:
硕士
在目前大数据以及5G通信时代背景下,高速网络通信系统中信息的安全可靠传输已经成为
一
大研究热点,而其中
一
个重要研究议题就是要确保网络上传输数据的安全性、真实性、完整性和不可否认性。SM4是目前工业界广泛采用的分组加密算法,用于...
详细信息
在目前大数据以及5G通信时代背景下,高速网络通信系统中信息的安全可靠传输已经成为
一
大研究热点,而其中
一
个重要研究议题就是要确保网络上传输数据的安全性、真实性、完整性和不可否认性。SM4是目前工业界广泛采用的分组加密算法,用于保证数据的安全性,GCM算法则提供对数据的认证,将GCM与SM4算法结合使用即为SM4-GCM,该算法同时提供对数据的加密与认证。最近几年,GPU并行
计算
技术发展极为迅速,GPU具有强大的并行
计算
能力,成为高速异构
计算
系统首选加速模块,本文的研究目标是采用CPU-GPU异构
计算
模型实现对数据的高速认证加密,围绕该目标本文主要做了以下几个方面的工作:1.对工业界常用的认证加密方案进行了研究和总结,分析其中的优缺点。介绍了CUDA编程模型、存储器模型及访问特点、CUDA执行模型、SM4-GCM算法基本原理。2.结合SM4-GCM算法基本原理,对算法进行并行化分析,将算法剖分成三个主要部分,并划分了串行与并行任务。3.为实现高效率的数据读写,引入分级存储的思想,将共享内存作为全局内存与寄存器之间的缓存,并基于全局内存与共享内存的访存特性,设计了两种数据存储模式,既兼顾了全局内存对齐合并的访存特点,又避免了数据缓存过程中出现共享内存存储体访存冲突的问题。而为了解决这两种数据存储模式相互换的问题,本文设计了四组地址偏移量查找表,采用查表法快速确定线程读写地址,实现了这两种数据存储模式相互之间无访存冲突的转换,该思想在后续的加密与认证模块中均有体现。4.在设计加密核函数过程中,对SM4轮函数进行优化,减少内核对寄存器资源的消耗,采用循环展开,减少冗余指令。结合相关密码学理论,改进了GCM的认证工作模式。在设计主机接口函数过程中,引入了锁页内存与流,隐藏了CPU与GPU之间的通信延迟。5.结合GPU相关参数,调整相关核函数的配置,对本文所设计的模块进行测试,进而获得最佳内核配置。在最佳配置基础上测试了内核的性能指标,结果显示内核的各项指标均达到预期的效果。在该部分末尾还比较了不同的优化措施对模块性能的影响,并对结果作出相应的分析。本文基于所研究的技术和方法,对SM4-GCM认证加密算法进行并行化改进,认证加密速度达1.62GB/s,满足目前5G通信技术对认证加密速度的要求,程序的移植性较好,应用前景广阔。
关键词:
高速网络
认证加密
统一计算设备架构
并行
计算
来源:
评论
学校读者
我要写书评
暂无评论
求解线性方程组的GPU并行算法
收藏
分享
引用
河南水利与南水北调
2019年 第10期48卷 70-72,94页
作者:
谷国太
肖汉
河南省新闻出版学校
郑州师范学院信息科学与技术学院
求解线性方程组是众多学科与工程
计算
以及数值代数的基本问题之
一
。传统的线性方程组高斯消元串行算法中消元这
一
操作有大量的重复
计算
,大大限制了它的运行效率。文章提出了高斯消元求解线性方程组的并行算法。它借助CUDA平台在GPU上对...
详细信息
求解线性方程组是众多学科与工程
计算
以及数值代数的基本问题之
一
。传统的线性方程组高斯消元串行算法中消元这
一
操作有大量的重复
计算
,大大限制了它的运行效率。文章提出了高斯消元求解线性方程组的并行算法。它借助CUDA平台在GPU上对方程组的系数矩阵进行分块,块内的线程与矩阵元素
一
一
对应,实现了大量线程并行化简矩阵元素和恢复解向量。实验结果表明,并行算法执行效率明显提高,与串行算法相比实现了15.30倍的加速比,对于大规模数据处理呈现出良好的实时处理能力。
关键词:
图形处理器
统一计算设备架构
高斯消元法
并行
计算
来源:
评论
学校读者
我要写书评
暂无评论
基于任务分解模型的离散数据格网化并行优化
收藏
分享
引用
计算
机工程与设计
2018年 第6期39卷 1774-1781页
作者:
王家润
谢海峰
华北计算技术研究所基础三部
北京100083
针对国产应用的性能提升,基于CPU\GPU多核技术,提出软硬件结合的并行优化策略及反距离权重(IDW)插值的并行优化算法(PIDW),优化离散数据网格化处理。针对并行处理中的线程任务分解共性难点,设计基于开放多核处理(OpenMP)与
统一
计算设备
...
详细信息
针对国产应用的性能提升,基于CPU\GPU多核技术,提出软硬件结合的并行优化策略及反距离权重(IDW)插值的并行优化算法(PIDW),优化离散数据网格化处理。针对并行处理中的线程任务分解共性难点,设计基于开放多核处理(OpenMP)与
统一计算设备架构
(CUDA)的线程任务分解模型(TTDM),具有线程访问安全(不越界)、
计算
无冗余(无重复)、
计算
完整(无遗漏)等特点,具有较好的
计算
均衡性(负载均衡)。通过国产及商用多环境实验,加速比分别是3.6和5.9,验证了PIDW算法的性能提升能力。
关键词:
多核技术
离散数据
格网化
线程任务分解模型
反距离权重
开放多核处理
统一计算设备架构
来源:
评论
学校读者
我要写书评
暂无评论
基于扩散码的图像加密算法
收藏
分享
引用
计算
机工程与设计
2018年 第2期39卷 370-375页
作者:
张大兴
刘志发
武健
陈辉映
杭州电子科技大学图形图像研究所
浙江杭州310018
结合扩散码密码体制中单比特码构造分组密码的思想,通过哈达玛矩阵实现信元扩散、布尔函数实现信元混合,完成
一
次信元加密。利用扩散码基础单元作为Feistel密码结构中F函数并用于图像加密,实验结果表明,该算法对图像具有良好的加密效果...
详细信息
结合扩散码密码体制中单比特码构造分组密码的思想,通过哈达玛矩阵实现信元扩散、布尔函数实现信元混合,完成
一
次信元加密。利用扩散码基础单元作为Feistel密码结构中F函数并用于图像加密,实验结果表明,该算法对图像具有良好的加密效果,能够有效抵抗常见攻击。考虑到扩散码算法中高度并行的特点,设计并给出GPU平台下图像加密算法的实现,该算法相比于CPU平台有近180倍加速。
关键词:
扩散码
分组密码
图像加密
统一计算设备架构
并行
计算
来源:
评论
学校读者
我要写书评
暂无评论
基于GPU的芯片热分析方法研究
收藏
分享
引用
计算
机应用研究
2018年 第3期35卷 773-776页
作者:
马骏
徐宁
武汉理工大学计算机科学与技术学院
武汉430070
针对大规模IC芯片中局部高温热效应问题,提出基于网格的随机行走方法分析稳态温度分布。该算法只
计算
热源附近的点,从而大幅减少
计算
量。首先对金字塔型非规则热分析模型进行了研究,然后提出了
一
种预先保存概率表的加速策略;将随机行走...
详细信息
针对大规模IC芯片中局部高温热效应问题,提出基于网格的随机行走方法分析稳态温度分布。该算法只
计算
热源附近的点,从而大幅减少
计算
量。首先对金字塔型非规则热分析模型进行了研究,然后提出了
一
种预先保存概率表的加速策略;将随机行走算法在CUDA上实现了并行,得出了最大限度使用GPU资源并保证最大加速比的最优配置。实验结果表明,提出的并行随机行走算法使总体
计算
性能提升了7~10倍。
关键词:
统一计算设备架构
图形处理器加速
随机行走
金字塔模型
IC
热分析
来源:
评论
学校读者
我要写书评
暂无评论
创建虚拟机的方法、装置、
设备
和
计算
机存储介质
创建虚拟机的方法、装置、设备和计算机存储介质
收藏
分享
引用
作者:
郭利军
张宇
刘琦
100085 北京市海淀区上地十街10号百度大厦2层
本发明提供
一
种创建虚拟机的方法、装置、
设备
和
计算
机存储介质,涉及云
计算
领域。所述方法包括:服务器端获取创建虚拟机的请求,所述请求中包含图形处理器GPU驱动的版本;确定与所述GPU驱动的版本对应的
统一计算设备架构
CUDA的版本,...
详细信息
标准号: CN110489210A
本发明提供
一
种创建虚拟机的方法、装置、
设备
和
计算
机存储介质,涉及云
计算
领域。所述方法包括:服务器端获取创建虚拟机的请求,所述请求中包含图形处理器GPU驱动的版本;确定与所述GPU驱动的版本对应的
统一计算设备架构
CUDA的版本,并分别获取与GPU驱动的版本以及CUDA的版本对应的安装文件;根据普通镜像以及所述安装文件,在云服务器中完成虚拟机的创建。本发明能够降低创建虚拟机的人力成本,并提升虚拟机的创建效率以及创建成功率。
关键词:
虚拟机
创建
安装文件
驱动
统一计算设备架构
计算
机存储介质
图形处理器
服务器端
人力成本
云服务器
云
计算
成功率
来源:
评论
学校读者
我要写书评
暂无评论
高频空时回波信号半物理仿真关键技术
高频空时回波信号半物理仿真关键技术
收藏
分享
引用
作者:
胡民
哈尔滨工业大学
学位级别:
硕士
快速并可靠地检测海上目标,在军事和民用方面均有重大的意义。然而,面对复杂多变的工作环境,海面雷达所接收到的回波信号中除了有效的目标信号外,还会包括各类干扰、噪声、海杂波等。其中,海杂波的非高斯、非平稳特性明显,且功率水平较...
详细信息
快速并可靠地检测海上目标,在军事和民用方面均有重大的意义。然而,面对复杂多变的工作环境,海面雷达所接收到的回波信号中除了有效的目标信号外,还会包括各类干扰、噪声、海杂波等。其中,海杂波的非高斯、非平稳特性明显,且功率水平较高使其成为首要限制检测性能的重要原因之
一
。因此,以目标检测为出发点,根据海杂波的特殊频谱特性建立动态海面的海杂波模型,由此丰富雷达信号模拟器的环境背景,为有效进行海面复合目标检测的研究提供基础。由于雷达实验的成本越来越高,且后续数据处理的实时性和可靠性要求也更加严格。传统的雷达信号模拟器会受到自身处理性能差和环境模拟形式单
一
等制约,很难达到研究人员预期的高运算精度和实时处理速度。因此本文提出利用(NURBS)曲线曲面建模方法精确建立空时变化的粗糙海面模型,利用电磁仿真
计算
时变海面的电磁散射系数;然后基于GPU的快速
计算
能力构造时变的粗糙海面回波和海上目标信号回波;最后利用相关信号处理算法验证回波构造和算法仿真的正确性。本文通过这种更可靠且实用性更强的方法建立具有时效性的以动态海面为检测背景的高频地波雷达信号模拟系统。首先,本文针对动态海面的模型建立问题,本文使用线性滤波法将静态海面谱中加入时间变化因子从而得到随时间变化的动态粗糙海面。其中海面谱选取经典PM海浪谱,通过蒙特卡洛法生成点云形式的海浪模型,再利用NURBS曲线曲面建模法将超大尺寸的海浪模型逆向重构为NURBS网格形式海面。NURBS建模的
一
大优势是提高大尺寸模型的建模精度,为后续
计算
时变的粗糙海面电磁散射系数铺垫。然后,本文针对
计算
电大尺寸电磁散射系数的方法问题,本文利用三维全波电磁仿真软件FEKO对上文中提到的NURBS海面模型进行格式转换,并利用它的多种算法
计算
空时变换的海面电磁散射系数。其中使用物理光学算法能够节省大量的
计算
资源使得
计算
时间大大减少,因此这种方法更适用于大场景模型的
计算
。这进
一
步的推进了后续复合海面目标回波的构造以及相关信号处理算法的实现。最后,本文针对复合目标回波信号的构造的问题,海杂波时间序列可以通过准静态方法来实现。但是由于需要对整个构成场景的点目标和时空变化的海杂波进行回波构造,CPU难以满足大场景,实时性的
计算
要求。因此本文基于多组GPU并行
计算
的方法提高回波模拟的速度,大大提升了雷达仿真系统的实用性能。此外,还采用距离多普勒和波束形成算法验证回波构造的正确性。
关键词:
动态海面建模
曲线曲面建模
电磁仿真
统一计算设备架构
来源:
评论
学校读者
我要写书评
暂无评论
没有更多数据了...
下一页
全选
清除本页
清除全部
题录导出
标记到“检索档案”
共33页
<<
<
2
3
4
5
6
7
8
9
10
11
>
>>
检索报告
对象比较
合并检索
0
隐藏
清空
合并搜索
回到顶部
执行限定条件
内容:
评分:
请选择保存的检索档案:
新增检索档案
确定
取消
请选择收藏分类:
新增自定义分类
确定
取消
订阅名称:
通借通还
温馨提示:
图书名称:
借书校区:
取书校区:
手机号码:
邮箱地址:
一卡通帐号:
电话和邮箱必须正确填写,我们会与您联系确认。
联 系 人:
所在院系:
联系邮箱:
联系电话:
暂无评论