您好,读者! 请
登录
内蒙古大学图书馆
首页
概况
本馆概况
组织机构
入馆须知
规章制度
馆藏布局
参观与访问图书馆
党建
资源
馆藏资源
电子资源
数据库导航
特色资源
服务
办证服务
图书借阅
阅读推广
文献传递与馆际互借
空间与设施
开放时间
iThenticate论文原创性检测服务
科研支持
论文收录引用证明
科技查新
知识产权
档案馆
帮助
联系我们
地理位置
新生指南
常见问题
图书捐赠
咨询与建议
建议与咨询
留下您的常用邮箱和电话号码,以便我们向您反馈解决方案和替代方法
您的常用邮箱:
*
您的手机号码:
*
问题描述:
当前已输入0个字,您还可以输入200个字
全部搜索
期刊论文
图书
学位论文
标准
纸本馆藏
外文资源发现
数据库导航
超星发现
本站搜索
搜 索
高级检索
分类表
所选分类
----=双击删除一行=----
>>
<<
限定检索结果
标题
作者
主题词
出版物名称
出版社
机构
学科分类号
摘要
ISBN
ISSN
基金资助
索书号
标题
标题
作者
主题词
出版物名称
出版社
机构
学科分类号
摘要
ISBN
ISSN
基金资助
索书号
作者
标题
主题词
出版物名称
出版社
机构
学科分类号
摘要
ISBN
ISSN
基金资助
索书号
作者
作者
标题
主题词
出版物名称
出版社
机构
学科分类号
摘要
ISBN
ISSN
基金资助
索书号
确 定
文献类型
207 篇
期刊文献
79 篇
学位论文
22 篇
专利
21 篇
会议
馆藏范围
329 篇
电子文献
0 种
纸本馆藏
日期分布
学科分类号
296 篇
工学
149 篇
计算机科学与技术...
92 篇
软件工程
74 篇
机械工程
26 篇
控制科学与工程
24 篇
信息与通信工程
22 篇
电子科学与技术(可...
18 篇
仪器科学与技术
15 篇
地质资源与地质工...
15 篇
网络空间安全
14 篇
航空宇航科学与技...
9 篇
测绘科学与技术
6 篇
环境科学与工程(可...
6 篇
生物医学工程(可授...
5 篇
光学工程
4 篇
船舶与海洋工程
2 篇
力学(可授工学、理...
2 篇
电气工程
2 篇
兵器科学与技术
2 篇
核科学与技术
18 篇
理学
9 篇
系统科学
3 篇
数学
2 篇
物理学
1 篇
天文学
16 篇
管理学
15 篇
管理科学与工程(可...
6 篇
医学
4 篇
基础医学(可授医学...
4 篇
临床医学
4 篇
医学技术(可授医学...
2 篇
中西医结合
2 篇
军事学
2 篇
军队指挥学
2 篇
艺术学
2 篇
设计学(可授艺术学...
主题
307 篇
统一计算设备架构
121 篇
图形处理器
68 篇
并行计算
27 篇
图形处理单元
12 篇
并行算法
7 篇
并行处理
7 篇
gpu
6 篇
图像处理器
6 篇
图形处理器的通用...
6 篇
并行
5 篇
合成孔径雷达
5 篇
消息传递接口
5 篇
光线投射
5 篇
粒子群优化
5 篇
细粒度并行计算
5 篇
单指令多线程
4 篇
gpu通用计算
4 篇
加速比
4 篇
机器视觉
4 篇
边缘检测
机构
10 篇
武汉大学
9 篇
华中科技大学
9 篇
湖南大学
7 篇
南京大学
7 篇
郑州师范学院
7 篇
西安电子科技大学
7 篇
哈尔滨工业大学
6 篇
大连理工大学
6 篇
中国科学院大学
6 篇
上海理工大学
6 篇
中国石油化工股份...
6 篇
电子科技大学
5 篇
国防科技大学
5 篇
装备学院
5 篇
西北工业大学
5 篇
杭州电子科技大学
5 篇
江苏科技大学
4 篇
暨南大学
4 篇
海军工程大学
4 篇
天津大学
作者
9 篇
肖汉
6 篇
刘伟峰
6 篇
吴玲达
6 篇
冯晓萌
4 篇
杨超
4 篇
胡祥涛
4 篇
魏一雄
4 篇
陈风
4 篇
张红旗
4 篇
陈帝江
4 篇
陈庆奎
4 篇
程五四
3 篇
李肯立
3 篇
田雨波
3 篇
周波
3 篇
刘丹
3 篇
孟凡密
3 篇
刘大刚
3 篇
钱育蓉
3 篇
曹邦功
语言
329 篇
中文
检索条件
"主题词=统一计算设备架构"
共
329
条 记 录,以下是21-30
订阅
全选
清除本页
清除全部
题录导出
标记到"检索档案"
详细
简洁
排序:
相关度排序
时效性降序
时效性升序
相关度排序
相关度排序
时效性降序
时效性升序
基于GPU并行加速的循环转账检测方法及装置
基于GPU并行加速的循环转账检测方法及装置
收藏
分享
引用
作者:
张洋
100005 北京市东城区建国门内大街69号
本申请提供
一
种基于GPU并行加速的循环转账检测方法及装置,涉及金融数据分析等技术领域,该方法包括:获取待处理的交易数据对应的有序哈希表,创建有序哈希表对应的有向图;根据预设数量,对有向图进行图块划分处理,得到预设数量个...
详细信息
标准号: CN117593009A
本申请提供
一
种基于GPU并行加速的循环转账检测方法及装置,涉及金融数据分析等技术领域,该方法包括:获取待处理的交易数据对应的有序哈希表,创建有序哈希表对应的有向图;根据预设数量,对有向图进行图块划分处理,得到预设数量个图块;针对各图块,采用预设数量个
统一计算设备架构
CUDA线程中
一
个CUDA线程,对图块进行环路检测,得到图块对应的数据环路;确定交易数据的数据环路包括各图块对应的数据环路。通过本申请提供的基于GPU并行加速的循环转账检测方法及装置,可以提高得到交易数据的数据环路的效率。
关键词:
图块
数据环路
交易数据
预设
哈希表
有向图
线程
并行
转账
统一计算设备架构
环路检测
金融数据
检测
申请
创建
分析
来源:
评论
学校读者
我要写书评
暂无评论
基于显卡资源的语音特征提取方法、装置、
设备
及介质
基于显卡资源的语音特征提取方法、装置、设备及介质
收藏
分享
引用
作者:
周定军
彭俊清
王健宗
518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼
本发明涉及自然语言处理技术、应用到语音识别技术领域,公开了
一
种基于显卡资源的语音特征提取方法、装置、
设备
及介质,用于提高语音识别效率。方法部分包括:从Kaldi平台中获取已训练好的语音识别网络模型;根据显卡资源信息和所述...
详细信息
标准号: CN113450770B
本发明涉及自然语言处理技术、应用到语音识别技术领域,公开了
一
种基于显卡资源的语音特征提取方法、装置、
设备
及介质,用于提高语音识别效率。方法部分包括:从Kaldi平台中获取已训练好的语音识别网络模型;根据显卡资源信息和所述语音识别网络模型,预先申请目标GPU上下文资源,并为已训练好的语音识别深度学习模型分配对应的目标显存;将所述语音识别网络模型加载至所述目标显存,并在所述目标GPU上下文资源创建
一
个或多个
统一计算设备架构
CUDA流;获取原始语音信息,在所述目标显存中,利用
一
个或多个所述CUDA流调用所述语音识别网络模型对所述原始语音信息进行特征提取。
关键词:
语音识别
网络模型
显存
原始语音信息
显卡资源
统一计算设备架构
自然语言处理技术
语音识别技术
语音特征提取
模型分配
特征提取
资源创建
加载
调用
申请
应用
学习
来源:
评论
学校读者
我要写书评
暂无评论
基于GPU技术的软件化双通道跟踪接收机的实现
收藏
分享
引用
电子质量
2023年 第8期 7-11页
作者:
扈景召
中国西南电子技术研究所
四川成都610036
介绍了GPU技术和CUDA编程平台在数字信号处理应用的特点,概述了基于上述平台的航天测控领域的标准TT&C双通道跟踪接收机的总体设计和硬件平台。描述双通道接收机算法原理和软件化实现流程,完成了初步的实现验证,为后续工程基于GPU...
详细信息
介绍了GPU技术和CUDA编程平台在数字信号处理应用的特点,概述了基于上述平台的航天测控领域的标准TT&C双通道跟踪接收机的总体设计和硬件平台。描述双通道接收机算法原理和软件化实现流程,完成了初步的实现验证,为后续工程基于GPU技术和CUDA编程平台的软件化实现提供了基础。
关键词:
双通道跟踪接收机
图形处理器
统一计算设备架构
软件实现
来源:
评论
学校读者
我要写书评
暂无评论
γ光子层析成像与检测及其CUDA加速技术研究
γ光子层析成像与检测及其CUDA加速技术研究
收藏
分享
引用
作者:
吕港
南京航空航天大学
学位级别:
硕士
γ光子层析成像技术作为
一
种无损检测手段,通过探测正电子湮灭产生的
一
对γ光子,还原被测件受限空间状态的图像,同时γ光子具有抗干扰能力和强穿透力,能够实现在复杂环境下对工业件的检测,因此该技术在工业检测领域拥有十分诱人的前景...
详细信息
γ光子层析成像技术作为
一
种无损检测手段,通过探测正电子湮灭产生的
一
对γ光子,还原被测件受限空间状态的图像,同时γ光子具有抗干扰能力和强穿透力,能够实现在复杂环境下对工业件的检测,因此该技术在工业检测领域拥有十分诱人的前景。但是,由于γ光子成像理论和探测技术的限制,容易造成重建图像分辨率不高、边缘模糊以及成像过程速度慢等问题,尤其是在要求成像速度快和分辨率高的工业检测中,应用较少,难以推广。本研究在γ光子层析成像原理基础上改进了成像算法,并提出了针对层析图像的快速特征检测算法,为大空间、大口径探测系统下快速得到边缘清晰且分辨率较高的γ光子层析图像提供了
一
种可行的解决方案。 为了解决层析成像过程中系统矩阵SM(system matrix,SM)精度不高、
计算
时间长以及存储量大的问题,提出了在
统一计算设备架构
CUDA(Compute Unified Device Architecture,CUDA)上实现
一
种优化立体角SM
计算
的方法。通过对CUDA并行框架和常用系统矩阵构建方法进行分析,研究了
一
种优化立体角SM
计算
方法;结合CUDA的并行特点,将SM
计算
过程划分成互相独立的小块,实现多层次的CUDA加速;采用三元组方法对系统矩阵进行压缩存储。实验结果显示采用优化立体角SM重建的层析图像质量有较好的提升效果,同时与CPU中
计算
的时间相比,CUDA加速1562×1002、1562×1282和1562×2002这三种不同规模系统矩阵的加速比分别是11.217、20.741和52.751,最终系统矩阵的大小也被压缩成原来的1.83%。 为了适应工业检测的需求,进
一
步加快重建速度和提升图像质量,针对规则受限内腔,将规则内腔轮廓作为先验知识,将系统矩阵改进成只针对层析图像活度区域即感兴趣区域ROI(Region of Interest,ROI)的优化立体角SM,不仅层析图像质量得到了提高,重建速度也加快了 10倍左右。针对不规则受限内腔,研究了
一
种虚拟盒子法重建层析图像,将系统矩阵改进成只针对层析图像中虚拟盒子部分的优化立体角SM,实验结果显示此方法能够提高图像质量,重建时间也加快了 6.6倍。 根据对工业件受限腔体特征检测的需求,研究了在CUDA上实现层析图像特征检测的方法。根据γ光子层析图像的特点,利用CUDA实现
一
种快速中值滤波与多方向Sobel算子结合的边缘检测算法。实验结果显示本算法对图像的处理效果优于经典算法,同时在CUDA中采用常量内存与共享内存相结合的多内存优化方法,实现缺陷三通模型加速了77.19倍,管道模型加速了 76.84倍,加速效果显著。
关键词:
γ光子层析成像技术
感兴趣区域
统一计算设备架构
工业无损检测
边缘检测
来源:
评论
学校读者
我要写书评
暂无评论
神经网络
计算
图的优化方法、装置及相关
设备
神经网络计算图的优化方法、装置及相关设备
收藏
分享
引用
作者:
雷宇
李原
朱建斌
付尧
519000 广东省珠海市香洲区吉大景山路莲山巷8号正方·云创园8楼B801-803室
本申请提供了
一
种神经网络
计算
图的优化方法、装置及相关
设备
,其中,该神经网络
计算
图的优化方法,包括:将待优化子图对应的程序转换为以待优化子图的输出数据表示的目标程序;待优化子图为神经网络
计算
图的子图;建立待优化子图的输...
详细信息
标准号: CN116702855A
本申请提供了
一
种神经网络
计算
图的优化方法、装置及相关
设备
,其中,该神经网络
计算
图的优化方法,包括:将待优化子图对应的程序转换为以待优化子图的输出数据表示的目标程序;待优化子图为神经网络
计算
图的子图;建立待优化子图的输出数据的索引与
统一计算设备架构
CUDA线程索引的对应关系;根据目标程序和对应关系,将待优化子图对应的程序转换为CUDA程序。本申请实施例不用根据算子的类型和算子间的拓扑关系预先定义大量的匹配模板,无需通过与匹配模板大量的样式匹配来进行子图的优化,而是将子图转换成CUDA程序,进而有利于减少定义匹配模板和样式匹配的工作量,提升神经网络
计算
图的优化效率。
关键词:
优化
神经网络
计算
匹配模板
程序转换
目标程序
输出数据
算子
索引
匹配
样式
统一计算设备架构
拓扑关系
预先定义
图转换
线程
申请
工作量
来源:
评论
学校读者
我要写书评
暂无评论
基于CUDA
架构
并行算法的带地形AMT二维反演实现与应用
收藏
分享
引用
科学技术与工程
2021年 第31期21卷 13268-13276页
作者:
韩思旭
陈小斌
陈卫营
罗强
宋婉婷
广东省地球物理探矿大队
广州510800
广东省地质物探工程勘察院
广州510800
中国地震局地壳应力研究所
北京100085
中国科学院地质与地球物理研究所
中国科学院矿产资源研究重点实验室北京100029
并行
计算
是提高音频大地电磁(audio-frequency magnetotelluric,AMT)数据反演效率的有效途径。在
统一计算设备架构
(compute unified device architecture,CUDA)下开展带地形的AMT数据二维反演并行算法研究,旨在利用GPU(graphics process...
详细信息
并行
计算
是提高音频大地电磁(audio-frequency magnetotelluric,AMT)数据反演效率的有效途径。在
统一计算设备架构
(compute unified device architecture,CUDA)下开展带地形的AMT数据二维反演并行算法研究,旨在利用GPU(graphics processing unit)强大的
计算
能力及并行
计算
技术实现高精度、快速度的AMT数据二维反演。首先利用有限元和自适应正则化反演算法实现AMT数据二维反演的串行化
计算
;然后在PGI Visual Fortran+CUDA5.5环境下编写基于CPU+GPU的CUDA并行代码,将正演中的频率循环、反演中的模型灵敏度矩阵
计算
和反演方程正则化求解部分进行并行化处理;通过不同复杂程度的理论模型正反演模拟验证了该并行算法的有效性和准确性。不同模型和不同模式下的数值模拟结果对比表明,基于CPU+GPU的CUDA并行算法相较于传统的CPU串行算法,在灵敏度矩阵
计算
和反演方程正则化方面耗时更少,加速比最高可达10倍以上。最后将该并行算法应用于某矿区实测AMT数据的二维反演中,取得了较好的应用效果。
关键词:
音频大地电磁法
并行
计算
二维反演
统一计算设备架构
加速比
来源:
评论
学校读者
我要写书评
暂无评论
基于CUDA
架构
下的直方图均衡并行算法
收藏
分享
引用
桂林理工大学学报
2021年 第3期41卷 654-663页
作者:
肖汉
肖诗洋
孙陆鹏
郭宝云
郑州师范学院信息科学与技术学院
郑州450044
东北林业大学土木工程学院
哈尔滨150040
山东理工大学建筑工程学院
山东淄博255000
为了提高图像对比度,解决传统的直方图均衡算法处理速度慢的问题,提出了基于
统一计算设备架构
(CUDA)的直方图均衡图像实时处理加速方案。利用图形处理器(GPU)强大的
计算
能力和CUDA优化的存储器结构,以加速直方图均衡中的图像灰度级投票...
详细信息
为了提高图像对比度,解决传统的直方图均衡算法处理速度慢的问题,提出了基于
统一计算设备架构
(CUDA)的直方图均衡图像实时处理加速方案。利用图形处理器(GPU)强大的
计算
能力和CUDA优化的存储器结构,以加速直方图均衡中的图像灰度级投票、分布概率累加并映射以及图像新的灰度值填充等功能进行运算。在CUDA条件下,对直方图均衡算法进行串-并行分析,分别从粗粒度与细粒度角度进行并行设计,通过实验测定进行了设计参数寻优,获得了线程块设计参数的最优尺寸。结果表明,基于CUDA的图像直方图均衡并行算法的性能相比基于CPU的串行算法和基于开放多处理(OpenMP)并行算法分别获得了61.58和32.00倍的加速比,能够为大规模实时性图像处理系统设计提供参考。
关键词:
直方图均衡
图像增强
图形处理器
统一计算设备架构
并行算法
来源:
评论
学校读者
我要写书评
暂无评论
基于CUDA的任意非结构化LDPC码的高吞吐量并行译码设计与实现
收藏
分享
引用
微电子学与
计算
机
2022年 第1期39卷 54-61页
作者:
王若天
沙金
南京大学电子科学与工程学院
江苏南京210023
由于非结构化的低密度奇偶校验码(LDPC)具有更优异的纠错性能而受到广泛关注,但其非零元素分布较不规律且没有循环或准循环的子矩阵的构造方式,增加了译码器实现的设计难度.本文提出了基于CUDA的译码器设计,用于支持任意非结构化LDPC码...
详细信息
由于非结构化的低密度奇偶校验码(LDPC)具有更优异的纠错性能而受到广泛关注,但其非零元素分布较不规律且没有循环或准循环的子矩阵的构造方式,增加了译码器实现的设计难度.本文提出了基于CUDA的译码器设计,用于支持任意非结构化LDPC码的高吞吐量并行译码.利用校验矩阵压缩重排、优化信息存储等手段,设计实现GPU上高效的并行译码内核进行多帧译码.在GTX1660Ti GPU平台上的结果表明,基于TPMP流程的LLR-BP和NMSA译码内核设计吞吐量可分别达到78.88~360.25 Mbps和174.38~1323.75 Mbps,实现了面向任意非结构化LDPC码的高效并行译码.
关键词:
低密度奇偶校验码(LDPC)
非结构化LDPC
置信度传播算法
统一计算设备架构
异构
计算
来源:
评论
学校读者
我要写书评
暂无评论
图像编解码工具的构建方法、图像编码、解码方法及装置
图像编解码工具的构建方法、图像编码、解码方法及装置
收藏
分享
引用
作者:
杨现
200010 上海市黄浦区中山南路1号11层(名义楼层)11V6室
本申请实施例公开了
一
种图像编解码工具的构建方法、图像编码、解码方法及装置,首先将封装Python调用接口的NVIDIA图像处理库作为第
一
编解码模块,并将封装Python调用接口的
统一计算设备架构
编解码算法作为第二编解码模块其中,
统一
计...
详细信息
标准号: CN116781921A
本申请实施例公开了
一
种图像编解码工具的构建方法、图像编码、解码方法及装置,首先将封装Python调用接口的NVIDIA图像处理库作为第
一
编解码模块,并将封装Python调用接口的
统一计算设备架构
编解码算法作为第二编解码模块其中,
统一计算设备架构
编解码算法是在
统一计算设备架构
上实现的。利用格式签名和头信息将第
一
编解码模块和第二编解码模块封装成图像编解码工具。以此构建的图像编解码工具可以提高图像编码和解码的效率。同时,第
一
编解码模块和第二编解码模块均封装了Python调用接口,从而使得图像编解码工具可以提供Python支持。
关键词:
编解码模块
图像编解码
统一计算设备架构
封装
调用接口
编解码算法
图像编码
构建
解码方法及装置
图像处理库
头信息
申请
来源:
评论
学校读者
我要写书评
暂无评论
基于GPU的LLE算法加速及性能优化
收藏
分享
引用
计算
机工程与设计
2021年 第5期42卷 1314-1322页
作者:
李繁
严星
张晓宇
新疆财经大学网络与实验教学中心
新疆乌鲁木齐830012
新疆财经大学信息管理学院
新疆乌鲁木齐830012
为提高非线性数据降维算法效能,分析这类算法的特点,综合考虑KNN
计算
和解决Sparse特征值两个问题,提出将LLE算法中的KNN搜索算法及大型稀疏矩阵解特征值这两个部分并行在GPU的运算平台上,通过这种方法来加快所有基于LLE发展而来的数据...
详细信息
为提高非线性数据降维算法效能,分析这类算法的特点,综合考虑KNN
计算
和解决Sparse特征值两个问题,提出将LLE算法中的KNN搜索算法及大型稀疏矩阵解特征值这两个部分并行在GPU的运算平台上,通过这种方法来加快所有基于LLE发展而来的数据降维技术的执行时间。仿真
计算
结果表明,在KNN方面整体加速可达40至50倍,在解大型稀疏矩阵特征值的部分加速至10倍左右。整体来说,数据降维算法加速10倍左右,有效运用GPU提高了LLE这类算法的性能。
关键词:
图形处理器
统一计算设备架构
LLE算法
KNN搜索
降维
来源:
评论
学校读者
我要写书评
暂无评论
没有更多数据了...
下一页
全选
清除本页
清除全部
题录导出
标记到“检索档案”
共33页
<<
<
1
2
3
4
5
6
7
8
9
10
>
>>
检索报告
对象比较
合并检索
0
隐藏
清空
合并搜索
回到顶部
执行限定条件
内容:
评分:
请选择保存的检索档案:
新增检索档案
确定
取消
请选择收藏分类:
新增自定义分类
确定
取消
订阅名称:
通借通还
温馨提示:
图书名称:
借书校区:
取书校区:
手机号码:
邮箱地址:
一卡通帐号:
电话和邮箱必须正确填写,我们会与您联系确认。
联 系 人:
所在院系:
联系邮箱:
联系电话:
暂无评论