检索结果-内蒙古大学图书馆

智能系统学报 2015年第1期10卷 1-11页

作者：丁科谭营北京大学机器感知与智能教育部重点实验室北京大学信息科学技术学院

在日趋复杂的图形处理任务的推动下,gpu已经演化成为具有众多计算核心、计算能力强大的通用计算设备,并被越来越多地应用于图形处理之外的计算领域。gpu具有高并行、低能耗和低成本的特点,在数据并行度高的计算任务中,相比与传统的CPU... 详细信息

在日趋复杂的图形处理任务的推动下,gpu已经演化成为具有众多计算核心、计算能力强大的通用计算设备,并被越来越多地应用于图形处理之外的计算领域。gpu具有高并行、低能耗和低成本的特点,在数据并行度高的计算任务中,相比与传统的CPU平台有着显著的优势。随着gpu体系结构的不断演进以及开发平台的逐步完善,gpu已经进入到高性能计算的主流行列。gpu通用计算的普及,使个人和小型机构能有机会获得以往昂贵的大型、超级计算机才能提供的计算能力,并一定程度上改变了科学计算领域的格局和编程开发模式。gpu提供的强大计算能力极大地推动了计算智能的发展,并且已经在深度学习和群体智能优化方法等子领域获得了巨大的成功,更是在图像、语音等领域取得了突破性的进展。随着人工智能技术和方法的不断进步,gpu将在更多的领域获得更加广泛的应用。

关键词：计算智能群体智能演化算法机器学习深度学习图形处理器 gpu通用计算异构计算高性能计算

来源：评论

学校读者我要写书评

暂无评论

gpu通用计算在CT中的应用

GPU通用计算在CT中的应用

引用

作者：胡修炎首都师范大学

学位级别：硕士

伴随着PC级微机的崛起和普及，多年来计算机图形处理器（graphics processing unit，简称gpu）以大大超过摩尔定律的速度高速发展。图形处理器的发展极大地提高了计算机图形处理的速度和图形质量，并促进了与计算机图形相关应用领域的... 详细信息

伴随着PC级微机的崛起和普及，多年来计算机图形处理器（graphics processing unit，简称gpu）以大大超过摩尔定律的速度高速发展。图形处理器的发展极大地提高了计算机图形处理的速度和图形质量，并促进了与计算机图形相关应用领域的快速发展。与此同时，图形处理器绘制流水线的高速度和并行性以及近年来发展起来的可编程功能为图形处理以外的通用计算提供了良好的运行平台，这使得基于gpu的通用计算成为近两三年来人们关注的一个研究热点。在CT领域，gpu通用计算技术同样有很大的应用空间，越来越多的人开始研究gpu通用计算技术在CT中的应用，本文利用gpu通用计算技术实现了三维CT数据的仿真。用CPU进行三维数据的仿真，其仿真速度比较慢，而且模型越复杂所花费的时间越多。由于图像的渲染过程与CT的数据扫描过程很相似，受此启发，本文把CT数据扫描的过程看作图像渲染的过程，利用gpu通用计算技术在gpu上实现了CT数据仿真。实验数据表明用gpu进行数据仿真与传统的CPU进行CT数据的仿真效率得到大大提升。同样道理把CT重建的过程可以看作投影的反过程，受此启发，本文利用gpu通用计算技术实现了平行扇束CT图像重建，其中投影数据是256*256，360个角度投影，重建体大小是256*256*256，测试结果表明gpu上重建时间比CPU下重建时间快了4倍左右。本文还利用gpu通用计算技术实现了快速傅立叶变换并将结果应用到CT滤波反投影重建算法中，将滤波反投影算法统一在gpu进行。实验数据表明gpu上滤波效率不如在CPU滤波效率，而且数据越大对比越明显，下一步将探索这些问题产生的原因，并进一步改进gpu-FFT算法。

关键词：图形处理器 gpu通用计算可编程性 CT数据仿真

来源：评论

学校读者我要写书评

暂无评论

gpu通用计算性能预测和优化

GPU通用计算性能预测和优化

引用

作者：江琳上海交通大学

学位级别：硕士

随着gpu在大规模数据并行计算中的广泛应用，GPgpu（General-Purpose gpu）程序的性能预测成为一个重要的研究课题。本文基于NVIDIA gpu和CUDA提出了两种gpu性能预测分析模型，分别为kernel性能的预测模型和混合编程性能预测模型。利用... 详细信息

随着gpu在大规模数据并行计算中的广泛应用，GPgpu（General-Purpose gpu）程序的性能预测成为一个重要的研究课题。本文基于NVIDIA gpu和CUDA提出了两种gpu性能预测分析模型，分别为kernel性能的预测模型和混合编程性能预测模型。利用本文提出的性能预测模型，GPgpu开发者可以预测算法和程序的性能，并理解开发过程中性能因素的选择和影响。 Kernel性能预测模型主要考虑了CUDA kernel在gpu上的指令执行过程。首先本文提出在CUDA指令执行模型下gpu理论上的最大指令吞吐量，然后在此基础上考虑影响GPgpu程序达到理论最大指令吞吐量的因素。在性能预测模型的基础上，本文提出了模型的应用工作流程。混合编程性能预测模型主要考虑CPU和gpu异步执行下的性能预测。在这个预测模型下，kernel的执行被看作一个整体，因此和kernel性能预测模型之间是独立的。混合编程性能预测模型是通过考虑不同部分的执行时间之间的相互关系，使用了分类讨论的方法。最后本文验证了两种性能预测模型的有效性，并提出了将性能预测模型应用于GPgpu程序优化的具体方法。

关键词：性能预测 gpu通用计算 CUDA KPEM HPPEM

来源：评论

学校读者我要写书评

暂无评论

gpu通用计算在格子Boltzmann方法中的应用

GPU通用计算在格子Boltzmann方法中的应用

引用

作者：王凯上海大学

学位级别：硕士

本文的研究内容着重集中在以下两个方面：\n 第一部分，利用基于图形接口的gpu通用计算，结合计算流体力学中的格子Boltzmann方法实现了对二维方腔流的数值模拟。首先介绍了gpu的渲染流水线，其次进行了图形接口和gpu可编程语言的相... 详细信息

本文的研究内容着重集中在以下两个方面：\n 第一部分，利用基于图形接口的gpu通用计算，结合计算流体力学中的格子Boltzmann方法实现了对二维方腔流的数值模拟。首先介绍了gpu的渲染流水线，其次进行了图形接口和gpu可编程语言的相关配置，随后设计了像素着色器中计算流体力学应用程序的算法，最后进行了数值模拟实验。实验得到正确结果显示出单个gpu与单个CPU的硬件加速比为4X。\n 第二部分，利用支持CUDA的gpu实现了矩阵乘法计算和二维方腔流的数值模拟。在对CUDA多线程并行计算模型的详细讨论、gpu的多级存储模型的介绍分析之后，进行矩阵乘法算法的并行计算设计。实验充分利用了共享内存和寄存器，并在线程调度方面进行了巧妙设计，实验结果得到了相对CPU的硬件加速比为48X。最后，重新设计了计算流体力学应用程序的CPU串行执行部分和gpu并行执行程序部分，再次利用基于CUDA的gpu通用计算对二维方腔流进行数值模拟实验，最后达到了17X的加速性能。

关键词：图形处理 gpu通用计算可编程语言格子Boltzmann方法数值模拟图形接口

来源：评论

学校读者我要写书评

暂无评论

gpu通用计算与基于SIFT特征的图像匹配并行算法研究

GPU通用计算与基于SIFT特征的图像匹配并行算法研究

引用

作者：年华西安电子科技大学

学位级别：硕士

目前,将gpu用于通用计算一直是国内外研究的热点,早期的GPgpu (gpu for general purpose)开发直接使用图形学API编程。这种开发方式难度大,成本高。NVIDIA公司推出的CUDA(Compute Unified Device Architecture,统一计算设备架构)是专门... 详细信息

目前,将gpu用于通用计算一直是国内外研究的热点,早期的GPgpu (gpu for general purpose)开发直接使用图形学API编程。这种开发方式难度大,成本高。NVIDIA公司推出的CUDA(Compute Unified Device Architecture,统一计算设备架构)是专门用于gpu通用计算的平台,其简单的编程风格,高效的多线程并行处理模式使得人们在面对计算密集型任务时能够更好地利用到gpu庞大的并行计算资源。另一方面,在图像匹配领域,SIFT算法作为一种基于特征点的匹配算法,能够很好的处理两幅图像之间发生平移、旋转、仿射变换情况下的匹配问题。较强的匹配能力和良好的健壮性使得SIFT算法在图像匹配领域有着广泛的应用。本文深入地分析了CUDA多线程编程模型的硬件架构和软件体系,详细描述了CUDA程序任务的划分,性能的评估以及CUDA程序的优化策略,并仔细分析对比了CUDA GT200架构和新一代架构Fermi的特点,指出了Fermi架构在设计结构上的改进和性能上的优势。在本文的实现部分,详细描述了基于SIFT特征的图像匹配算法在CUDA平台的并行设计与实现,并与CPU上的实现做了对比。实验结果表明,本文所实现的基于CUDA平台的SIFT算法相对于CPU上的实现在性能上能够取得很好的加速效果。

关键词： gpu通用计算 CUDA并行计算图像匹配 SIFT特征算子

来源：评论

学校读者我要写书评

暂无评论

面向多任务的gpu通用计算虚拟化技术研究

引用

计算机工程与科学 2013年第11期35卷 119-125页

作者：张云洲袁家斌吕相文南京航空航天大学计算机科学与技术学院江苏南京210016

随着硬件功能的不断丰富和软件开发环境的逐渐成熟,gpu在通用计算领域的应用越来越广泛,使用gpu集群来进行海量数据计算的例子不胜枚举。但是,相对于CPU,gpu的功耗较大,如果每个节点都配备gpu,则将大大增加集群的功耗。虚拟化技术的引... 详细信息

随着硬件功能的不断丰富和软件开发环境的逐渐成熟,gpu在通用计算领域的应用越来越广泛,使用gpu集群来进行海量数据计算的例子不胜枚举。但是,相对于CPU,gpu的功耗较大,如果每个节点都配备gpu,则将大大增加集群的功耗。虚拟化技术的引入使得在虚拟机中利用gpu资源进行通用计算成为可能。为高效、充分地利用gpu,针对gpu的特点,提出了一种面向多任务的可动态调度、支持多用户并发的gpu虚拟化解决方案。在已有的gpu虚拟化方案的基础上,综合考虑虚拟机域间通信的通用性以及任务的周转时间,建立了CUDA管理端来对gpu资源进行统一管理。通过设置综合负载评价值实现负载均衡并降低任务的平均周转时间。在设计的系统上进行大规模矩阵运算实验,结果说明了gpu虚拟化方案在计算系统中的可行性和高效性。

关键词： gpu通用计算虚拟化 CUDA 负载均衡

来源：评论

学校读者我要写书评

暂无评论

gpu通用计算软硬件处理架构研究

引用

航空计算技术 2013年第2期43卷 56-59页

作者：谢建春中航工业西安航空计算技术研究所陕西西安710068

现代gpu不仅是功能强劲的图形处理引擎,也是具有强大计算性能和存储带宽的高度并行可编程器件,能够与CPU构建完整的异构处理系统。而将gpu用于图形处理以外的计算,一般称之为gpu通用计算(General-Purpose computing on Graphics Process... 详细信息

现代gpu不仅是功能强劲的图形处理引擎,也是具有强大计算性能和存储带宽的高度并行可编程器件,能够与CPU构建完整的异构处理系统。而将gpu用于图形处理以外的计算,一般称之为gpu通用计算(General-Purpose computing on Graphics Processing Unit,GPgpu)。对gpu通用计算的概念及分类、硬件架构及工作机制、软件环境及处理模型进行详细的研究,期望为gpu通用计算在航空嵌入式计算领域的进一步应用提供参考。

关键词： gpu通用计算异构系统硬件架构软件处理架构

来源：评论

学校读者我要写书评

暂无评论

基于gpu通用计算平台的乐谱自动识别系统设计

引用

电子器件 2015年第4期38卷 908-911页

作者：谢晨伟陆天翼汤勇明东南大学电子科学与工程学院南京210096

在gpu通用计算平台上实现了一个钢琴独奏乐曲的乐谱识别系统,它读取WAV格式音频文件,利用gpu通用计算技术加速自相关函数算法来实现音高的识别,并综合考虑短时能量和基音周期的变化进行节拍划分。通过实际测试,验证了该乐谱识别系统的... 详细信息

在gpu通用计算平台上实现了一个钢琴独奏乐曲的乐谱识别系统,它读取WAV格式音频文件,利用gpu通用计算技术加速自相关函数算法来实现音高的识别,并综合考虑短时能量和基音周期的变化进行节拍划分。通过实际测试,验证了该乐谱识别系统的准确性,并证明了gpu并行计算对系统计算效率提升的效果:将计算时间减少到传统CPU计算时间的16%左右。

关键词： gpu通用计算自相关函数法短时能量乐谱识别

来源：评论

学校读者我要写书评

暂无评论

虚拟化环境下的gpu通用计算关键技术研究

虚拟化环境下的GPU通用计算关键技术研究

引用

作者：张云洲南京航空航天大学

学位级别：硕士

随着计算机硬件功能和软件开发环境的不断成熟，gpu应用逐渐从图形计算向通用计算领域发展，使用基于gpu的高性能计算平台进行海量数据计算科学研究的例子不胜枚举。虚拟化技术是当今计算机领域的一个研究热点，在虚拟化和gpu通用计算... 详细信息

随着计算机硬件功能和软件开发环境的不断成熟，gpu应用逐渐从图形计算向通用计算领域发展，使用基于gpu的高性能计算平台进行海量数据计算科学研究的例子不胜枚举。虚拟化技术是当今计算机领域的一个研究热点，在虚拟化和gpu通用计算的结合处，学术界的研究处于起步阶段，本文对虚拟化环境下的gpu通用计算关键技术进行研究。本文对虚拟化技术和gpu通用计算进行了详细的分析，对现有的gpu虚拟化解决方案进行总结，在gpu虚拟化方案和gpu资源调度算法的基础上，立足于降低任务的周转时间，对现有的gpu调度算法进行改进。通过设置综合负载评价值的方法实现负载均衡，将gpu特征、任务规模和计算复杂度纳入负载评价考量，实现更细粒度更准确的负载评价。针对大规模计算程序，本文在虚拟化环境下设计了基于OpenMP的多gpu协同计算方法，根据不同任务类型和任务规模进行不同的任务划分，采用经典的矩阵运算和复杂度较高的离散傅里叶变换等具有代表性的科学计算实例进行实验验证。实验结果表明，随着计算规模的增加，多gpu的加速比可以达到接近gpu的个数。为了降低由于虚拟化本身给gpu通用计算带来的性能开销，本文对现有的虚拟机域间通信优化解决方案进行总结，在特定虚拟化平台下采用对CUDA性能影响最低的通信方式。同时，在gpu内部数据交互的方式上，设计了两种数据传输方式对gpu协同计算进行测试，通过对理论计算和实际测量进行对比，验证了预测结果的正确性并得出影响多gpu协同运算效率的主要因素。

关键词：虚拟化 gpu通用计算资源调度周转时间 OpenMP 协同计算 CUDA

来源：评论

学校读者我要写书评

暂无评论

移动平台gpu通用计算研究综述

引用

软件导刊 2014年第10期13卷 1-3页

作者：周桐王帅严章熙朱虎明西安电子科技大学电子工程学院陕西西安710100

近年来,由于ARM、高通和三星等公司的大力推动,嵌入式平台使用的图形处理器(Graphic Processing Unit,gpu)也日趋具有强大的计算能力,越来越多的研究者将其应用于图像处理和数据挖掘等通用计算领域。对国内外在嵌入式和移动平台上的gpu... 详细信息

近年来,由于ARM、高通和三星等公司的大力推动,嵌入式平台使用的图形处理器(Graphic Processing Unit,gpu)也日趋具有强大的计算能力,越来越多的研究者将其应用于图像处理和数据挖掘等通用计算领域。对国内外在嵌入式和移动平台上的gpu通用计算进行了总结和归纳,发现gpu加速能力和低功耗特性是目前研究的重点。最后以Android操作系统为例,给出了基于开放计算语言(Open Computing Language,OpenCL)的并行计算环境构建思路。

关键词：移动平台 gpu通用计算加速能力低功耗特性并行计算

来源：评论

学校读者我要写书评

暂无评论

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案：

请选择收藏分类：

通借通还

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案： 新增检索档案 确定 取消

请选择收藏分类： 新增自定义分类 确定 取消

通借通还

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

请选择保存的检索档案：

请选择收藏分类：