检索结果-内蒙古大学图书馆

微电子学与计算机 2005年第10期22卷 7-11页

作者：赵永华迟学斌中国科学院计算机网络信息中心超级计算中心中国科学院研究生院北京100039

SMP集群混合了两个内存模型:每个节点是一个共享存储的多处理器,而节点间使用分布存储。这一多级体系结构引起了编程模型和性能方面的问题。文章讨论了MPI+OpenMP混合编程模型的性能和不同的实现方法,提出了多粒度MPI+OpenMP混合编程方... 详细信息

SMP集群混合了两个内存模型:每个节点是一个共享存储的多处理器,而节点间使用分布存储。这一多级体系结构引起了编程模型和性能方面的问题。文章讨论了MPI+OpenMP混合编程模型的性能和不同的实现方法,提出了多粒度MPI+OpenMP混合编程方法。建立了对称三对角特征问题的多粒度混合并行算法,并在深腾6800超级计算机上同纯MPI算法作了性能方面的比较。结果表明,该混合并行算法具有更好的扩展性和加速比。

关键词： SMP集群混合编程模型特征问题

来源：评论

学校读者我要写书评

暂无评论

MPI+OpenMP混合编程模型在大规模三对角线性方程组求解中的应用

引用

微电子学与计算机 2011年第8期28卷 158-161页

作者：郑汉垣刘智翔封卫兵张武上海大学计算机工程与科学学院上海200072 龙岩学院计算机系福建龙岩364000

分布式共享存储系统的特点是每个节点内是共享存储的,而节点间是分布式存储.为了更好地利用这种多级体系结构,讨论了MPI+OpenMP混合编程模型的性能及实现方法,建立了大规模三对角线性方程组的MPI+OpenMP混合并行算法,并在上海大学高性... 详细信息

分布式共享存储系统的特点是每个节点内是共享存储的,而节点间是分布式存储.为了更好地利用这种多级体系结构,讨论了MPI+OpenMP混合编程模型的性能及实现方法,建立了大规模三对角线性方程组的MPI+OpenMP混合并行算法,并在上海大学高性能计算集群上与单纯MPI算法进行了性能方面的比较.结果表明,MPI+OpenMP混合并行算法具有更好的加速比和扩展性.

关键词：混合编程模型分布共享存储三对角线性方程组 MPI

来源：评论

学校读者我要写书评

暂无评论

CPU/GPU混合编程模型上的并行谱聚类实现

CPU/GPU混合编程模型上的并行谱聚类实现

引用

作者：焦晓帆南开大学

学位级别：硕士

谱聚类作为极具竞争力的聚类算法，目前已经取得了较广泛的应用。谱聚类算法本质是通过特征分解，将原始的高维数据空间映射到特征向量空间，即低维的线性测度空间，然后对特征向量空间中的数据点进行聚类，所以谱聚类方法相对简单，对... 详细信息

谱聚类作为极具竞争力的聚类算法，目前已经取得了较广泛的应用。谱聚类算法本质是通过特征分解，将原始的高维数据空间映射到特征向量空间，即低维的线性测度空间，然后对特征向量空间中的数据点进行聚类，所以谱聚类方法相对简单，对复杂分布的数据也十分有效。但是作为一种新发展的聚类算法，谱聚类算法本身仍存在许多值得深入研究的问题，在如何构造相似矩阵W、如何处理特征向量、如何自动确定聚类数目、如何选取Laplacian矩阵、如何运用到大规模学习问题中几个方面尤为明显。在如今普遍的海量信息面前，谱聚类适用于大规模学习的问题亟待解决。随着当代科学与工程、制造业的需求驱动，高性能计算近些年来得到迅猛发展。相对于CPU的发展放缓，图形处理单元(GPU，Graph Processing Unit)在高性能计算方面的卓越表现受到越来越多人的瞩目。GPU优秀的计算性能以及高速的访存带宽为谱聚类在应用到大规模数据时，提高计算效率和节省内存空间提供了良好的平台支持。\n 为了解决利用谱聚类进行大规模数据处理时计算和空间复杂度较大的问题，本文在CPU/GPU异构编程模型上实现了一个基于t近邻相似矩阵的谱聚类方法(HSC)。同时针对数据规模过大时设备内存受限导致HSC不能正常工作的问题，本文提出了将数据分块后形成流水机制并在CPU/GPU异构编程模型上进行实现(HBSC)。在配有GTX480的单个计算节点和配有4个计算节点的MPI集群环境下，使用rcv1、covtypes、kddb和url等不同规模的数据集进行了实验。实验结果表明，HSC和HBSC均达到了较好的聚类质量，并且取得了较高的计算性能。对于较小规模的数据集rcv1，HSC是4个CPU计算节点(4核4线程)组成的集群计算环境下(MPI4*4)并行谱聚类算法(PSC)性能的4倍左右，而对于较大规模的数据集url，HBSC的计算性能则能达到PSC在MPI4*4工作模式下的7倍。

关键词：谱聚类混合编程模型流水机制数据处理空间复杂度

来源：评论

学校读者我要写书评

暂无评论

多核集群系统上的混合编程模型研究

引用

计算机与现代化 2009年第5期 1-4页

作者：张军万剑怡江西师范大学计算机信息工程学院江西南昌330022 江西省高性能计算技术重点实验室江西南昌330022

对采用多核处理器作为SMP集群系统的计算节点的系统上的一种混合编程模型─MPI+OpenMP混合编程模型进行了深入的研究。建立了两个矩阵乘的混合并行算法,在多核集群平台上与纯MPI算法分别进行了实验,并进行了性能方面的比较。试验表明,... 详细信息

对采用多核处理器作为SMP集群系统的计算节点的系统上的一种混合编程模型─MPI+OpenMP混合编程模型进行了深入的研究。建立了两个矩阵乘的混合并行算法,在多核集群平台上与纯MPI算法分别进行了实验,并进行了性能方面的比较。试验表明,混合编程具有更好的性能。

关键词：多核集群混合编程模型矩阵乘

来源：评论

学校读者我要写书评

暂无评论

基于MPI+OpenMP混合编程模型的水声传播并行算法

基于MPI+OpenMP混合编程模型的水声传播并行算法

引用

2011全国开放式分布与并行计算学术年会

作者：张林笪良龙范培勤海军潜艇学院，山东青岛 266071

声波是目前唯一能够在海水介质中进行远距离传播的有效载体，因此水下声传播成为海洋声学研究的主要内容之一，对现代声纳的设计和使用具有重要意义。宽带声传播、浅海地声反演、匹配场定位、水下环境仿真等技术的发展对水声传播提出了... 详细信息

声波是目前唯一能够在海水介质中进行远距离传播的有效载体，因此水下声传播成为海洋声学研究的主要内容之一，对现代声纳的设计和使用具有重要意义。宽带声传播、浅海地声反演、匹配场定位、水下环境仿真等技术的发展对水声传播提出了越来越高的要求，如何充分利用声传播模型和现代计算机技术实现声传播的快速计算已成为水声技术的一个重要研究方向。针对曙光TC4000L高性能机群系统计算节点多核处理器的组成特点，采用MPl+OpenMP并行混合编程模型实现了射线一简正波一抛物方程模型并行算法。测试分析结果表明，设计的并行算法具有较高的并行计算效率。

关键词：混合编程模型声传播海洋声学并行算法

来源：评论

学校读者我要写书评

暂无评论

MPI+OpenMP混合编程模型在大规模三对角线性方程组求解中的应用

MPI+OpenMP混合编程模型在大规模三对角线性方程组求解中的应用

引用

2011全国开放式分布与并行计算学术年会

作者：郑汉垣刘智翔封卫兵张武上海大学计算机工程与科学学院，上海 200072 龙岩学院计算机系，福建龙岩 364000 上海大学计算机工程与科学学院，上海 200072

分布式共享存储系统的特点是每个节点内是共享存储的，而节点间是分布式存储。为了更好地利用这种多级体系结构，讨论了MPI+OpenMP混合编程模型的性能及实现方法，建立了大规模三对角线性方程组的MPI+OpenMP混合并行算法，并在上海大学... 详细信息

分布式共享存储系统的特点是每个节点内是共享存储的，而节点间是分布式存储。为了更好地利用这种多级体系结构，讨论了MPI+OpenMP混合编程模型的性能及实现方法，建立了大规模三对角线性方程组的MPI+OpenMP混合并行算法，并在上海大学高性能计算集群上与单纯MPI算法进行了性能方面的比较。结果表明，MPI+OpenMP混合并行算法具有更好的加速比和扩展性。

关键词：混合编程模型分布式存储三对角线性方程组求解算法

来源：评论

学校读者我要写书评

暂无评论

基于SMP集群的混合并行编程模型研究

引用

计算机工程 2009年第3期35卷 271-273页

作者：王惠春朱定局曹学年樊建平湘潭大学数学与计算科学学院湘潭411105 中国科学院深圳先进技术研究院深圳518067

提出一种适用于SMP集群的混合MPI+OpenMP并行编程模型。该模型贴近于SMP集群的体系结构且综合了消息传递和共享内存2种编程模型的优势,能获得较好的性能。讨论该混合模型的实现机制以及MPI消息传递模型的特点。实验结果表明,在一定条件... 详细信息

提出一种适用于SMP集群的混合MPI+OpenMP并行编程模型。该模型贴近于SMP集群的体系结构且综合了消息传递和共享内存2种编程模型的优势,能获得较好的性能。讨论该混合模型的实现机制以及MPI消息传递模型的特点。实验结果表明,在一定条件下,该混合并行编程模型是SMP集群的最优选择。

关键词： SMP集群并行计算混合编程模型

来源：评论

学校读者我要写书评

暂无评论

基于OpenMP/MPI并行编程模型的N体问题的优化实现

引用

计算机工程与应用 2016年第5期52卷 16-21页

作者：祝永志续士强禹继国曲阜师范大学信息科学与工程学院山东日照276826

多核集群的层次化并行编程模型一直是高性能计算的研究热点。以SMP集群为例,从硬件上可分为节点间和节点内的两层架构。阐述了层次化并行编程的实现技术,针对N体问题算法进行了基于Hybrid并行编程模型的并行化研究。提出了一种块同步MPI... 详细信息

多核集群的层次化并行编程模型一直是高性能计算的研究热点。以SMP集群为例,从硬件上可分为节点间和节点内的两层架构。阐述了层次化并行编程的实现技术,针对N体问题算法进行了基于Hybrid并行编程模型的并行化研究。提出了一种块同步MPI/Open MP细粒度N体问题的优化算法。基于曙光TC5000A集群,将该算法与传统的N体并行算法进行了执行时间与加速比的比较,得出了几句总结性具体论述。

关键词：混合编程模型块同步算法 N-体问题性能优化

来源：评论

学校读者我要写书评

暂无评论

基于混合并行编程模型的ADMM算法研究与应用

基于混合并行编程模型的ADMM算法研究与应用

引用

作者：裘沁楠上海大学

学位级别：硕士

大数据是当今数字化信息社会的最关键特征之一,传统的运行在单机上的机器学习算法面对爆炸式增长的数据无法满足存储和计算的需求。高性能计算系统的发展为算法并行化提供了强有力的平台。充分利用高性能计算系统的资源,设计并实现高效... 详细信息

大数据是当今数字化信息社会的最关键特征之一,传统的运行在单机上的机器学习算法面对爆炸式增长的数据无法满足存储和计算的需求。高性能计算系统的发展为算法并行化提供了强有力的平台。充分利用高性能计算系统的资源,设计并实现高效的分布式算法是需要研究解决的问题。交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)是一种具有分解性和收敛性的优化算法,它可以将原始问题分解为多个子问题,通过协调子问题的解得到全局解。这种分解协作的过程,能够灵活地利用分布式环境的优势。本文根据分布式ADMM算法的原理和特征,结合现代高性能计算系统的结构优势,以ADMM算法分布式实现中的编程模型层为研究切入点,设计实现了更细粒度并行性的ADMM算法。主要的研究内容和创新点如下:(1)为了充分利用现代高性能计算系统的多节点多核心计算资源,结合分布式ADMM算法的分层交替迭代特征,本文设计了一种混合MPI/Open MP并行编程模型,并基于此模型设计实现异步分层ADMM算法(Asynchronous ADMM algorithm based on a hybrid MPI/Open MP programming model,AH-ADMM)。该算法在节点间基于MPI实现并行化,在节点内基于Open MP实现更细粒度的线程级并行化,通过使用多线程代替多进程计算子问题,减轻了内存和通信的压力。同时,针对支持向量机(Support Vector Machine,SVM)问题,设计了高效的并行化策略加速子问题的计算。AH-ADMM算法在提高单节点计算能力的同时,可以在高性能计算系统上更好的扩展。(2)针对ADMM算法子问题计算开销大以及广泛存在的数据不均衡问题,本文结合分布式ADMM算法子问题求解的独立性和灵活性,提出一种基于混合MPI/Open MP并行编程模型的分治ADMM算法(Divide-and-conquer ADMM algorithm based on hybrid programming model,DCAH-ADMM)。本文针对节点内数据子集的类别不均衡和节点间数据子集的密度不均衡两种情况,通过动态调整节点对应的局部惩罚项参数,平衡各个节点的收敛程度,以此提高整个算法的收敛速度。在节点内,使用代价敏感支持向量机作为分类器处理样本类别的不平衡;在节点间,各个节点依据本地数据子集特征模型,选择更优的子问题优化算法进行子问题求解。文中设计实现的DCAH-ADMM算法通过对计算节点实行分而治之,节点内的代价敏感子问题模型提升了算法在不均衡数据集的分类效果,节点间实现的更细粒度并行化控制提高了算法总体的运行效率。(3)本文设计了一类ADMM求解子问题接口,基于该接口和混合并行编程模型开发实现了基于分布式ADMM算法的线性分类库ADMMLC。该代码库主要适用于训练大规模支持向量机和逻辑回归等线性分类模型。用户可以通过子问题接口快速高效地加入新的子问题优化算法,或直接输入参数进行模型的训练。ADMMLC使用户无需过多关注分布式ADMM算法复杂的底层机制,为算法设计者提供高层编程模式,以根据具体应用场景选择合适的子问题求解算法,提高并行算法可扩展性。本文针对支持向量机问题,对提出的算法研发了并行程序,在“天河二号”和“自强4000”两个高性能计算系统上进行了测试。实验结果显示,与其他基于纯MPI编程模型的分布式ADMM算法相比,AH-ADMM算法最多可以减少86.7%的运行时间,能够在最多193个计算核心的集群上更好地扩展。针对分布式数据不均衡问题,在AH-ADMM算法的基础上提出DCAH-ADMM算法,进一步提升了算法的运行效率,并增强了训练模型的鲁棒性。

关键词：分布式算法交替方向乘子法混合编程模型细粒度并行高性能计算

来源：评论

学校读者我要写书评

暂无评论

多核集群下一种混合并行编程模型的研究

多核集群下一种混合并行编程模型的研究

引用

作者：张军江西师范大学

学位级别：硕士

科学技术的发展极大地促进了计算科学的进步。新一代计算机无论是计算能力还是计算速度都比以前的计算机优越,但是人类对计算的要求也在不断地提高。在实践中,有些单处理器不能很好地满足某些工程计算的需求,所以除了增加处理器本身的... 详细信息

科学技术的发展极大地促进了计算科学的进步。新一代计算机无论是计算能力还是计算速度都比以前的计算机优越,但是人类对计算的要求也在不断地提高。在实践中,有些单处理器不能很好地满足某些工程计算的需求,所以除了增加处理器本身的计算性能外,并行计算是一种提高计算能力的有效方法。计算机集群就为这样的并行计算提供了很好的平台。计算机集群系统就是将多台计算机组合起来进行协同工作,提供强大的并行计算能力的集群计算系统,它利用现有的计算机资源,把繁重的任务分配到各个计算节点上进行处理。目前比较主流的集群系统是SMP(Symmetric Multiprocessor)集群系统。它们是由拥有多个处理器的SMP节点和连接各节点间的快速网络构成的多级体系结构。但是目前,对于应当如何结合这种系统的SMP节点内部的并行和SMP Cluster节点间的并行,以及超线程对SMP Cluster系统并行程序设计的影响,人们了解得并不是很透彻,而这一点,恰恰是我们能够有效地进行并行程序设计并有效提高并行程序执行效率的基础。 MPI+OpenMP混合编程被认为是最适合用于SMP集群的编程编程模型,本文分析和测评了在SMP节点集群上的MPI、及MPI+0penMP编程模式性能和特性。在此基础上,提出了一种优化混合编程的方法,并进行了实例测试,经过对这几个并行程序设计模式性能方面的比较,得出优化的OpenMP+MPI是SMP集群编程模型的一个较好选择的结论。

关键词：集群 MPI OpenMP 混合编程模型

来源：评论

学校读者我要写书评

暂无评论

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案：

请选择收藏分类：

通借通还

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案： 新增检索档案 确定 取消

请选择收藏分类： 新增自定义分类 确定 取消

通借通还

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

请选择保存的检索档案：

请选择收藏分类：