检索结果-内蒙古大学图书馆

太原理工大学学报 2015年第6期46卷 727-734页

作者：周艺华解高纯段淑凤张常有北京工业大学计算机学院北京100124 中国科学院软件研究所并行软件与计算科学实验室北京100190 石家庄铁道大学信息科学与技术学院石家庄050043

针对Julia程序运行的时限约束,提出一种基于有色Petri网的程序运行性能自适应模拟方法。面向特定领域构建适应底层计算资源特点的工具库,抽取针对Julia语言的计算原语;程序员通过Julia语言实现原语,动态选取领域工具,适应运行时限约束... 详细信息

针对Julia程序运行的时限约束,提出一种基于有色Petri网的程序运行性能自适应模拟方法。面向特定领域构建适应底层计算资源特点的工具库,抽取针对Julia语言的计算原语;程序员通过Julia语言实现原语,动态选取领域工具,适应运行时限约束。结合图像对象识别案例,构建Colored Petri Net模型,借助CPN Tools工具模拟运行,自动优化备选方案。模拟实验表明,基于工具库的性能标定,CPN模拟得到的工具库映射方案接近最优。

关键词：云编程环境时限约束性能自适应 CPN模型性能标定

来源：评论

学校读者我要写书评

暂无评论

基于高维多目标序贯三支决策的恶意代码检测模型

引用

智能系统学报 2024年第1期19卷 97-105页

作者：崔志华兰卓璇张景波张文生太原科技大学大数据分析与并行计算山西省重点实验室山西太原030024 中国科学院自动化研究所北京100089

针对传统基于二支决策的恶意代码检测方法在面对动态环境中的复杂海量数据时,没有考虑在信息不充足条件下进行决策产生影响的问题,本文提出了一种基于卷积神经网络的序贯三支决策恶意代码检测模型。通过卷积神经网络对样本数据进行特征... 详细信息

针对传统基于二支决策的恶意代码检测方法在面对动态环境中的复杂海量数据时,没有考虑在信息不充足条件下进行决策产生影响的问题,本文提出了一种基于卷积神经网络的序贯三支决策恶意代码检测模型。通过卷积神经网络对样本数据进行特征提取并构建多粒度特征集,引入序贯三支决策理论对恶意代码进行检测。为改善检测模型整体性能,避免阈值选取的主观性,本文在上述模型的基础上,同时考虑模型的综合分类性能、决策效率和决策风险代价建立高维多目标序贯三支决策模型,并采用高维多目标优化算法对模型进行求解。仿真结果表明,模型在保证检测性能的同时,有效地提升了决策效率,降低了决策时产生风险代价,更好地拟合了真实动态检测环境。

关键词：恶意代码检测序贯三支决策卷积神经网络高维多目标优化基于参考点的高维多目标进化算法多粒度延迟决策决策阈值

来源：评论

学校读者我要写书评

暂无评论

基于Pthreads的车辆图像兴趣区域提取并行算法研究

引用

计算机科学 2017年第3期44卷 36-37,69页

作者：周艺华王文东陈宏彩王婷张常有北京工业大学计算机学院北京100124 可信计算北京市重点实验室北京100124 中国科学院软件研究所并行软件与计算科学实验室北京100190 河北省应用数学研究所石家庄050081

为了提高公安机关查找犯罪车辆的效率,提高车辆识别的效率很必要。据统计,提取兴趣区域(Region Of Interest,ROI)约占车型识别过程的60%,因此如何加速提取ROI过程尤其重要。首先,通过数据划分方法实现基本并行算法;然后,经过实验分析,... 详细信息

为了提高公安机关查找犯罪车辆的效率,提高车辆识别的效率很必要。据统计,提取兴趣区域(Region Of Interest,ROI)约占车型识别过程的60%,因此如何加速提取ROI过程尤其重要。首先,通过数据划分方法实现基本并行算法;然后,经过实验分析,在基本并行算法的基础上,精心设计预处理过程的分解方案,设置多队列缓冲区,减少共用缓冲区的线程数量和每个缓冲区互斥锁锁定的次数。实验证明,所提算法在双CPU 12核(支持超线程到24线程)的服务器上运行,相对于串行算法,实现了13.1x的加速比。

关键词：车型识别兴趣区域并行化 Pthreads 多核

来源：评论

学校读者我要写书评

暂无评论

一种提高SpMV向量化性能的新型稀疏矩阵存储格式

引用

数值计算与计算机应用 2014年第4期35卷 269-276页

作者：刘芳芳杨超中国科学院软件研究所并行软件与计算科学实验室北京100190 中国科学院软件研究所计算机科学国家重点实验室北京100190

稀疏矩阵向量乘(SpMV)是科学与工程计算中一个重要的核心函数,但在当前基于存储器层次结构的计算平台上,传统CSR(Compressed Sparse Row)存储的稀疏矩阵向量乘性能较低,运行效率往往远低于硬件浮点峰值的10%.目前现有的处理器架构一般... 详细信息

稀疏矩阵向量乘(SpMV)是科学与工程计算中一个重要的核心函数,但在当前基于存储器层次结构的计算平台上,传统CSR(Compressed Sparse Row)存储的稀疏矩阵向量乘性能较低,运行效率往往远低于硬件浮点峰值的10%.目前现有的处理器架构一般都采用SIMD向量化技术进行加速,但是传统CSR格式的稀疏矩阵向量乘由于访存的不规则性,不能直接采用向量化技术进行加速,为了利用SIMD技术,对具有局部性特征的稀疏矩阵,提出了新的稀疏矩阵存储格式CSRL(Compressed Sparse Row with Local information),该格式可以减少SpMV时内存访问次数,并且能够充分利用硬件的SIMD向量化技术进行读取和计算,提高了SpMV性能.实验表明,该方法相比国际著名商业库Intel MKL10.3版平均性能提升达到29.5%,最高可达89%的性能提升.

关键词：稀疏矩阵稀疏矩阵向量乘向量化局部性 CSRL

来源：评论

学校读者我要写书评

暂无评论

组播中代价最小的核选择算法

引用

计算机应用与软件 2007年第8期24卷 6-7,40页

作者：鄢冰峰徐云万颖瑜中国科学技术大学计算机科学技术系安徽合肥230027 中国科学院软件研究所计算机科学实验室北京100080

基于核的组播路由协议使用核节点作为传输中心,所有的组播数据首先被单播到核节点,然后再通过以核节点为根的分发树组播到目的节点。核节点的选择直接影响单播和组播的总代价。以总代价最小为目标,提出了核选择的完全算法和近似算法。

关键词：组播核选择最短路径 Steiner树

来源：评论

学校读者我要写书评

暂无评论

直线加速器束流动力学模拟异构软件优化和GPU泊松求解器研究

引用

数据与计算发展前沿 2014年第6期 81-90页

作者：杜克伟赵瑞峰赵亚亮李超张智磊王志军徐进中国科学院软件研究所并行软件与计算科学实验室中国科学院高能物理研究所中国科学院近代物理研究所

直线加速器中大规模带电粒子的追踪对高电流直线加速器的设计和优化至关重要。本文介绍了通过使用单精度数据类型和GPU泊松求解器对三维异构并行束流动力学模拟软件LOCUS3DG的优化工作,旨在对LOCUS3DG软件和其使用的FFT泊松求解器加速... 详细信息

直线加速器中大规模带电粒子的追踪对高电流直线加速器的设计和优化至关重要。本文介绍了通过使用单精度数据类型和GPU泊松求解器对三维异构并行束流动力学模拟软件LOCUS3DG的优化工作,旨在对LOCUS3DG软件和其使用的FFT泊松求解器加速。粒子按照一定比例同时分配到CPU和GPU中,在中国科学院超算中心和国家超算天津中心的集群上对软件进行了详细的测试,并得到了测试结果。最后总结了我们的异构束流模拟软件LOCUS3DG软件的优势和现状。

关键词：粒子追踪异构并行计算直线加速器图形处理器 CUDA

来源：评论

学校读者我要写书评

暂无评论

图的划分及其在非结构网格油藏数值模拟中的应用

图的划分及其在非结构网格油藏数值模拟中的应用

引用

第8届全国并行计算大会

作者：陈玉荣中国科学院软件研究所并行计算实验室北京 100080

图的划分已经成为应用于不规则结构计算的一种标准方法。本文采用Chaco提供的几种图的划分算法，对非结构网格油藏模拟科研算例进行了划分,提出实现非结构网格油藏数据的有效分割必须根据油藏几何地质特征并结合图的划分算法进行。另外... 详细信息

图的划分已经成为应用于不规则结构计算的一种标准方法。本文采用Chaco提供的几种图的划分算法，对非结构网格油藏模拟科研算例进行了划分,提出实现非结构网格油藏数据的有效分割必须根据油藏几何地质特征并结合图的划分算法进行。另外，文章还针对基于非结构网格数值离散得到的线性方程组，提出的配合“GraphPartitioning+Block Reordering”的对角块不完全分解预处理Krylov子空间方法是一种较为有效的并行计算方法。

关键词：油藏数值数值模拟并行计算计算机仿真

来源：评论

学校读者我要写书评

暂无评论

基于GPU计算连续分布式词向量的方法

基于GPU计算连续分布式词向量的方法

引用

2014全国高性能计算学术年会

作者：吴振华余雷马文静龙国平李玉成中国科学院软件研究所并行软件与计算科学实验室北京 100190 中国科学院大学北京100190 中国科学院软件研究所并行软件与计算科学实验室北京 100190

在用机器学习方法解决自然语言处理领域的问题,将词或符号表示成向量是一项基本工作.Google的开源工具word2vec利用深度学习模型得到的分布式词向量,能粗略表示词与词之间的距离,甚至词与词之间的向量运算能与语义对应,是近年来获得词... 详细信息

在用机器学习方法解决自然语言处理领域的问题,将词或符号表示成向量是一项基本工作.Google的开源工具word2vec利用深度学习模型得到的分布式词向量,能粗略表示词与词之间的距离,甚至词与词之间的向量运算能与语义对应,是近年来获得词向量的主流方法.在GPU上训练得到词向量,实现了CBOW和Skip_gram两种模型,每种模型又包含了层次Softmax和负取样两种算法.其中在层次Softmax算法中使用了满二叉树代替哈夫曼树,在GPU上更容易实现;对线程的配置和学习速率等一些参数巧妙地设置能提高效率和词向量的质量.在NVIDIA TeslaC2050的GPU上,相对于CPU单线程获得了14-28倍的加速比,相对于CPU多线程获得了2-7倍的加速比,而且词向量的精度要略高于CPU得到的词向量精度.

关键词：分布式词向量深度学习模型图形处理器自然语言

来源：评论

学校读者我要写书评

暂无评论

2009年中国高性能计算机发展现状分析与展望

引用

数据与计算发展前沿 2010年第1期1卷 76-84页

作者：张云泉孙家昶袁国兴张林波中国科学院软件研究所并行软件与计算科学实验室北京应用物理与计算数学所中国科学院数学与系统科学研究院

本文根据2009年11月发布的中国高性能计算机TOP100排行榜的数据,对国内高性能计算机的发展现状从总体性能、制造商、行业领域等方面进行了深入分析。在此基础上,根据八届排行榜积累的性能数据和能够得到的其他公开历史数据,对未来几年... 详细信息

本文根据2009年11月发布的中国高性能计算机TOP100排行榜的数据,对国内高性能计算机的发展现状从总体性能、制造商、行业领域等方面进行了深入分析。在此基础上,根据八届排行榜积累的性能数据和能够得到的其他公开历史数据,对未来几年中国内地高性能计算机的发展趋势进行了分析预测。从预测可以看出,累计Linpack性能将提前到2011年达到10Petaflops;峰值10Petaflops的机器将在2012年到2013年间出现;累计Linpack性能将在2014年左右达到100Petaflops;峰值100Petaflops的机器将在2015年左右出现。

关键词：高性能计算机 TOP100 排行榜性能分析

来源：评论

学校读者我要写书评

暂无评论

PPMLR-MHD数值模拟算法的并行性能优化

PPMLR-MHD数值模拟算法的并行性能优化

引用

2014全国高性能计算学术年会

作者：王婷张常有中国科学院软件研究所并行软件与计算科学实验室北京 100190

为提高PPMLR-MHD(Lagrangian version of Piecewise Parabolic Method-Magnetohydrodynamics)数值模拟算法的计算速度,对其进行了并行化及性能调优.对于理想MHD模型,描述了基于拉格朗日坐标的逐段抛物线方法PPMLR数值模拟算法,并用OpenMP、MPI及两者混合并行的方法进行了并行优化,在深腾7000及天河1A系统进行了测试.对于此应用算法,MPI及混合并行的优化效果不如共享内存的OpenMP线程并行优化,OpenMP并行化在深腾7000胖节点可扩展到256线程,加速比为29.3,有较好的并行效果.

关键词：数值模拟算法计算速度性能调优并行效果

来源：评论

学校读者我要写书评

暂无评论

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案：

请选择收藏分类：

通借通还

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案： 新增检索档案 确定 取消

请选择收藏分类： 新增自定义分类 确定 取消

通借通还

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

请选择保存的检索档案：

请选择收藏分类：