咨询与建议

限定检索结果

文献类型

  • 6 篇 学位论文
  • 2 篇 期刊文献

馆藏范围

  • 8 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 8 篇 工学
    • 7 篇 计算机科学与技术...
    • 5 篇 软件工程
    • 1 篇 电子科学与技术(可...
    • 1 篇 控制科学与工程
  • 1 篇 管理学
    • 1 篇 管理科学与工程(可...

主题

  • 8 篇 栅栏同步
  • 2 篇 并行计算
  • 2 篇 众核处理器
  • 1 篇 微基准测试
  • 1 篇 二进制翻译
  • 1 篇 线程束调度
  • 1 篇 未指定行为
  • 1 篇 armv8多核处理器
  • 1 篇 simd
  • 1 篇 超节点
  • 1 篇 bsp
  • 1 篇 性能
  • 1 篇 核间通信
  • 1 篇 死锁
  • 1 篇 缓存旁路
  • 1 篇 存储模型映射
  • 1 篇 同步机制
  • 1 篇 通用图形处理器
  • 1 篇 计算模型映射
  • 1 篇 指令翻译

机构

  • 2 篇 国防科学技术大学
  • 2 篇 国防科技大学
  • 2 篇 西安电子科技大学
  • 1 篇 西安翔腾微电子科...
  • 1 篇 解放军信息工程大...
  • 1 篇 上海大学
  • 1 篇 中国航空计算技术...

作者

  • 1 篇 王昭飞
  • 1 篇 贾世伟
  • 1 篇 庞建民
  • 1 篇 张玉明
  • 1 篇 单征
  • 1 篇 孟睿
  • 1 篇 王华龙
  • 1 篇 李男
  • 1 篇 秦翔
  • 1 篇 田泽
  • 1 篇 高琬蓉
  • 1 篇 陈呈
  • 1 篇 臧照虎

语言

  • 8 篇 中文
检索条件"主题词=栅栏同步"
8 条 记 录,以下是1-10 订阅
排序:
一种针对栅栏同步的GPGPU微架构优化设计
收藏 引用
固体电子学研究与进展 2023年 第1期43卷 70-77页
作者: 贾世伟 张玉明 田泽 秦翔 西安电子科技大学微电子学院 西安710068 中国航空计算技术研究所集成电路与微系统设计航空科技重点实验室 西安710068 西安翔腾微电子科技有限公司 西安710068
为了降低通用图形处理器(GPGPU)中栅栏同步开销对程序性能产生的不良影响,提出了一种GPGPU微架构优化设计。该设计在线程束调度模块中,根据栅栏同步开销决定各线程束的调度顺序,确保高栅栏同步开销的线程束能够优先调度执行。在一级数... 详细信息
来源: 评论
众核处理器硬件栅栏同步机制设计与实现
众核处理器硬件栅栏同步机制设计与实现
收藏 引用
作者: 臧照虎 国防科技大学
学位级别:硕士
随着芯片设计制造技术的发展,众核处理器技术发展十分迅速,集成在单颗芯片上的处理器计算核心越来越多,其规模从十几核到如今的几百甚至上千核。为了充分发挥众核处理器性能,协调处理器核心并行工作的同步机制显得尤为重要。栅栏同步机... 详细信息
来源: 评论
面向ARMv8多核处理器的核间通信性能评估与同步算法优化研究
面向ARMv8多核处理器的核间通信性能评估与同步算法优化研究
收藏 引用
作者: 高琬蓉 国防科技大学
学位级别:硕士
多核处理器上并行程序性能优化一直是研究热点。在并行程序中,多个线程往往需要进行频繁地数据通信。核间通信效率是影响并行程序性能的重要因素。对基于共享内存的核间通信而言,其效率受到多核处理器缓存系统和缓存一致性协议的显著影... 详细信息
来源: 评论
众核DSP同步机制设计与实现
众核DSP同步机制设计与实现
收藏 引用
作者: 王华龙 西安电子科技大学
学位级别:硕士
在众核DSP中挖掘并行应用程序的并行性和追求更高的性能需要高效的DSP核间同步机制。传统的信号灯同步机制,基于“忙—等待”机制的旋转锁通过持续不断的请求同步变量来保证互斥性,这会在处理器节点之间产生严重的通信延迟,进而在片上... 详细信息
来源: 评论
面向异构众核的CUDA程序二进制翻译
收藏 引用
计算机工程与应用 2016年 第7期52卷 17-23页
作者: 李男 庞建民 单征 解放军信息工程大学 郑州450002
通过二进制翻译手段将CUDA程序移植到其他异构众核处理器平台特别是国产处理器平台,对扩展CUDA程序应用范围,发挥目标平台的众核优势以及支持民族产业都具有现实意义。设计了CUDA程序的二进制翻译框架,从CUDA程序可执行代码入手,采用&qu... 详细信息
来源: 评论
面向MIC平台的OpenACC实现与优化关键技术研究
面向MIC平台的OpenACC实现与优化关键技术研究
收藏 引用
作者: 陈呈 国防科学技术大学
学位级别:硕士
异构计算以其较高的峰值性能和较低的能耗成为当前研究的热点。随着GPU在通用计算领域的成功,Intel也推出了基于Intel Architecture(IA)架构的MIC(Many Integrated Core)协处理器,其第二代产品Xeon Phi已经成功部署在天河二号系统上。然... 详细信息
来源: 评论
OpenMP程序中的未指定行为和死锁的静态检测
OpenMP程序中的未指定行为和死锁的静态检测
收藏 引用
作者: 王昭飞 国防科学技术大学
学位级别:硕士
OpenMP以其良好的灵活性和可移植性成为了共享存储并行程序设计的工业标准。然而,由于编写并行程序的复杂性,OpenMP程序容易出错。未指定行为和与栅栏同步相关的死锁是导致OpenMP程序失效的两个潜在的原因。论文通过静态分析在OpenMP... 详细信息
来源: 评论
BSP并行环境的纯Java实现研究
BSP并行环境的纯Java实现研究
收藏 引用
作者: 孟睿 上海大学
学位级别:硕士
随着机群(cluster)结构计算机的广泛运用,基于网络的高性能计算在并行计算领域正得到越来越多多的重视.然而目前的并行计算境如MPI(Message Passing Interface)和BSP(Bulk Synchronous Parallel)还不能方便地提供导构计算平台上进行并... 详细信息
来源: 评论