检索结果-内蒙古大学图书馆

作者：刘相平电子科技大学

学位级别：硕士

Hadoop分布式系统框架有效解决了大数据环境下数据的存储和处理问题,其性能与作业调度密切相关。采用高效的调度方案,可更加充分合理地的分配及利用云计算资源,针对Hadoop作业调度算法的研究对于提高Hadoop系统的整体性能具有重大的现... 详细信息

Hadoop分布式系统框架有效解决了大数据环境下数据的存储和处理问题,其性能与作业调度密切相关。采用高效的调度方案,可更加充分合理地的分配及利用云计算资源,针对Hadoop作业调度算法的研究对于提高Hadoop系统的整体性能具有重大的现实意义。本文对Hadoop现有的作业调度算法及异构环境下提出的LATE调度算法进行了研究与分析,重点针对LATE调度算法在推测式执行机制上存在的不足进行了优化。对于大型Hadoop集群,数据跨机架存储概率较高,而LATE调度算法假定大部分的Map任务都是在本地读取数据执行,并且没有考虑reduce任务是否本地读取数据执行,导致系统大部分的时间都消耗在机架间的数据传输上。针对LATE调度算法在推测式执行机制中没有考虑数据局部性的问题,本文在第四章提出了一种基于LATE调度算法的数据局部性改进算法。该算法在LATE调度算法的基础上,改进了推测式执行中慢任务的判定方法,并且在为节点空闲槽分配备份任务时,首先考虑本机机架上是否需要备份执行任务,如果没有,才会到其它机架上寻找合适的备份任务执行,从而提高了系统的执行效率。在实际的大型Hadoop集群环境中,运行的作业会涵盖CPU密集型和I/O密集型两种作业,其所需的系统资源是不同的。目前,Hadoop调度算法并没有针对这两种作业的并行化进行改进,使得系统的资源竞争仍然严重。针对这个问题,本文第五章提出了一种基于LATE调度算法的资源互补分配改进算法。该算法在LATE调度算法的基础上,通过对Hadoop集群的作业负载和节点负载进行合理的分类,充分考虑CPU和I/O密集型作业所需系统资源是互补的这一情况下,对备份任务进行合理的调度执行,极大改善了因为资源竞争和不合理调度导致系统性能低下的问题。为了尽可能的验证本文算法的优势,本文针对第四章和第五章分别搭建了相应的Hadoop集群环境,进行了仿真验证。其中,第四章模拟了两个机架,第五章为了控制变量,采用简单集群。实验结果表明,本文算法在一定程度上提高了Hadoop集群的处理性能。

关键词： Hadoop 大数据推测执行数据局部性 LATE调度算法

来源：评论

学校读者我要写书评

暂无评论

基于指令分类的推测性侧信道防御研究

基于指令分类的推测性侧信道防御研究

引用

作者：何卓华中科技大学

学位级别：硕士

CPU作为计算机系统的核心,其安全属性对于系统安全起到至关重要的作用。近年来公布的两组CPU安全漏洞Spectre与Meltdown,几乎影响了全球所有现代处理器,对计算机系统安全造成了严重的危害。其中,Spectre利用了现代处理器中广泛使用的推... 详细信息

CPU作为计算机系统的核心,其安全属性对于系统安全起到至关重要的作用。近年来公布的两组CPU安全漏洞Spectre与Meltdown,几乎影响了全球所有现代处理器,对计算机系统安全造成了严重的危害。其中,Spectre利用了现代处理器中广泛使用的推测执行技术,是一种难以防御的CPU安全漏洞。Spectre攻击误导受害者的指令流在错误的路径上执行,并且构建推测性侧信道来泄露受害者的秘密数据。最近针对Spectre攻击的防御措施使用延迟执行技术来阻止推测性侧信道,但是它们的性能开销极为高昂,硬件修改过程复杂,并且无法阻止一些潜在的推测性侧信道。针对现有Spectre防御措施的不足,基于优化的硬件污点跟踪技术和延迟执行策略实现的Spec Terminator防御方案,可以精确阻止各类推测性侧信道并且避免非必要的指令延迟。所提的硬件污点跟踪技术引入了能监测推测状态的指令掩码设计,可以基于指令引起的微架构状态变化对敏感指令进行分类和识别,从而准确判断泄密的范围。提出的延迟执行策略包括转译后备缓冲区(Translation Lookaside Buffer,TLB)请求忽略、选择性发出、扩展的未命中延时以及延迟回滚策略,它们可以根据敏感指令的执行特点,动态调整推测期间敏感指令的执行流程,从而精确控制这些指令仅在有泄密风险的流水线阶段被延迟。在基于第五代精简指令集(Reduced Instruction Set Computing-V,RISC-V)的FPGA加速仿真平台上实现了Spec Terminator防御方案,并且首次在RISC-V上复现了各种现有的基于x86的Spectre攻击变体。实验评估表明,在安全方面,Spec Terminator防御方案能成功防御这些攻击变体。在性能方面,针对内存层次推测性侧信道的防御设计Spec Terminator-v1带来了2.6%的性能开销,针对现有所有推测性侧信道的防御设计Spec Terminator-v2带来了6.0%的性能开销。相比于现有针对Spectre攻击的防御方案,Spec Terminator以更少的性能开销与硬件更改达到了更强的安全防御效果。

关键词：安全防御侧信道推测执行污点跟踪

来源：评论

学校读者我要写书评

暂无评论

面向一种云计算平台的任务调度技术研究

面向一种云计算平台的任务调度技术研究

引用

作者：李丽英湖南大学

学位级别：硕士

随着云计算技术近几年的迅速发展，Hadoop这种处理大规模密集型数据的云计算平台受到国内外大型IT公司、社交网络、全球各大通信运营商等的广泛关注及应用。Hadoop系统可部署在廉价的普通服务器上，能高效并行处理大规模数据集。Hadoop... 详细信息

随着云计算技术近几年的迅速发展，Hadoop这种处理大规模密集型数据的云计算平台受到国内外大型IT公司、社交网络、全球各大通信运营商等的广泛关注及应用。Hadoop系统可部署在廉价的普通服务器上，能高效并行处理大规模数据集。Hadoop平台有可能由成千上万个节点组成，在这些节点中采用什么样的任务调度技术协同处理各个任务显得尤为重要。一个好的任务调度策略不但能够很大程度上提高任务响应时间和系统吞吐率，也能提高整个集群资源的利用率。因此，任务调度技术的研究对云计算平台的发展具有重要意义。本文面向云计算平台Hadoop的任务调度技术进行了如下研究：首先，研究Hadoop平台的基本架构，Hadoop主要由数据存储结构HDFS和任务并行处理模型MapReduce两个部分组成。在其架构的基础上分析了Hadoop的数据存储特性、任务处理流程以及数据流程。详细阐述了Hadoop平台的任务调度技术发展现状，并分析了现有Hadoop平台采用的任务调度算法的特点和局限性。其次，根据Hadoop数据的存储特性，提出了基于数据局部性对LATE算法的改进策略，在Hadoop平台中分机架考虑任务推测执行的调度问题，选择备份任务推测执行时，优先选择数据存储在请求处理节点上的任务，以及节点所在机架上的任务推测执行；如果没有数据存储在本节点或者本机架的任务需要推测执行，再考虑在其它机架上查找需要推测执行的任务。再次，利用统计学概率论解决任务等待时间过长影响工作响应时间的情况。根据稀有事件发生概率模型，综合考虑数据局部性优化问题和任务等待本节点或者本机架处理的时间过长反而影响任务响应时间的问题。最后，在CloudSim仿真平台上模拟Hadoop架构，对不同的任务类型，设定不同的参数值进行仿真实验，分析算法在提高任务本地化处理能力、减少工作响应时间以及优化系统吞吐率等方面较其他算法具有明显优势，基于数据局部性的改进算法解决了Hadoop平台任务调度技术有关数据局部性问题的性能瓶颈。

关键词：云计算 Hadoop MapReduce 数据局部性推测执行 CloudSim

来源：评论

学校读者我要写书评

暂无评论

Hadoop YARN资源分配与调度的研究

Hadoop YARN资源分配与调度的研究

引用

作者：李媛祯南京航空航天大学

学位级别：硕士

Hadoop是一种分布式存储和并行计算框架,由于具有高可靠性、高扩展性和高容错性等特点,目前在云计算中得到广泛应用。资源分配与调度问题一直是并行计算领域关注的重要的问题。Hadoop资源管理系统YARN提供三种内置资源调度器,但随着应... 详细信息

Hadoop是一种分布式存储和并行计算框架,由于具有高可靠性、高扩展性和高容错性等特点,目前在云计算中得到广泛应用。资源分配与调度问题一直是并行计算领域关注的重要的问题。Hadoop资源管理系统YARN提供三种内置资源调度器,但随着应用的扩展,这些内置调度器并不能满足用户的需求,因此,研究如何合理地进行资源分配与调度,以此提高系统资源利用率,减少系统计算时间,从而提高系统性能并降低成本,具有重大意义。本文深入分析了Hadoop YARN的资源分配与调度机制,从作业调度和任务调度两个层次考虑,分别研究了Hadoop资源调度机制与推测执行机制,针对其中存在的资源分配不合理和预测任务完成时间不准确的问题,提出了解决办法。具体如下:1)研究如何合理分配资源,提出一种基于蚁群算法和粒子群优化算法的自适应调度算法。该方法通过Hadoop YARN心跳通信机制获取负载、内存、CPU速度等属性信息来初始化蚁群信息素矩阵,然后将粒子群算法的自我认知能力与社会认知能力引入到蚁群算法,同时根据蚁群算法全局最优解的波动趋势动态调整信息素挥发系数。论文设计了资源分配和调度算法,并修改Hadoop代码实现了一个资源调度器以验证本文所提算法的有效性。实验结果表明,采用本文方法,能有效地调度Hadoop集群资源,缩短集群的作业执行时间。2)研究如何准确预测任务完成时间,提出基于C4.5决策树算法的推测执行机制。论文首先分析了准确预测掉队任务和后备任务执行时间的重要性,然后阐述了Hadoop传统调度算法中推测执行机制中存在的不足。在此基础上,提出了基于C4.5决策树算法的推测执行机制,并设计相应的推测执行算法预测任务执行时间,以比较“掉队者”与备份任务的完成时间,并据此判断是否有必要启动备份任务,达到避免启动不必要的备份任务、缩短作业执行时间的目的。论文最后进行了实验,通过修改Hadoop中推测执行机制的源代码来实现本文提出的改进算法,并对比分析了改进算法在作业执行时间和执行稳定性。实验结果表明,本章算法明显优于原推测执行算法。

关键词：蚁群算法资源调度推测执行 Hadoop

来源：评论

学校读者我要写书评

暂无评论

Hadoop云平台调度算法研究

Hadoop云平台调度算法研究

引用

作者：张美清西安电子科技大学

学位级别：硕士

Hadoop集群虽然已经存在多年,但是依然是当前集群加速计算中的主要工具,并在各大互联网公司得到广泛应用。由于调度算法在集群中起到了关键作用,而Hadoop中的调度算法还是有有待改进的地方,故对Hadoop的研究依然很有意义。同时,云计算... 详细信息

Hadoop集群虽然已经存在多年,但是依然是当前集群加速计算中的主要工具,并在各大互联网公司得到广泛应用。由于调度算法在集群中起到了关键作用,而Hadoop中的调度算法还是有有待改进的地方,故对Hadoop的研究依然很有意义。同时,云计算技术使得用户能够快速获得任意大小的集群,来执行一个给定的工作负载,然后用户为使用资源的时长付费,所以如何优化Hadoop云平台的租用费用也很有研究意义。此外,随着云平台规模的不断扩大,并且普通节点大量用于云平台的资源中,因而节点的容错研究也变得越来越关键,如何提高Hadoop云平台的容错性是一个值得研究的课题。为了利用有限的资源最大地减少作业的完成时间,本文在研究Hadoop推测执行机制的基础上,为此提出了一个基于平衡的推测执行算法(Balance-SE)。算法在进行推测执行时,先对每个作业进行筛选,让只有满足条件的作业进行推测执行机制,从而使得推测执行机制的进行能够真正使得作业的总完成时间得到减少,避免了许多不必要的备份任务的执行。同时,由于云平台具有按使用付费的特性,为了最小化用户租用云平台资源的开销,我们为每个不同的MapReduce应用选择一个最佳的Hadoop配置平台,这里的配置信息包括虚拟机(Virtual Machine,VM)的类型、个数,以及作业的调度。即给定一系列MapReduce作业和一个作业截止完成时间,为这些作业决策一个同构或者异构的最优Hadoop集群配置,使得用户的租用费用最小。由于Hadoop云平台容错的重要性,以及不同类型的VM具有不同的计算能力,从而使得不同类型的VM发生故障将引起不同的开销,显然,发生故障的VM计算能力越大,导致的开销也越大。因此,本文在此基础上设计了一个基于自适应和检查点的容错算法。首先每个VM根据其完成作业的情况,自适应地更新自身的可靠性,如果VM正确地完成一个作业,则相应的可靠性增加,若运行一个作业失败,则VM可靠性降低。接着,对于可靠性低于一定阈值的VM进行检查点设置,而针对不同类型的VM,本文分别进行考虑,为不同类型的虚拟机节点设置不同的检查点,从而平衡地提高系统的总体容错性。为了检测本文设计的算法的有效性,本文对以上两个算法分别进行了实验,最终的实验表明,相较于Hadoop原有的推测执行算法和LATE算法,本文提出的Balance-SE算法很好地减少了作业的完成时间。另一方面,本文在决策最优平台算法的基础上设计的基于自适应和检查点的容错算法使得在有故障的情况下,节点容错性得到提高,表现为作业的完成时间减少了。

关键词： Hadoop集群调度算法推测执行云计算容错

来源：评论

学校读者我要写书评

暂无评论

MapReduce计算模型性能优化的研究

MapReduce计算模型性能优化的研究

引用

作者：王刚山东建筑大学

学位级别：硕士

伴随着互联网、物联网和移动互联网的快速发展,每天会产生海量数据,数据处于爆炸式的增长状态,这预示着大数据时代的到来。大数据时代的数据具有数量大、结构复杂的特点,导致数据存储和计算难度的加大。Google提出的MapReduce分布式计... 详细信息

伴随着互联网、物联网和移动互联网的快速发展,每天会产生海量数据,数据处于爆炸式的增长状态,这预示着大数据时代的到来。大数据时代的数据具有数量大、结构复杂的特点,导致数据存储和计算难度的加大。Google提出的MapReduce分布式计算模型简化了海量数据计算的问题,成为研究的热点。所以本文对MapReduce技术的研究和性能的优化具有实际意义。MapReduce是一种分布式计算模型,它简化了程序员编写分布式程序的步骤,因此被广泛应用于大数据领域。Hadoop是MapReduce的开源实现,具备海量数据处理的能力。然而,它的一些处理机制影响了性能的发挥。比如：当数据出现倾斜时,原有的划分方法不能保证节点的负载均衡,集群性能会受影响。因此,需要优化现有的处理机制。本文研究的主要内容是：首先对Hadoop平台进行简单介绍,重点研究MapReduce计算模型,对其组成模块和运行机制进行深入的分析。在分析MapReduce源码的基础上,发现了当数据存在倾斜时节点会出现负载不均的问题和在异构环境下推测执行机制效率低的问题。针对数据存在倾斜负载不均的问题,本文提出了一种抽样的方法,利用抽样获取Map端中间结果的分布信息,在抽样的基础上结合数据局部性产生划分函数,可以使节点负载趋于均衡。针对原有的推测执行机制效率低的问题,本文提出了一种改进的LATE算法,在LATE算法的基础上,利用节点历史信息和数据局部性特点选择快节点备份执行,可以更准确的发现慢任务,提高集群的吞吐率。最后,本文搭建了实验平台对抽样划分方法和改进型的LATE算法进行实验验证。根据实验结果,本文提出的改进算法可以有效提高MapReduce的性能。

关键词：大数据 MapReduce 抽样推测执行负载平衡

来源：评论

学校读者我要写书评

暂无评论

MapReduce容错机制的改进研究

MapReduce容错机制的改进研究

引用

作者：吴慧城湖南大学

学位级别：硕士

随着网络信息技术的不断发展,互联网已经渗透到各行各业,而且互联网用户数目也不断地在增长,这导致了互联网数据的爆发式增长,也为分布式计算提供了新的机遇。MapReduce是Google提出用于处理海量数据的分布式并行计算编程模型,它具有自... 详细信息

随着网络信息技术的不断发展,互联网已经渗透到各行各业,而且互联网用户数目也不断地在增长,这导致了互联网数据的爆发式增长,也为分布式计算提供了新的机遇。MapReduce是Google提出用于处理海量数据的分布式并行计算编程模型,它具有自动并行处理作业,可靠性高及编程简单等特点。Hadoop是基于MapReduce的开源分布式并行计算基础平台,由于定制和使用简单而被众多企业和科研单位用于海量数据的处理和研究。在Hadoop中分别采用HDFS(Hadoop Distributed File System)和MapReduce来存储和处理海量数据。在MapReduce框架中把硬件故障当作常态,因此容错机制是存储和计算健壮性和高效性的保障。推测执行是计算容错的重要手段,它通过找出执行异常慢的任务并将其备份任务放于另一个节点执行,以达到降低任务执行时间及节省集群资源的目的。现有的推测执行策略主要包括基于启发式的LATE(Longest Approximate Time to End)和基于集群成本效益的MCP(Maximum Cost Performance)。这两种策略的实现原理不相同,LATE比MCP实现起来更简单,但效果不如MCP。通过对LATE策略中存在的问题进行总结和分析,针对LATE策略中进行任务剩余时间评估没有考虑系统负载的影响而导致评估结果不准确的不足,提出了系统负载感知的启发式推测执行策略ERUL(Estimate Remain time Using Liner relationship)。ERUL扩展计算密集型任务执行时间同系统负载基本呈线性关系的结论用于任务剩余执行时间的评估,提高了评估的准确度。同时,ERUL还解决了LATE中不能处理Map任务输入倾斜,不能及时发现掉队任务及节点性能评价存在缺陷等问题。实验表明ERUL在任务剩余执行时间评估方面比LATE更精确,同时对集群性能的改善也比LATE更好。对MCP策略执行流程和存在的问题进行深入分析,提出了一种异构环境下的MapReduce推测执行改进策略exMCP(extensional MCP)。MCP模型在对集群资源价值进行计算时没有考虑异构环境下不同节点的Slot拥有不同的价值,因而会导致模型使用时产生差错。同时,MCP中没有对Map任务按照是否满足数据本地化进行分类,这可能导致不满足数据本地化的任务被全部认定为掉队任务等错误。在exMCP中通过考虑Slot价值来计算集群资源价值,同时对Map任务分类独立进行推测执行,另外还对选择备份任务执行节点存在的问题进行了改善。实验结果表明exMCP的推测执行成功率和对集群性能的改善都比MCP更好。

关键词： MapReduce容错推测执行 Hadoop MapReduce Hadoop调度

来源：评论

学校读者我要写书评

暂无评论

问诊“芯脏病” 多家厂商芯片被曝存严重漏洞

引用

中国教育网络 2018年第Z1期 5-6页

新年伊始,英特尔芯片被曝存在严重漏洞,称1995年之后的系统都会受到影响。两天之后,英特尔官方发布关于此次安全事件的声明。值得注意的是,这份声明与此前的新闻报道至少存在两处不一致,即安全漏洞的影响范围和影响程度。事件已经过去... 详细信息

新年伊始,英特尔芯片被曝存在严重漏洞,称1995年之后的系统都会受到影响。两天之后,英特尔官方发布关于此次安全事件的声明。值得注意的是,这份声明与此前的新闻报道至少存在两处不一致,即安全漏洞的影响范围和影响程度。事件已经过去一段时间,我们综合整理外媒关于此次事件的报道,希望能够诊治出"芯脏病"的病因,传染范围以及预防措施。

关键词：处理器安全漏洞英特尔推测执行

来源：评论

学校读者我要写书评

暂无评论

处理器存储相关性预测技术研究

引用

高性能计算技术 2013年第4期 25-29页

作者：路冬冬杨剑新王飙颜世云班冬松国家高性能集成电路(上海)设计中心上海201204

为了最大程度地开发程序的指令级并行性,现代处理器普遍使用了乱序执行、顺序提交的技术.存在存储真相关的指令乱序执行会产生存储相关性冲突,随着指令窗口的扩大,存储相关性冲突的机率和冲突带来的开销也随之增大,相关性预测逐渐成为... 详细信息

为了最大程度地开发程序的指令级并行性,现代处理器普遍使用了乱序执行、顺序提交的技术.存在存储真相关的指令乱序执行会产生存储相关性冲突,随着指令窗口的扩大,存储相关性冲突的机率和冲突带来的开销也随之增大,相关性预测逐渐成为超标量RISC处理器必不可少的一部分.本文从相关性预测的基本原理和研究现状出发,详细分析了几个典型的相关性预测器,对相关性预测的研究热点和挑战进行了探讨和展望.

关键词：指令级并行存储相关性预测推测执行

来源：评论

学校读者我要写书评

暂无评论

时讯浏览

引用

保密科学技术 2018年第7期 62-64页

要闻四部门发文推进安全产业发展,利好网络安全等产业工信部联合应急管理部、财政部、科技部印发《关于加快安全产业发展的指导意见》,旨在落实安全发展理念,提升全社会安全保障能力和安全水平,推动经济高质量发展,培育新经济增长点,提... 详细信息

要闻四部门发文推进安全产业发展,利好网络安全等产业工信部联合应急管理部、财政部、科技部印发《关于加快安全产业发展的指导意见》,旨在落实安全发展理念,提升全社会安全保障能力和安全水平,推动经济高质量发展,培育新经济增长点,提出到2020年,安全产业体系基本建立.

关键词：网络安全产业地图北斗二号量子比特推测执行攻击者恶意文件互联网大会 FPU 纠缠态 www 量子信息技术人工智能运营商

来源：评论

学校读者我要写书评

暂无评论

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案：

请选择收藏分类：

通借通还

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案： 新增检索档案 确定 取消

请选择收藏分类： 新增自定义分类 确定 取消

通借通还

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

请选择保存的检索档案：

请选择收藏分类：