版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
出 版 物:《电脑编程技巧与维护》 (Computer Programming Skills & Maintenance)
年 卷 期:2016年第2期
页 面:4-4页
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:数据框架 Apache 异同 计算机组成 分布式数据 基础设施 分析效率 数据处理
摘 要:大数据中Hadoop和Apache Spark这两个名字大家并不陌生。但往往对它们的理解只是提留在字面上,并没有对它们进行深入的思考。首先,Hadoop和Apache Spark两者都是大数据框架,但是各自存在的目的不尽相同。Hadoop实质上更多是一个分布式数据基础设施:它将巨大的数据集分派到一个由普通计算机组成的集群中的多个节点进行存储.意味着您不需要购买和维护昂贵的服务器硬件。同时,Hadoop还会索引和跟踪这些数据,让大数据处理和分析效率达到前所未有的高度。