咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >搭建基于云计算的开源海量数据挖掘平台 收藏

搭建基于云计算的开源海量数据挖掘平台

Building the Open Source Mass Data Mining Platform Based on Cloud Computing

作     者:赵华茗 

作者机构:中国科学院国家科学图书馆北京100190 

出 版 物:《现代图书情报技术》 (New Technology of Library and Information Service)

年 卷 期:2010年第10期

页      面:76-81页

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 

基  金:'第二十四届全国计算机信息管理学术研讨会'论文 

主  题:云计算 海量数据挖掘 虚拟技术 分布式计算 Xen Cloudera HadooD 

摘      要:通过分析亚马逊弹性MapReduce(EMR)平台构架,针对信息情报机构内部数据处理的迫切需求,提出通过开源技术Xen和Hadoop平台构建基于云计算的动态可伸缩的海量数据处理平台并给出实施方案、海量文本数据处理案例和开源EMR平台的优势分析。实施方案主要分为三部分:搭建动态虚拟的云计算环境、安装制作Hadoop虚拟服务器模板、配置运行Cloudera和Cloudera Desktop。通过开源EMR架构的应用,可以有效解决服务器蔓延问题,提高网络计算资源的利用效率和分布式数据挖掘服务的快速布署能力及灵活性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分