文献详情 >Spark DAG优化MapReduce协同过滤算法收藏

Spark DAG优化MapReduce协同过滤算法

Optimization of collaborative filtering algorithm based on DAG Spark scheduling

作者：廖彬张陶于炯国冰磊张旭光刘炎 LIAO Bin;ZHANG Tao;YU Jiong;GUO Binglei;ZHANG Xuguang;LIU Yan

作者机构：新疆财经大学统计与信息学院新疆乌鲁木齐830012 新疆大学信息科学与工程学院新疆乌鲁木齐830008 新疆医科大学医学工程技术学院新疆乌鲁木齐830011 清华大学软件学院北京100084

出版物：《中山大学学报（自然科学版）》 (Acta Scientiarum Naturalium Universitatis Sunyatseni)

年卷期：2017年第56卷第3期

页面：46-56页

核心收录：

学科分类：08[工学] 080402[工学-测试计量技术及仪器] 0804[工学-仪器科学与技术]

基　　金：国家自然科学基金(61562078 61262088) 新疆维吾尔自治区自然科学基金(2016D01B014) 新疆财经大学博士启动基金(2015BS007)

主　　题：协同过滤 MapReduce Spark 算法优化能耗优化

摘要：大数据的规模效应给数据存储、管理以及数据分析带来了极大的挑战,高效率低成本的大数据处理技术成为学术界及工业界的研究热点。为提高协同过滤算法的执行效率,对MapReduce架构下的算法执行步骤进行了分解,并对算法执行缺陷进行了分析。结合Spark适于迭代型及交互型任务的特点,提出将算法从MapReduce平台移植Spark平台的改进思路。设计了算法在Spark中的实现流程,并通过参数调整、内存优化等方法进一步提高算法效率。实验结果表明:与MapReduce平台中的算法相比,基于Spark DAG调度的算法能够减少65%以上的HDFS重复I/O操作,执行效率与能耗效率分别提升近200%及50%。

本地馆藏 | 借阅须知 | 我要预约

已订购，未入库

sda

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

CADAL相关文献

Spark DAG优化MapReduce协同过滤算法

读者评论与其他读者分享你的观点

请选择收藏分类：

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

CADAL相关文献

Spark DAG优化MapReduce协同过滤算法

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：