版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:安阳工学院计算机科学与信息工程学院河南安阳455000 安阳工学院安阳市信息系统应用工程技术研究中心河南安阳455000 安阳工学院河南省高精密主轴工程实验室河南安阳455000 华中科技大学国家数控系统工程技术研究中心湖北武汉430000 安阳师范学院教育部甲骨文信息处理重点实验室河南安阳455000
出 版 物:《信阳师范学院学报(自然科学版)》 (Journal of Xinyang Normal University(Natural Science Edition))
年 卷 期:2020年第33卷第3期
页 面:448-453页
学科分类:08[工学] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金项目(61806007) 河南省科技计划项目(182102210197) 河南省高等学校重点科研项目(2020ZDJH002)
主 题:关联规则 Apriori算法 项约束 MapReduce 并行算法 Hadoop
摘 要:针对经典的Apriori算法依赖内存,只适用于小规模数据集,在面对海量数据集时显得无能为力以及该算法没有考虑用户的需求情况等问题,提出了基于MapReduce的Apriori前后项约束关联规则改进算法.该方法首先对经典Apriori算法挖掘过程进行了改进,加入了用户的前后项约束规则,使得在挖掘过程中剪枝的程度更大并且获取到更加精准的规则.然后利用云计算的MapReduce编程技术,对改进的Apriori算法的各个步骤并行化.实验结果表明,改进的算法在处理不同的数据集时有一定的优势,然后经过MapReduce模型并行化后,提高了对海量数据的处理能力和效率,并且具有良好的扩展性.