版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:宁波大红鹰学院信息工程学院浙江宁波315175 大连理工大学电子信息与电气工程学部计算机科学与技术学院辽宁大连116024
出 版 物:《计算机研究与发展》 (Journal of Computer Research and Development)
年 卷 期:2015年第52卷第2期
页 面:445-455页
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)]
基 金:国家自然科学基金项目(61370200) 宁波市自然科学基金项目(2013A610115 2014A610073) 浙江省教育厅一般科研项目(Y201432717)
主 题:高效用模式 频繁模式 频繁项集 数据挖掘 TOP—K
摘 要:目前TOP-K高效用模式挖掘算法需要产生候选项集,特别是当数据集比较大或者数据集中包含较多长事务项集时,算法的时间和空间效率会受到更大的影响.针对此问题,通过将事务项集和项集效用信息有效地保存到树结构HUP-Tree,给出一个不需要候选项集的挖掘算法TOPKHUP;HUPTree树能保证从中计算到每个模式的效用值,不需要再扫描数据集来计算模式的效用值,从而使挖掘算法的时空效率得到较大的提高.采用7个典型数据集对算法的性能进行测试,实验结果证明TOPKHUP的时间和空间效率都优于已有算法,并对K值的变化保持平稳.