版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:安徽工程科技学院应用数理系安徽芜湖241000 南京经济学院计算机系江苏南京210003
出 版 物:《安徽工程科技学院学报(自然科学版)》 (Journal of Anhui University of Technology and Science)
年 卷 期:2002年第17卷第3期
页 面:8-13页
学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:安徽省教育厅自然科学基金资助项目(2001kj050)
主 题:频繁项目集 FP-growth算法 改进算法 频繁模式树 快速挖掘算法 数据库 Apriori算法 选项 实验结果 知识
摘 要:频繁项目集挖掘是多种数据挖掘应用研究的一个重要方面,频繁项目集的快速挖掘算法研究是当前研究的热点.传统Apriori及其改进算法.要多遍扫描数据库并产生大量的候选项目集.针对Apriori算法的缺陷,HanJW(韩家炜)提出FP-growth算法,该算法仅须扫描数据库两遍且无须生成候选项目集,避免了产生“知识的组合爆炸,提高了频繁项目集的挖掘效率.但FP-growth算法是通过逐步生成条件模式基和条件频繁模式树来挖掘频繁项目集.因而影响了频繁项目集的挖掘效率.为此,在引入F-矩阵概念之后,提出了FP-growth的一种改进算法—IFP-growth,并对改进算法的性能进行了测试.实验结果表明,IFP-growth算法优于FP-growth.