检索结果-内蒙古大学图书馆

南京师大学报(自然科学版) 2025年第2期48卷 124-138页

作者：何菲菲韩萌张瑞华李春鹏孟凡兴北方民族大学计算机科学与工程学院宁夏银川750021

启发式高效用项集挖掘是近年数据挖掘领域的一个热点研究课题.为了解决启发式高效用项集挖掘算法过早收敛导致的项集丢失问题,设计了一种新的启发式高效用项集挖掘算法,旨在较少的迭代次数内获取更多的高效用项集.其中,提出的基于母象... 详细信息

启发式高效用项集挖掘是近年数据挖掘领域的一个热点研究课题.为了解决启发式高效用项集挖掘算法过早收敛导致的项集丢失问题,设计了一种新的启发式高效用项集挖掘算法,旨在较少的迭代次数内获取更多的高效用项集.其中,提出的基于母象因子的位差进化策略,有效缩减了搜索空间,提高了算法的执行效率.为了防止算法收敛过快陷入局部最优,提出两阶段种群多样性维护策略,保持了种群多样性和收敛性间的平衡.在真实数据集上进行的大量实验表明,提出的算法在高效用项集数量、时空效率和算法收敛性方面均优于现有的先进算法.

关键词：高效用项集挖掘启发式算法象群优化进化策略多样性维护策略

来源：评论

学校读者我要写书评

暂无评论

高效用项集挖掘算法的改进及其应用研究

高效用项集挖掘算法的改进及其应用研究

引用

作者：谢观燕北方工业大学

学位级别：硕士

高效用项集挖掘是数据挖掘领域中研究热点之一,它旨在发现事务数据库中具有高度重要性的模式。近年来,学者们提出了大量相关方面的算法,并取得了一定的研究成果。然而,目前大多数高效用项集挖掘算法仅仅关注项集的效用值,导致挖掘出的... 详细信息

高效用项集挖掘是数据挖掘领域中研究热点之一,它旨在发现事务数据库中具有高度重要性的模式。近年来,学者们提出了大量相关方面的算法,并取得了一定的研究成果。然而,目前大多数高效用项集挖掘算法仅仅关注项集的效用值,导致挖掘出的项集大多数是弱相关的,在实际生活中没有意义。首先,本文针对上述问题提出了ULB-CHMiner算法来发现相关性更强的高效用项集。该算法在ULB-Miner算法的基础上引入了全置信度约束,并提出了相关效用的新概念。为了提高算法的挖掘效率,改进了效用列表缓冲区结构,并基于提出的相关效用上界和估计相关效用共生结构进行剪枝。在不同数据集上进行的大量实验表明,ULB-CHMiner算法可以修剪大量弱相关项集,并且在时间性能、内存消耗和可扩展性方面相比于选取的对比算法整体上表现更好。然后,针对ULB-CHMiner算法中阈值难以设定的问题,本文提出了ULBTKCH算法。该算法旨在挖掘相关效用值最大的k个项集,用户只需设定k值即可。为了有效提升算法的效率,它使用了提前设定阈值策略、阈值提升策略、基于相关效用上界的剪枝策略等五种策略。此外,该算法选用改进的效用列表缓冲区结构来有效存储和检索效用信息。最后在多个数据集上对算法的性能进行评估,结果表明ULB-TKCH算法比TKO算法的挖掘速度更快且内存消耗更少,并且具备较好的可扩展性。最后,本文设计并实现了相关高效用MOOC模式可视化平台。先对MOOC数据进行预处理得到两种不同的事务数据库,然后分别对课程模式和课程种类模式进行挖掘。之后,搭建可视化平台来直观地展现挖掘结果,以更好地分析用户的选课行为。

关键词：高效用项集挖掘相关性效用列表缓冲区 Top-k算法

来源：评论

学校读者我要写书评

暂无评论

高效用项集挖掘算法研究

高效用项集挖掘算法研究

引用

作者：李星桂林电子科技大学

学位级别：硕士

高效用项集挖掘是数据挖掘领域中分析客户行为的高效工具,为决策者提供了可靠的决策依据。然而,先前大多数高效用项集挖掘算法应用场景相对统一,无法满足有特定需求的挖掘任务。在商场购物数据集挖掘中,传统高效用项集挖掘只能发现最低... 详细信息

高效用项集挖掘是数据挖掘领域中分析客户行为的高效工具,为决策者提供了可靠的决策依据。然而,先前大多数高效用项集挖掘算法应用场景相对统一,无法满足有特定需求的挖掘任务。在商场购物数据集挖掘中,传统高效用项集挖掘只能发现最低抽象级别的项集,忽略现实情况中项集之间的类别关系,使得挖掘出的高效用项集不够完整。在学生课程成绩数据集挖掘中,传统高效用项集挖掘只能挖掘出具有高成绩的课程,忽略完成课程需要花费的成本,挖掘出的结果在作为决策依据时不够准确。此外,虽然高效用项集挖掘算法可以发现效用高的项集,但算法中最小效用阈值的设置是不直观的,并且影响发现项集的数量和算法的性能。针对以上问题,本文从以下方面开展进一步的研究:(1)针对传统高效用项集挖掘算法不考虑数据项类别的问题,本文提出了基于数据索引结构的跨级高效用项集挖掘算法DISCH。DISCH算法在效用链表基础上添加索引链表和分类结构创建数据索引结构DIS,将项集的位置信息、效用信息和指向子项的指针存储到DIS中。利用位置信息快速定位到目标项集,使用指针建立当前项和子项之间的连接,减少算法扫描分类结构的次数。此外,在挖掘过程中动态管理内存,及时清除内存中无用的效用链表。在项集构建过程中,使用修剪策略提前结束构建程序,减少连接操作。在真实数据集和合成数据集上进行实验,结果表明:DISCH算法比对比算法在运行时间上平均降低了57.6%,在内存消耗量上平均降低了53.3%。该算法能高效挖掘跨级高效用项集,并且能提升算法的整体性能。(2)针对阈值难以确定的问题,本文提出了基于数据索引结构的Top-k跨级高效用项集挖掘算法TKDISCH。TKDISCH算法利用阈值提升策略缩减搜索空间,并逐步提高最小效用阈值;使用DIS结构和修剪策略为算法保证时间和内存性能。在相同的条件下对比实验结果表明:虽然TKDISCH算法和DISCH算法在运行时间和内存使用量上差异很小,但TKDISCH算法更容易挖掘出用户要求数量的项集。在Liquor数据集中,DISCH算法找到Top-k项集对应的最优效用阈值的概率平均只有3.31%,而在Friuthut数据集中只有1.76%。(3)针对传统高效用项集挖掘算法不考虑数据项成本信息的问题,本文提出了基于成本效用索引结构的低成本高效用项集挖掘算法CUIM。CUIM算法使用成本效用索引结构CUIS管理项集,CUIS中包含索引链表和成本链表。利用索引链表快速查找项集,使用成本链表存储项集的成本和效用信息。此外,引入平均成本下界概念度量项集的成本。对该算法展开测试,结果表明:CUIM算法不仅可以挖掘出有意义的低成本高效用项集,而且比对比算法在运行时间上平均降低了66.1%。

关键词：高效用项集挖掘分类关系成本 Top-k算法

来源：评论

学校读者我要写书评

暂无评论

高效用项集挖掘算法研究

高效用项集挖掘算法研究

引用

作者：路昕宇桂林电子科技大学

学位级别：硕士

高效用项集挖掘(High Utility Itemsets Mining,HUIM)已成为数据挖掘领域研究工作的关键。高效用项集挖掘是为了解决频繁项集挖掘只考虑出现频次的问题,高效用项集挖掘同时考虑事务数据库中项目数量和单位利润。先前大部分HUIM算法只考... 详细信息

高效用项集挖掘(High Utility Itemsets Mining,HUIM)已成为数据挖掘领域研究工作的关键。高效用项集挖掘是为了解决频繁项集挖掘只考虑出现频次的问题,高效用项集挖掘同时考虑事务数据库中项目数量和单位利润。先前大部分HUIM算法只考虑项目存在正效用的情况,然而实际应用中会存在负效用项集。根据先前高效用项集挖掘算法相关修剪策略,低效用项集的子集必是低效用项集。但是事务中存在负效用项,低效用项集的子集可能是高效用项集,因此含负效用项的高效用项集可能会被忽略。不仅如此,现有HUIM算法执行方面,阈值需要用户设定。而在实际应用中阈值的设定直接影响输出结果集的数量,从而极大地影响算法运行效率。阈值过高使得无结果产生,用户不能得到高效用项集(HUIs);阈值过低导致算法运行时间无限增长并且占用大量内存,甚至导致内存溢出。设定合适的阈值是一个困难的问题。针对上述问题本文对高效用项集挖掘算法存在负效用项和阈值设定方面进行研究,研究工作主要如下:(1)针对数据集中包含负效用项的问题,提出含负效用项的高效用项集挖掘算法EHUIN(Efficient High Utility Itemsets Mining with Navigate utility)。算法在第一次扫描数据库时使用覆盖理论指导方法,在初始化链表时对事务加权效用值相等的项集进行覆盖操作。随后在含负效用的传递分支公式tenu(transitive extension with negative utility)帮助下,将链表中项集效用与其传递分支项集效用之和与用户设定最小效用阈值比较,若小于最小效用阈值则项集的传递分支项集均为低效用项集并舍弃。在构建效用链表时使用提前过滤策略,通过计算元组中效用值来判定该效用链表是否为低效用链表,从而降低运行时间,减少内存消耗,进一步提高挖掘效率。经过近60万条数据24组实验证明在数据集稠密程度不一致的情况下,EHUIN算法效率更高,尤其是在稠密数据集上表现更佳。(2)针对最小效用阈值设定的问题,高效用项集挖掘算法通过和Top-k算法结合,将设定阈值的问题转变成设定高效用项集数量的问题。目前Top-k高效用项集挖掘算法主要研究方向是改进数据结构和优化效用链表的构建过程,但忽略效用链表构建后的内存管理。随着数据量增大,挖掘高效用项集所需构建的效用链表增多却无法管理内存资源,之前的算法运行时占用系统大量内存空间和计算开销。针对这一问题,提出新的Top-k高效用项集挖掘算法TKBPH(Top-k Buffer Pool High Utility Mining)。TKBPH算法提出数据缓冲池(DBP)结构管理内存空间,高效存储与检索缓冲池内数据,并在挖掘过程中进行内存复用。在不同类型数据集实验结果证明,TKBPH算法在挖掘过程中执行速度更快,内存消耗更少。

关键词：高效用项集挖掘负效用项集数据缓冲池 Top-k算法

来源：评论

学校读者我要写书评

暂无评论

数据流上的约束跨层级高效用项集挖掘

引用

计算机工程与应用 2024年第13期60卷 287-300页

作者：刘淑娟韩萌高智慧穆栋梁李昂北方民族大学计算机科学与工程学院银川750021

传统的高效用项集挖掘算法无法发现不同抽象层级类别之间的关系。因此,有研究者提出了跨层级的高效用项集挖掘算法。针对当前跨层级的高效用项集挖掘算法仅能处理静态数据并且无法控制挖掘层级范围的问题,提出了一种动态类别列表结构DTU... 详细信息

传统的高效用项集挖掘算法无法发现不同抽象层级类别之间的关系。因此,有研究者提出了跨层级的高效用项集挖掘算法。针对当前跨层级的高效用项集挖掘算法仅能处理静态数据并且无法控制挖掘层级范围的问题,提出了一种动态类别列表结构DTUL存储并维护窗口内的项集效用和类别信息。基于此结构,首次提出了基于滑动窗口的约束跨层级高效用项集挖掘算法,包括自下而上挖掘的CCLHM_DTU算法和自上而下挖掘的CCLHM_UTD算法。在含有类别信息的数据集上进行了大量实验,实验结果表明提出的算法能够有效处理数据流并灵活约束项集的层级范围。

关键词：高效用项集挖掘跨层级高效用项集数据流滑动窗口效用列表

来源：评论

学校读者我要写书评

暂无评论

基于统计显著性检验的高效用项集挖掘算法

引用

计算机应用研究 2024年第10期41卷 2970-2977页

作者：吴军魏丹丹欧阳艾嘉王亚遵义师范学院信息工程学院贵州遵义563000

针对传统高效用项集挖掘算法在具有不同类型标签事务中报告假阳性高效用项集的问题,提出两个基于统计显著性检验的高效用项集挖掘算法——FHUI和PHUI算法。这两个算法首先找到所有待检验高效用项集并依据项集长度进行分组;然后,FHUI算... 详细信息

针对传统高效用项集挖掘算法在具有不同类型标签事务中报告假阳性高效用项集的问题,提出两个基于统计显著性检验的高效用项集挖掘算法——FHUI和PHUI算法。这两个算法首先找到所有待检验高效用项集并依据项集长度进行分组;然后,FHUI算法根据项集自身的频率分布生成零分布,PHUI算法根据事务内置换策略或事务间置换策略构造置换事务集合来生成零分布。最后,FHUI和PHUI算法从零分布中计算出p值并运用错误发现率剔除假阳性高效用项集。基准事务集合实验结果显示FHUI和PHUI算法能够剔除大量的假阳性高效用项集,在后续分类任务中取得了更高的正确率;仿真事务集合实验结果显示FHUI和PHUI算法报告的项集中假阳性高效用项集数量占比低于4.8%且平均效用高于39000。实验结果证明,在具有不同类型的标签事务中,FHUI和PHUI算法报告的统计显著高效用项集可靠性和实用性更强。

关键词：数据挖掘高效用项集挖掘统计显著性检验 Fisher检验置换检验

来源：评论

学校读者我要写书评

暂无评论

基于智能优化算法的高效用项集挖掘方法综述

引用

计算机应用 2023年第6期43卷 1676-1686页

作者：高智慧韩萌刘淑娟李昂穆栋梁北方民族大学计算机科学与工程学院银川750021

高效用项集挖掘(HUIM)能够挖掘事务数据库中具有重要意义的项集,从而帮助用户更好地进行决策。针对智能优化算法的应用能够显著提高海量数据中高效用项集的挖掘效率这一现状,对基于智能优化算法的HUIM方法进行了综述。首先,以智能优化... 详细信息

高效用项集挖掘(HUIM)能够挖掘事务数据库中具有重要意义的项集,从而帮助用户更好地进行决策。针对智能优化算法的应用能够显著提高海量数据中高效用项集的挖掘效率这一现状,对基于智能优化算法的HUIM方法进行了综述。首先,以智能优化算法的类别为角度,从基于群智能优化、基于进化以及基于其他智能优化算法的方法这3个方面对基于智能优化算法的HUIM方法进行了详细的分析与总结。同时,从粒子更新方式的角度对基于粒子群优化(PSO)的HUIM方法进行了详细梳理,包括基于传统更新策略、基于sigmoid函数、基于贪心、基于轮盘赌以及基于集合的方法。另外,从种群更新方法、对比算法、参数设置、优缺点等角度对比分析了基于群智能优化算法的HUIM方法。然后,从遗传和仿生两个方面对基于进化的HUIM方法进行总结概括。最后,针对目前基于智能优化算法的HUIM方法所存在的问题,提出了下一步的研究方向。

关键词：高效用项集挖掘智能优化算法粒子群优化算法进化算法启发式算法

来源：评论

学校读者我要写书评

暂无评论

基于长度约束的蝙蝠高效用项集挖掘算法

引用

计算机应用 2023年第5期43卷 1473-1480页

作者：袁泉唐成亮徐雲鹏重庆邮电大学通信与信息工程学院重庆400065 重庆邮电大学通信新技术应用研究中心重庆400065

为了挖掘满足用户特殊需求,如含指定项目数量的高效用项集(HUI),提出一种基于长度约束的蝙蝠高效用项集挖掘算法(HUIM-LC-BA)。该算法融合蝙蝠算法(BA)和长度约束构建高效用项集挖掘(HUIM)模型,首先将数据库转换为位图矩阵,实现高效的... 详细信息

为了挖掘满足用户特殊需求,如含指定项目数量的高效用项集(HUI),提出一种基于长度约束的蝙蝠高效用项集挖掘算法(HUIM-LC-BA)。该算法融合蝙蝠算法(BA)和长度约束构建高效用项集挖掘(HUIM)模型,首先将数据库转换为位图矩阵,实现高效的效用计算和数据库扫描;其次,采用重新定义的事务加权效用(RTWU)策略缩减搜索空间;最后,对项集进行长度修剪,使用深度优先搜索和轮盘赌注选择法确定修剪项目。在4个数据集的仿真实验中,当最大长度为6时,与HUIM-BA相比,HUIM-LC-BA挖掘的模式数量分别减少了91%、98%、99%与97%,同时运行时间也少于HUIM-BA;且在不同长度约束条件下,与FHM+(Faster High-utility itemset Ming plus)算法相比运行时间更稳定。实验结果表明,HUIM-LC-BA能有效挖掘具有长度约束的HUI,并减少挖掘模式的数量。

关键词：高效用项集挖掘蝙蝠算法长度约束位图矩阵轮盘赌注选择法

来源：评论

学校读者我要写书评

暂无评论

基于快速高效用项集挖掘的大规模消息流预测算法研究与应用

引用

计算机应用与软件 2019年第11期36卷 243-249页

作者：穆晓芳邓红霞郭虎升赵鹏太原师范学院计算机系山西太原030619 太原理工大学信息与计算机学院山西太原030024 山西大学计算机与信息技术学院山西太原030006

为了提高大规模消息流话题预测的准确性与效率,提出基于高效用项集挖掘的消息流话题预测算法.计算时间窗口中词汇的内部效用与外部效用,根据会话内所有词汇的效用计算最小效用值;采用高效用项集挖掘算法产生候选话题模式集,随之提取最... 详细信息

为了提高大规模消息流话题预测的准确性与效率,提出基于高效用项集挖掘的消息流话题预测算法.计算时间窗口中词汇的内部效用与外部效用,根据会话内所有词汇的效用计算最小效用值;采用高效用项集挖掘算法产生候选话题模式集,随之提取最终的话题模式.为了提高高效用项集挖掘的时间效率与存储效率,设计三角项集效用树保存项集的效用信息,设计话题搜索树保存候选话题模式集.最终基于真实消息流数据集进行实验,结果显示该算法有效地提高了话题预测的准确率,并且实现了较快的响应时间.

关键词：高效用项集挖掘频繁项集挖掘数据流话题预测大数据网络安全

来源：评论

学校读者我要写书评

暂无评论

基于数据索引结构的跨级高效用项集挖掘算法

引用

计算机应用 2023年第7期43卷 2200-2208页

作者：蒋华李星王慧娇韦静海广西可信软件重点实验室(桂林电子科技大学) 广西桂林541004

针对现有的跨级高效用项集挖掘(HUIM)算法非常耗时且占用大量内存的问题,提出一种基于数据索引结构的跨级高效用项集挖掘算法(DISCH)。首先,为了高效存储和快速检索到搜索空间中的所有项集,拓展带有分类信息和索引信息的效用链表为数据... 详细信息

针对现有的跨级高效用项集挖掘(HUIM)算法非常耗时且占用大量内存的问题,提出一种基于数据索引结构的跨级高效用项集挖掘算法(DISCH)。首先,为了高效存储和快速检索到搜索空间中的所有项集,拓展带有分类信息和索引信息的效用链表为数据索引结构(DIS);然后,为了提高内存利用率,对不满足条件的效用链表所占的内存进行回收再分配;最后,在构建效用链表时使用提前结束策略,以减少效用链表的产生。基于真实零售数据集和合成数据集进行的实验结果表明,与CLH-Miner(Cross-Level High utility itemsets Miner)算法相比,DISCH在运行时间上平均降低了77.6%,同时在内存消耗上平均降低了73.3%,可见该算法能高效完成跨级高效用项集的搜索,并且降低算法的内存消耗。

关键词：数据挖掘高效用项集挖掘分类关系索引链表重用内存

来源：评论

学校读者我要写书评

暂无评论

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案：

请选择收藏分类：

通借通还

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案： 新增检索档案 确定 取消

请选择收藏分类： 新增自定义分类 确定 取消

通借通还

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

请选择保存的检索档案：

请选择收藏分类：