检索结果-内蒙古大学图书馆

作者：叶凯杨帆杨晓飞蔺佳栋梁皓郭立 710049 陕西省西安市咸宁西路28号

一种基于模式增长算法的基因变异检测方法，在预处理后的测序比对数据中提取有变异特征信号的数据并进行聚类，将聚类后的每一类数据中所有的短读段序列依据比对状态拆分成状态分别为S和M的两段，将所有的S段的序列压缩建立一致性序列... 详细信息

标准号: CN111243663B

一种基于模式增长算法的基因变异检测方法，在预处理后的测序比对数据中提取有变异特征信号的数据并进行聚类，将聚类后的每一类数据中所有的短读段序列依据比对状态拆分成状态分别为S和M的两段，将所有的S段的序列压缩建立一致性序列，将所有的M段的序列压缩建立一致性序列；并对同一类中的数据信息进行计算，则形成超项目，根据每个超项目在基因组上的位置将每个超项目按顺序存入变异信号数据库中；使用模式增长算法，建立断点间的比对关系；建立变异模型，确定变异的类型。本发明直接将过滤后数据库中的所有断点为对象进行比对来获取相互比对关系，从而得到全局比对信息，实现更精准的变异检测效果，对较小或较大变异均有很好的检测效果。

关键词：比对一致性序列序列压缩断点聚类算法数据库预处理比对数据比对状态变异检测变异模型变异特征变异信号基因变异模式增长全局比对使用模式数据信息基因组检测测序两段过滤

来源：评论

学校读者我要写书评

暂无评论

一种基于频繁模式增长算法的网络攻击路径重构方法

一种基于频繁模式增长算法的网络攻击路径重构方法

引用

作者：王崑声白昊胡昌振 100048 北京市海淀区阜成路16号

本发明涉及一种基于频繁模式增长算法的攻击路径重构技术，属于网络信息安全技术领域，适用于入侵检测系统(IDS)和其它安全监控系统。本发明将IDS的告警事件与其他安全工具(如杀毒软件/扫描器等)的数据相关联，融合为补偿性入侵证据(com... 详细信息

标准号: CN101931570B

本发明涉及一种基于频繁模式增长算法的攻击路径重构技术，属于网络信息安全技术领域，适用于入侵检测系统(IDS)和其它安全监控系统。本发明将IDS的告警事件与其他安全工具(如杀毒软件/扫描器等)的数据相关联，融合为补偿性入侵证据(complementary intrusion evidence)，使每一步攻击都有相应的系统状态作为攻击效果的客观反映；然后在此数据基础上创建基于贝叶斯网络的攻击场景；再使用频繁模式增长算法从攻击场景中挖掘出频繁攻击序列，提高挖掘效率的同时显著减少了系统开销；最后将挖掘出的频繁攻击序列进行再关联以重构出攻击路径，能够清晰判断出可能的攻击意图。

关键词：攻击模式增长算法挖掘网络信息安全技术安全监控系统入侵检测系统贝叶斯网络场景关联安全工具客观反映路径重构数据基础系统开销系统状态扫描器杀毒重构入侵补偿融合证据软件

来源：评论

学校读者我要写书评

暂无评论

一种基于Spark的频繁项集快速挖掘算法

引用

软件学报 2023年第5期34卷 2446-2464页

作者：丁家满李海滨邓斌贾连印游进国昆明理工大学信息工程与自动化学院云南昆明650504 云南省人工智能重点实验室云南昆明650504

如何在海量数据集中提高频繁项集的挖掘效率是目前研究的热点.随着数据量的不断增长,使用传统算法产生频繁项集的计算代价依然很高.为此,提出一种基于Spark的频繁项集快速挖掘算法(fast mining algorithm of frequent itemset based on ... 详细信息

如何在海量数据集中提高频繁项集的挖掘效率是目前研究的热点.随着数据量的不断增长,使用传统算法产生频繁项集的计算代价依然很高.为此,提出一种基于Spark的频繁项集快速挖掘算法(fast mining algorithm of frequent itemset based on spark,Fmafibs),利用位运算速度快的特点,设计了一种新颖的模式增长策略.该算法首先采用位串表达项集,利用位运算来快速生成候选项集;其次,针对超长位串计算效率低的问题,考虑将事务垂直分组处理,将同一事务不同组之间的频繁项集通过连接获得候选项集,最后进行聚合筛选得到最终频繁项集.算法在Spark环境下,以频繁项集挖掘领域基准数据集进行实验验证.实验结果表明所提方法在保证挖掘结果准确的同时,有效地提高了挖掘效率.

关键词：频繁项集模式增长位串位运算垂直分组 Spark

来源：评论

学校读者我要写书评

暂无评论

基于滑动窗口挖掘数据流高效用项集的有效算法

引用

哈尔滨工程大学学报 2018年第4期39卷 721-729页

作者：郭世明高宏哈尔滨工业大学计算机学院黑龙江哈尔滨150001

现有的基于滑动窗口挖掘高效用项集的研究方法存在:候选项集通常数量巨大,需要大量的存储空间及计算候选项集的真实效用是非常耗时的问题。本文提出一种不生成候选项集的挖掘算法HUISW(high utility itemset mining over a siding windo... 详细信息

现有的基于滑动窗口挖掘高效用项集的研究方法存在:候选项集通常数量巨大,需要大量的存储空间及计算候选项集的真实效用是非常耗时的问题。本文提出一种不生成候选项集的挖掘算法HUISW(high utility itemset mining over a siding window),HUISW采用一种新的树结构HUIL-Tree(high utility itemset tee which arranges items according to lexicographic order)存储滑动窗口中的项集信息,采用效用数据库存储项集在窗口事务中的效用信息,在挖掘过程中HUISW采用模式增长的方法对由HUIL-Tree生成的项集通过其与效用数据库的对应关系,直接计算其在滑动窗口中的效用,整个过程避免了候选项集的生成。在实验中通过由稀疏和稠密数据集模拟的数据流对HUISW进行性能评估,并与同类算法SHU-Growth(siding window based high utility growth)进行比较,实验结果表明HUISW显著优于SHU-Growth,运行时间最快可提升两个数量级。

关键词：高效用项集模式增长数据流效用挖掘滑动窗口数据挖掘

来源：评论

学校读者我要写书评

暂无评论

基于频繁概念格的序列模式发现研究

引用

计算机科学 2004年第S2期31卷 168-171页

作者：孙莹胡学钢合肥工业大学计算机与信息学院合肥230009

1引言Rakesh Agrawal[1～3]等对超市数据进行分析时首先提出了序列模式(sequential patterns)发现这一KDD分支.经典的序列模式发现算法包括:***等人提出Aprioriall算法[1]和GSP算法[2,3];PSP[4]算法是GSP算法的改进;Han等人提出,称为基... 详细信息

1引言Rakesh Agrawal[1～3]等对超市数据进行分析时首先提出了序列模式(sequential patterns)发现这一KDD分支.经典的序列模式发现算法包括:***等人提出Aprioriall算法[1]和GSP算法[2,3];PSP[4]算法是GSP算法的改进;Han等人提出,称为基于序列模式增长(sequential patternsgrowth)方法,包括FreeSpan[12],PrefixSpan[13]算法,但都需要多次扫描数据库.

关键词：概念格序列模式发现研究 Sequential Patterns 发现算法模式增长超市数据数据库扫描经典方法

来源：评论

学校读者我要写书评

暂无评论

一种分布式序列模式挖掘算法

引用

计算机应用 2008年第11期28卷 2964-2966,2974页

作者：常鹏陈耿朱玉全江苏大学计算机科学与通信工程学院江苏镇江212013 南京审计学院省级审计信息工程重点实验室南京210029

针对分布式环境下的序列模式挖掘问题,提出了一种分布式序列模式挖掘(DSPM)算法。DSPM以PrefixSpan算法为基础,使用抽样检测技术平衡了任务负载,将挖掘任务分解后分配到多台计算机上以多进程、多线程并行执行。另外采用了伪投影技术来... 详细信息

针对分布式环境下的序列模式挖掘问题,提出了一种分布式序列模式挖掘(DSPM)算法。DSPM以PrefixSpan算法为基础,使用抽样检测技术平衡了任务负载,将挖掘任务分解后分配到多台计算机上以多进程、多线程并行执行。另外采用了伪投影技术来降低生成投影数据库的开销。实验结果表明,DSPM算法能够快速有效地挖掘分布式环境下的全局序列模式。

关键词：数据挖掘序列模式分布式模式增长

来源：评论

学校读者我要写书评

暂无评论

一种基于字典树的传感器节点关联规则的挖掘算法

引用

计算机工程与科学 2010年第4期32卷 119-121,124页

作者：梅淑英林亚平周四望许晖湖南大学软件学院湖南长沙410082 湖南大学计算机与通信学院湖南长沙410082

无线传感器网络中节点密集,分布范围广,长期监测使得信息量巨大,如何从大量的感知数据中提取或"挖掘"有用的知识,就成为无线传感器网络中信息处理的核心问题。本文提出一种新的关联规则挖掘算法PLT-STREAM,用来发现节点之间... 详细信息

无线传感器网络中节点密集,分布范围广,长期监测使得信息量巨大,如何从大量的感知数据中提取或"挖掘"有用的知识,就成为无线传感器网络中信息处理的核心问题。本文提出一种新的关联规则挖掘算法PLT-STREAM,用来发现节点之间的有用关联,以此消除节点之间信息的冗余。该算法能帮助用户对数据进行有效的融合、分类、查询、分析、理解和决策。实验结果表明,该方法能够有效减少信息处理中通信和计算所消耗的能量,缩短数据查询响应的时间,从而延长整个网络的寿命。

关键词：频繁模式模式增长字典树关联规则传感器节点

来源：评论

学校读者我要写书评

暂无评论

高效用项集挖掘算法的关键技术研究

高效用项集挖掘算法的关键技术研究

引用

作者：郭世明哈尔滨工业大学

学位级别：博士

随着互联网、物联网、云计算等信息技术的迅猛发展,信息技术与政治、经济、军事、科研、生活等领域的传统应用不断融合,催生了超越以往任何年代的海量数据。同时,遍布世界各地的智能移动设备、传感器、电子商务网站、社交网络每时每刻... 详细信息

随着互联网、物联网、云计算等信息技术的迅猛发展,信息技术与政治、经济、军事、科研、生活等领域的传统应用不断融合,催生了超越以往任何年代的海量数据。同时,遍布世界各地的智能移动设备、传感器、电子商务网站、社交网络每时每刻都在生成类型各异的数据。面对大量的数据,如何及时、有效地进行数据分析,从中提取与人们生活习惯密切相关的潜在模式,是信息时代政府、企业急需关注的问题。例如证监会通过对某只股票的买方、卖方成交价格及数量的分析,判断该只股票是否存在内幕交易及庄家控盘;支付宝网络技术公司通过分析支付宝用户在网络平台的消费记录,获得不同群体的消费习惯,并制定相应的营销策略;交通部门通过分析不同时段路网的车流信息,制定限行限停政策,缓解城市交通拥堵现象。数据挖掘是指在数据库中寻找重要的、未知的、潜在有用模式的过程,高效用项集挖掘是数据挖掘的中心任务之一。本文研究了高效用项集挖掘领域的七个问题,创新性研究成果如下:1)提出了静态数据库上的高效用项集挖掘和top-k高效用项集挖掘算法。静态数据库上的高效用项集挖掘和top-k高效用项集挖掘面临的主要挑战为在项集效用的计算过程中产生候选项集数量巨大的问题,这不仅消耗了大量的内存空间,而且校验候选项集耗时巨大。因此,本文提出了一个基于树结构的高效用项集挖掘算法HUITWU和一个top-k高效用项集挖掘算法TKHM。HUITWU采用树结构HUITWU-Tree存储数据库中的项集信息,采用“效用数据库”存储项集在事务中的效用,在挖掘中对由树结构生成的项集通过项集与效用数据库的对应关系,直接计算项集在数据库中的效用,避免了候选项集的产生。TKHM同样采用HUITWU中的数据结构,在其构建过程中采用两个阈值提升策略提升初始值为0的最小效用阈值,在挖掘过程中直接计算项集在数据库中的效用,动态地提升最小效用阈值,避免了top-k高效用候选项集的产生。通过实证研究,与同类算法相比,HUITWU和TKHM的时空效率提升明显。2)提出了静态数据库上的闭合高效用项集挖掘算法。静态数据库上的闭合高效用项集挖掘面临的主要挑战为在闭合高效用项集的计算过程中,产生的候选项集数量巨大,本文提出一个不产生候选项集的算法Clo HUI,Clo HUI采用新的树结构HUITWU-Tree+存储数据库中项集及其在数据库中的频数,使用效用数据库存储项集在事务中的效用信息,在挖掘中本文提出了一个有效的策略校验闭合频繁项集,然后对闭合频繁项集计算其在数据库中的效用,判断其是否为闭合高效用项集,整个过程避免了候选项集的产生。通过实证研究,与同类算法相比,Clo HUI的时间效率提升明显。3)提出了高效用项集增量挖掘算法和交互挖掘算法。高效用项集增量挖掘和交互挖掘面临的主要挑战为在挖掘高效用项集的过程中产生的候选项集数量巨大,本文提出了一个高效用项集增量挖掘算法IHUI-Miner和一个高效用项集交互挖掘算法FIHM。在IHUI-Miner中本文提出一个新的树结构IHUIL-Tree存储原始数据库或更新数据库中的项集,在挖掘过程中直接计算项集在数据库中的效用,避免了候选项集的产生。FIHM构建了一棵包含数据库中所有项的HUITWU-Tree,在挖掘过程中无需生成候选项集。通过实证研究,与同类算法相比,IHUI-Miner和FIHM的时间效率提升明显。4)提出了基于滑动窗口的数据流高效用项集挖掘算法和top-k高效用项集挖掘算法。基于滑动窗口的数据流高效用项集挖掘和top-k高效用项集挖掘面临的主要挑战为在挖掘过程中产生的候选项集数量巨大,本文提出一个基于滑动窗口的数据流高效用项集挖掘算法HUISW和一个基于滑动窗口的数据流top-k高效用项集挖掘算法TK-HIS,HUISW采用新的树结构HUITWU-Tree+存储滑动窗口中的项集,在挖掘过程中直接计算项集在滑动窗口中的效用,避免了候选项集的产生。TK-HIS采用HUISW中的数据结构,使用提出的两个阈值提升策略提升初始值为0的最小效用阈值,在挖掘过程中直接计算项集在滑动窗口中的效用,动态地提升最小效用阈值,避免了top-k高效用候选项集的产生。通过实证研究,与同类算法相比,HUISW和TK-HIS的时空效率提升明显。

关键词：高效用项集效用挖掘增量挖掘交互挖掘闭合高效用项集模式增长滑动窗口

来源：评论

学校读者我要写书评

暂无评论

结构数据挖掘与处理的若干问题的研究

结构数据挖掘与处理的若干问题的研究

引用

作者：王晨复旦大学

学位级别：博士

目前,数据挖掘及其应用已经渗透到多个学科,并在人工智能与机器学习、数据库、模式识别、生物信息学、神经计算等领域取得了丰硕的成果。同时,数据挖掘也不仅是科学家的兴趣所在,更多地得到了政府、工业界的密切关注。通过引进数据挖掘... 详细信息

目前,数据挖掘及其应用已经渗透到多个学科,并在人工智能与机器学习、数据库、模式识别、生物信息学、神经计算等领域取得了丰硕的成果。同时,数据挖掘也不仅是科学家的兴趣所在,更多地得到了政府、工业界的密切关注。通过引进数据挖掘的能力,可以大大提高生产力,取得社会的更大进步。世界上许多国家和地区的政府及工业界都希望掌握数据挖掘技术,提升国家和企业的科技含量,并最终取得领先的地位。随着研究的深入,越来越多的问题呈现在我们面前,也提出了更高的要求。当前,复杂类型数据的挖掘需求上升,专家学者开始关注这方面的新应用和理论研究,并试图利用无结构化数据挖掘方面的经验和方法论来帮助解决新问题。而针对结构数据的挖掘与处理就是本文所致力研究的问题。本文针对结构数据挖掘与处理目前存在的几个关键问题进行了研究,包括提高半结构化数据挖掘的速度与效率、提高图结构数据挖掘的可量测性和处理速度、约束条件下的图结构数据挖掘的方法、图结构数据索引技术。本文的创造性研究成果主要有: (1) 提出了4个频繁子树挖掘算法,分别是Chopper、XSpanner、ESMiner、ISMiner。分别采取了序列增长技术和最右路径增长技术,挖掘嵌入式子树和导出式子树模式。实验结果表明这些算法的运行效率良好,在性能上优于目前已提出的子树挖掘算法。 (2) 提出了一个新颖的子图索引结构ADI,并将其应用于频繁子图挖掘过程中,形成了图挖掘算法ADI-Mine和图挖掘应用系统GraphMiner。实验结果表明,ADI在一定程度上避免了子图同构判断的巨大代价,提高了算法的效率和可量测性。通过与目前世界上认可的最快的图挖掘算法gSpan比较,ADI-Mine无论从可量测性上还是从时间效率上,都大大优于对方。在此基础上,还提出了将ADI移植到其他图挖掘算法中的想法,进一步提高效率。 (3) 总结了目前常用的图约束条件,并根据其特性将约束分成若干类别,最后提出了带约束的图挖掘算法CabGin。实验证明,通过聚集挖掘焦点,不仅可以减少噪声结果对分析造成的影响,还可以提高挖掘效率。

关键词：数据挖掘半结构化与结构化频繁子树频繁子图导出式子树嵌入式子树模式增长单调约束反单调约束非单调约束索引查询网络日志 XML 社会网络生物基因序列

来源：评论

学校读者我要写书评

暂无评论

基于HASH表的多谓词约束下频繁项集挖掘

引用

微电子学与计算机 2011年第10期28卷 56-59页

作者：张婕张燕李广水金陵科技学院信息技术学院江苏南京211169 江苏省信息分析工程实验室江苏南京211169

针对在交易数据库中挖掘出指定顾客相关属性的频繁项集这一问题,提出了基于维约束进行求解的构想.采用模式增长的挖掘方法,但与传统的模式树不同的是将原先每一节点频繁计数值设为在所有可能的谓词约束下该项的计数形成的向量,并利用HAS... 详细信息

针对在交易数据库中挖掘出指定顾客相关属性的频繁项集这一问题,提出了基于维约束进行求解的构想.采用模式增长的挖掘方法,但与传统的模式树不同的是将原先每一节点频繁计数值设为在所有可能的谓词约束下该项的计数形成的向量,并利用HASH表进行向量值及项所在层的位置映射,因此,在不同的约束组合下的频繁项集挖掘将不再需要扫描数据库.仿真实验表明该挖掘算法的完备性,通过与先筛选再挖掘的算法进行比较,证明该挖掘算法具有更高的效率.

关键词：多谓词约束频繁项集模式增长 HASH表

来源：评论

学校读者我要写书评

暂无评论

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案：

请选择收藏分类：

通借通还

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案： 新增检索档案 确定 取消

请选择收藏分类： 新增自定义分类 确定 取消

通借通还

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

请选择保存的检索档案：

请选择收藏分类：