本文提出了一种基于伪相关反馈模型的领域访词典自动生成算泫。将领域词典生成过程视为领域术语的检索过程:对于绘定的领域语料 C,对于发现的有意思 S,如果 S 是 C 的领域术语, 则称 S 与 C 相关。假设初始检索出来的前若干个结果与 C...
详细信息
本文提出了一种基于伪相关反馈模型的领域访词典自动生成算泫。将领域词典生成过程视为领域术语的检索过程:对于绘定的领域语料 C,对于发现的有意思 S,如果 S 是 C 的领域术语, 则称 S 与 C 相关。假设初始检索出来的前若干个结果与 C 相关,将结果加到词典中,重心检索, 如此迭代,直到生成的领域词典达到预先设定的规模。实验表明,本算法经过若干次迭代后生成的领域词典准确牢高于已有领域词典生成算法。
由中国计算机学会主办、中国计算机学会服务计算专业委员会和西安交通大学承办的2012年第三届中国计算机学会服务计算学术会议(2012CCFNational Conferenceon Service Computing)将于2012年8月16-18日在古都西安举行。会议现面向全国...
详细信息
由中国计算机学会主办、中国计算机学会服务计算专业委员会和西安交通大学承办的2012年第三届中国计算机学会服务计算学术会议(2012CCFNational Conferenceon Service Computing)将于2012年8月16-18日在古都西安举行。会议现面向全国范围征集论文,诚邀服务计算、云计算、物联网和信息安全等相关领域的技术与工程人员踊跃投稿、参加会议。届时,还将邀请国内外著名专家到会作专题报告,邀请相关企业展示他们的最新技术成果。
准确实时的流分类是网络安全监控.QoS,入侵检测领域的重要问题之一。流分类器处理的数据含有大量的相关与冗余特征,这不仅增加了分类器的计算复杂性,同时也影响了分类器的分类效果。针对高维特征空间,特征选择一方面可以提高分类精度与效率,另一方面可以找出富含信息的特征子集。本文提出一种 wrapper 型特征选择算法 MRMHC-C4.5来构建轻量级的 IP 流分类器。该算法采用改进的随机变异爬山搜索策略对特征子集空间进行随机搜索, 然后利用提供的数据在 C4.5上的分类错误率作为特征子集的评价标准来获取最优特征子集。本文在 IP 流数据集上进行了大量的实验,实验结果表明基于 MRMHC-C4.5的流分类器在不影响检测性能的情况下能够提高检测速度,并且基于 MRMHC-C4.5的 IP 流分类器与 NBK-FCBF(Na(?)ve Bayes method with Kernel density estimation after Correlation-Based Filterl相比具有更小的计算复杂性与更高的检测率。
暂无评论