在信息安全越来越重要的情况下,作为信息系统的关键安全措施,防火墙起着至关重要的作用。对防火墙日志数据的分析是评估计算机网络状态的重要手段。本文提出了一个基于 BP 神经网络的防火墙流量数据预测模型。论文首先简单介绍了神经网...
详细信息
在信息安全越来越重要的情况下,作为信息系统的关键安全措施,防火墙起着至关重要的作用。对防火墙日志数据的分析是评估计算机网络状态的重要手段。本文提出了一个基于 BP 神经网络的防火墙流量数据预测模型。论文首先简单介绍了神经网络,其次提出了一个基于 BP 神经网络的防火墙流量数据预测模型,并给出了数据准备、网络训练、流量预测等过程。论文最后讨论和分析了预测结果并给出了结论。
编辑器的拼写校正、搜索引擎的查询纠正、光学字符识别的结果检查等领域都用到词典近似匹配算法。本文提出了大规模词典近似匹配的多重索引模型,首先将背景词典根据单词长度划分为若干子词典,对各子词典按照一定策略建立 Unigram、Bigram、Trigram、Quadgram 中的一种或若干种索引,当查找用户模式 P 的近似匹配时,根据模式 P 检索特定 N-gram 索引链,从而得到候选近似匹配集合 C,对 C 中每一个单词 W,计算 P 与 W 的编辑距离即可输出 P 的所有最终匹配结果 R。实验表明,基于多重索引模型的词典近似匹配算法能够大幅度减少候选近似匹配结果的数量,从而提高词典近似匹配的速度。
本文提出了一种基于伪相关反馈模型的领域访词典自动生成算泫。将领域词典生成过程视为领域术语的检索过程:对于绘定的领域语料 C,对于发现的有意思 S,如果 S 是 C 的领域术语, 则称 S 与 C 相关。假设初始检索出来的前若干个结果与 C...
详细信息
本文提出了一种基于伪相关反馈模型的领域访词典自动生成算泫。将领域词典生成过程视为领域术语的检索过程:对于绘定的领域语料 C,对于发现的有意思 S,如果 S 是 C 的领域术语, 则称 S 与 C 相关。假设初始检索出来的前若干个结果与 C 相关,将结果加到词典中,重心检索, 如此迭代,直到生成的领域词典达到预先设定的规模。实验表明,本算法经过若干次迭代后生成的领域词典准确牢高于已有领域词典生成算法。
准确实时的流分类是网络安全监控.QoS,入侵检测领域的重要问题之一。流分类器处理的数据含有大量的相关与冗余特征,这不仅增加了分类器的计算复杂性,同时也影响了分类器的分类效果。针对高维特征空间,特征选择一方面可以提高分类精度与效率,另一方面可以找出富含信息的特征子集。本文提出一种 wrapper 型特征选择算法 MRMHC-C4.5来构建轻量级的 IP 流分类器。该算法采用改进的随机变异爬山搜索策略对特征子集空间进行随机搜索, 然后利用提供的数据在 C4.5上的分类错误率作为特征子集的评价标准来获取最优特征子集。本文在 IP 流数据集上进行了大量的实验,实验结果表明基于 MRMHC-C4.5的流分类器在不影响检测性能的情况下能够提高检测速度,并且基于 MRMHC-C4.5的 IP 流分类器与 NBK-FCBF(Na(?)ve Bayes method with Kernel density estimation after Correlation-Based Filterl相比具有更小的计算复杂性与更高的检测率。
暂无评论