咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >信息安全事件文本的分类方法研究 收藏
信息安全事件文本的分类方法研究

信息安全事件文本的分类方法研究

作     者:刘奕君 

作者单位:华东理工大学 

学位级别:硕士

导师姓名:党齐民

授予年度:2014年

学科分类:081203[工学-计算机应用技术] 0839[工学-网络空间安全] 08[工学] 0835[工学-软件工程] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:信息安全事件 文本分类 KNN算法 下近似区域 

摘      要:近些年来,随着互联网,云计算等技术的快速发展与普及,给我们带来了大量的以文本为表现形式的信息,这些信息包含着大量的有用知识,那么对这些信息的分类就逐渐成为继续进行深入研究和分析的基础和面临的首要问题。另一方面,近年频发信息安全事件,信息安全对于个人和集体都越发重要,对于发生的信息安全事件进行整理分类可以为今后的研究奠定基础。 本文分析了信息安全事件的现行标准以及信息安全事件的分类分级体系,并搜集了相关的信息来源,在此基础上整理并提出了一个更加适合科学研究的信息安全事件类别标准,同时深入的研究了中文文本分类的步骤,过程和方法,并详细分析和阐述了信息安全事件文本的特点,提出了一种类间离散度和类内离散度与互信息方式相结合的特征选取方法,分析了几种常见的中文文本分类算法,并对比了这几种算法对于信息安全事件的分类效果,针对KNN算法提出了一种改进的方法。 KNN算法在执行时每次都需对比训练集中所有样本,这样大大降低了算法的执行效率,为了有效减少分类时的样本对比数量,引入了粗糙集中下近似区域的概念,结合分析得到的信息安全事件文本的特点,找到每一个类别的下近似区域,进而在KNN算法的基础上加入了判断逻辑,改进了KNN算法的执行效率,同时,在算法的准确率和召回率方面也有所提高。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分