21世纪以来,随着互联网环境下WEB应用得到越来越广泛的应用,随之而来的WEB安全威胁也日益突显。攻击者往往会利用WEB应用程序的漏洞进行攻击,获取到用户隐私信息进行非法交易,甚至直接通过获取的信息来窃取用户的钱财。WEB应用程序的动态性主要由脚本语言实现,而javascript也已成为最受广泛应用的网站前端脚本语言。因此,如何快速有效地检测出javascript恶意代码已成为维护网络环境亟需解决的问题之一。本文在从真实环境中收集了总数为5,285条javascript正常与恶意代码用于实验,通过对javascript代码的静态特征和动态特征进行分析,基于信息熵的原理改进javascript恶意代码特征集构建方法,并利用机器学习分类算法对构建特征集的有效性进行了验证。实验结果表明,在漏报率为1.6%时,设计实现的基于信息熵的javascript恶意代码检测工具(简称:E-JSDT)对javascript恶意代码能达到正确率为97.9%的检测效果。本文的主要工作体现在以下几方面:(1)通过调研国内外javascript恶意代码检测的研究现状,分析javascript代码的特性,从三个方面(源码分析、动态特性和其他方面)提取了javascript代码的静态特征和动态特征,并基于信息熵的预处理技术构建了熵特征数据集,为研究团队健全WEB安全数据集做出贡献;(2)通过LR(逻辑回归)分类模型对预处理后的javascript特征向量数据集熵特征的有效性与可行性进行了实验验证,并对E-JSDT进行了架构的设计与实现。(3)通过三组实验对比表明,E-JSDT在正确率、漏报率以及误报率方面较传统信息熵的恶意代码检测方法有了很大的提高;与G Data Internet Security杀毒软件对比,E-JSDT具有更高的准确率和更低的漏报率。
暂无评论