版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:中国科学院计算技术研究所智能信息处理重点实验室北京100190 中国科学院大学北京100049
出 版 物:《中文信息学报》 (Journal of Chinese Information Processing)
年 卷 期:2019年第33卷第4期
页 面:48-59页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家重点研发计划(2017YFC1700300 2017YFB1002300)
主 题:语义分类和描述框架 知识抽取 语义文法 遭受语义类 网络安全知识库
摘 要:随着计算机技术的迅猛发展,自然语言处理成为计算机科学领域与人工智能领域中的一个重要方向,且文本知识获取(knowledge acquisition from text,KAT)是人工智能的重要研究内容。当前对于文本研究,大多采用关键字以及机器学习方法,准确率并不高。该文提出了一种基于语义文法的中文网络攻击事件知识获取方法。首先介绍参考FrameNet构建的语义分类和描述框架,它在现代汉语基本句模分类的基础上进行了扩充和改进。其次,重点介绍了攻击文本中最常见的遭受类语义类的设计和形成过程。然后将语义分类和描述框架应用在网络安全领域,形成网络攻击语义类,并介绍在建立网络攻击语义类时遇到的难题,包括文法的设计中对事元的确定、复合句的处理、的是结构句型的分析设计、谓词设计等。最后,使用国家某安全部门提供的真实数据进行网络攻击知识抽取,实验表明该方法具有较高的准确率。