版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN202311156115.5
公 开 号:CN117453793A
代 理 人:许守金
代理机构:浙江翔隆专利事务所(普通合伙)
专利类型:发明专利
申 请 日:20240126
公 开 日:20230908
专利主分类号:G06F16/26
关 键 词:威胁 网络安全 聚类 数据采集模型 数据挖掘模型 网络安全技术 信息量计算 电子设备 方法提取 计算模型 命名实体 筛选模型 实体识别 数据实体 信息转化 攻击 挖掘 时新性 帖子 构建 可信 搜集 文本 筛选 评估 预测 研究
摘 要:本发明公开了一种高质量威胁数据的挖掘方法、系统、电子设备和介质,属于网络安全技术领域。本发明的一种高质量威胁数据的挖掘方法,通过构建数据采集模型、主题聚类筛选模型、实体识别模型、时新计算模型和威胁数据挖掘模型,通过基于主题的聚类方法从收集的帖子中筛选出有关网络安全的内容,进一步通过命名实体识别方法提取出文本中的威胁数据实体,最后通过明网信息量计算实体词的时新性,以此评估提取出的信息的重要性,最终得到高质量的网络安全相关的威胁数据,方案科学、合理,切实可行。本发明将搜集到的信息转化成可信威胁数据,有助于研究人员在攻击发生之前预测攻击者的意图和行为。