版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN202211697939.9
公 开 号:CN116800461A
代 理 人:杭州杭诚专利事务所有限公司刘正君
代理机构:杭州杭诚专利事务所有限公司
专利类型:发明专利
申 请 日:20230922
公 开 日:20221228
专利主分类号:H04L9/40
关 键 词:文本语言 待检测邮件 钓鱼邮件 检测 特征相似度 相似度计算 对比样本 节约资源 历史邮件 特征检测 特征提取 邮件内容 度计算 多维度 敏感词 欺骗性 综合分析 准确率 算法 回溯 盗用 判定 发送 伪造 分析
摘 要:本发明一种基于内容回溯分析的钓鱼邮件检测方法。解决现有采用伪造或盗用熟人邮箱发送钓鱼邮件,欺骗性强的问题。方法包括获取与用户往来的历史邮件,对邮件内容进行特征提取;选出文本语言特征,采用K‑means算法对文本语言特征进行训练,获得特征检测模型;待检测邮件内容中提取文本语言特征,输入模型进行文本语言特征相似度计算;从文本语言特征中选取重要特征,进行重要特征相似度计算;待检测邮件内容中提取敏感词特征,进行异常度计算;综合分析进行钓鱼邮件判定。本发明使用多维度特征、多种类检测模型,仅采用与待检测邮件相同发件人的历史往来邮件作为对比样本,具备强针对性,在节约资源成本的同时,能够提高检测效率和准确率。