版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN201710122538.3
公 开 号:CN106878438A
专利类型:发明申请
申 请 日:20170620
公 开 日:20170303
专利主分类号:H04L29/08(20060101)
关 键 词:特征码匹配 内容特征 提取特征 资源内容 特征码 页面 分析 用户访问互联网 动态资源信息 用户行为分析 互联网资源 访问行为 页面建立 特征库 内嵌 日志 还原 统计
摘 要:本发明公开了一种https环境下用户行为分析的方法和系统,方法包括:步骤1)对需要分析的互联网资源页面建立内容特征库,特征库由多个特征码组成,特征码包括:https请求URL的Host、页面大小、页面包含资源内容、资源内容大小、动态资源信息、内嵌URLs及数量之一或者组合;步骤2)对用户访问互联网资源的https报文数据逐条分析,提取特征信息,以与特征码匹配分析;步骤3)将提取特征信息的日志与内容特征库中的特征码匹配,还原用户真实访问行为,并做进一步的分析和统计。