版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN201110252770.1
公 开 号:CN102306182A
代 理 人:胡吉科
代理机构:深圳市科吉华烽知识产权事务所
专利类型:发明申请
申 请 日:20120104
公 开 日:20110830
专利主分类号:G06F17/30(20060101)
关 键 词:系统服务器 概念语义 背景图 用户主题 采集用户 计算用户 网络搜索 兴趣数据 用户兴趣 主题数据 语义 相关度 相似度 匹配 感兴趣 广度 互联网 层面 挖掘 海洋 网络 发现
摘 要:本发明涉及网络搜索领域,其公开了一种基于概念语义背景图挖掘用户兴趣的方法,包括以下步骤:(A)系统服务器采集用户主题数据;(B)系统服务器建立用户主题兴趣模型;(C)系统服务器建立概念语义背景图;(D)系统服务器更新概念语义背景图以更新用户主题兴趣数据。本发明的有益效果是:概念语义背景图的提出,有利于网络爬行虫更好地选择爬行方向,与广度优先和传统的主题爬行方法相比,它可以在浩瀚的互联网海洋中更快、更高效地发现用户感兴趣的网页;同时,它把相似度的计算提前到了概念的层面上,进行语义上的匹配,可以更好地计算用户兴趣与网页的相关度。