咨询与建议

限定检索结果

文献类型

  • 8 篇 学位论文
  • 7 篇 期刊文献
  • 1 篇 会议

馆藏范围

  • 16 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 15 篇 工学
    • 14 篇 计算机科学与技术...
    • 11 篇 软件工程
    • 1 篇 仪器科学与技术
    • 1 篇 农业工程
  • 3 篇 管理学
    • 2 篇 管理科学与工程(可...
    • 1 篇 图书情报与档案管...
  • 1 篇 农学
    • 1 篇 园艺学

主题

  • 16 篇 shark-search算法
  • 5 篇 主题爬虫
  • 3 篇 网页分块
  • 3 篇 主题爬取
  • 2 篇 垂直搜索
  • 2 篇 链接聚类
  • 2 篇 pagerank算法
  • 2 篇 主题链接块
  • 2 篇 垂直搜索引擎
  • 1 篇 红枣主题网络爬虫
  • 1 篇 语义相似度
  • 1 篇 主题漂移
  • 1 篇 链接评价
  • 1 篇 主题搜索引擎
  • 1 篇 bloom filters
  • 1 篇 opic算法
  • 1 篇 主题判别
  • 1 篇 支持向量机
  • 1 篇 链接结构
  • 1 篇 爬取策略

机构

  • 3 篇 山东师范大学
  • 2 篇 北京大学
  • 1 篇 南京大学
  • 1 篇 山东大学
  • 1 篇 北京林业大学
  • 1 篇 重庆大学
  • 1 篇 西安电子科技大学
  • 1 篇 南京中医药大学
  • 1 篇 河海大学
  • 1 篇 南昌大学
  • 1 篇 山东省分布式计算...
  • 1 篇 河池学院
  • 1 篇 塔里木大学
  • 1 篇 西安建筑科技大学
  • 1 篇 湖南省第一师范学...

作者

  • 2 篇 周雪
  • 2 篇 孙斌
  • 2 篇 苏祺
  • 2 篇 项锟
  • 1 篇 孟祥增
  • 1 篇 陈军
  • 1 篇 段文朋
  • 1 篇 张玲
  • 1 篇 范源源
  • 1 篇 郭艳芬
  • 1 篇 徐宁
  • 1 篇 杨祎杰
  • 1 篇 仇磊
  • 1 篇 黄启峰
  • 1 篇 姜华
  • 1 篇 娄渊胜
  • 1 篇 刘乃文
  • 1 篇 刘彤
  • 1 篇 吕鑫
  • 1 篇 许磊

语言

  • 16 篇 中文
检索条件"主题词=Shark-search算法"
16 条 记 录,以下是1-10 订阅
排序:
基于改进的shark-search算法的健康垂直搜索引擎的研究与实现
基于改进的Shark-Search算法的健康垂直搜索引擎的研究与实现
收藏 引用
作者: 陈豪 南昌大学
学位级别:硕士
随着近几年经济飞速发展和人民生活水平的提高,健康问题也越来越受人们重视。而在使用当前传统搜索引擎搜索健康领域信息时,搜索结果中往往存在大量的广告信息,并且专业性、权威性较差。针对该问题,本课题基于改进的shark-search算法实... 详细信息
来源: 评论
基于改进shark-search算法的主题爬虫研究
基于改进Shark-Search算法的主题爬虫研究
收藏 引用
作者: 许磊 南京大学
学位级别:硕士
互联网中信息过载对人们从网络中获取感兴趣的内容形成了巨大挑战,传统搜索引擎在一定程度上能满足人们对网络内容的检索需求,但也存在信息驳杂、检索结果不相关等问题。为此人们研发了垂直搜索引擎,满足了用户对特定领域更为精细的检... 详细信息
来源: 评论
改进的shark-search算法在网络采集中的应用
收藏 引用
计算机技术与发展 2017年 第8期27卷 192-194,199页
作者: 张玲 祁玉娟 姜华 湖南省第一师范学院信息科学与工程学院 湖南长沙410205
shark-search是一种依据链接价值的高低进行优先采集的算法,用于主题信息采集系统时由于只考虑了网页文本和链接锚文本与主题的相关性而忽略了网页的组织结构特性,在抓取有较多噪音链接的网页时效果欠佳。基于网页组织结构特性的分析研... 详细信息
来源: 评论
面向红枣信息资源的爬虫技术研究
面向红枣信息资源的爬虫技术研究
收藏 引用
作者: 杨广召 塔里木大学
学位级别:硕士
在现代互联网技术迅猛发展的时代,互联网上的各类资源呈现出爆炸式增长,网络上积累了丰富的红枣相关信息。传统主题网络爬虫会爬取与红枣主题相关性高的页面,但不能满足用户想要快速、精准、有效获取所需红枣信息的需求。传统主题网络... 详细信息
来源: 评论
面向牙齿健康领域的垂直搜索引擎的设计和实现
收藏 引用
科技视界 2022年 第33期 192-195页
作者: 杨祎杰 易云飞 范源源 黄启峰 段文朋 河池学院大数据与计算机学院 广西宜州546300
本文主要提出通过基于shark-search算法结合百度AI自然语言处理中的文本相似性实现主题爬虫,舍弃不相关链接。本引擎使用Scrapy作为爬虫框架、Elasticsearch数据库用于数据检索、Django用于后台开发、MySQL用于存储关系数据结构。本引... 详细信息
来源: 评论
一种改进shark-search的主题爬虫算法
收藏 引用
微型电脑应用 2017年 第2期33卷 19-21页
作者: 仇磊 娄渊胜 常民 河海大学计算机与信息学院 南京211100
针对shark-search算法在主题爬虫中对网页全局性的考虑不足,利用PageRank算法计算待下栽URL的权威值来弥补这种不足,提出了shark-PageRank算法,依据锚文本、锚文本邻近的文本和网页的权威值来权衡URL的价值。实验结果显示,在单位时间里... 详细信息
来源: 评论
主题搜索及其关键算法的研究
主题搜索及其关键算法的研究
收藏 引用
作者: 吕鑫 西安电子科技大学
学位级别:硕士
在现代互联网技术飞速发展的时代,互联网上的各类资源呈现出爆炸式增长,在海量的网络信息中,如何快速、准确的找出用户所需求的信息也日渐困难。通用搜索引擎虽然被广泛使用,但是却难以满足特殊用户想要精准获取所需信息的需求,因此当... 详细信息
来源: 评论
引入主题链接块因子的候选链接搜索策略研究
收藏 引用
计算机与数字工程 2018年 第5期46卷 874-878页
作者: 周雪 刘乃文 山东师范大学信息科学与工程学院 济南250014 山东省分布式计算机软件新技术重点实验室 济南250014
网页主题爬取过程中,需要计算网页中出现的url权重,不断填充待爬行队列,以满足爬行条件,如何发现与主题最相关的链接,同时又不会导致"主题漂移"问题是关键。针对链接的锚文本较短小,不能很好地表明链接指向页面与主题的相关... 详细信息
来源: 评论
基于网页分块的主题爬虫技术研究
基于网页分块的主题爬虫技术研究
收藏 引用
作者: 周雪 山东师范大学
学位级别:硕士
随着Web信息的多元化发展以及信息量的膨胀速度日益加快,不仅存储成本提高,信息采集也变得越来越难。通用爬虫在工作过程中会消耗大量的网络带宽,造成系统资源的浪费。而且它不太关心搜索到的页面是否符合用户的搜索主题,往往会返回很... 详细信息
关键词:

网页分块; 网页分块   视觉信息   标签属性   主题链接块   shark-search算法  

来源: 评论
主题爬虫搜索策略及关键技术研究
主题爬虫搜索策略及关键技术研究
收藏 引用
作者: 徐宁 重庆大学
学位级别:硕士
主题网络爬虫是主题搜索引擎的关键技术。主题爬虫能够智能地采集与特定主题相关的网页,而避免不相关网页的访问;主题爬虫的提出与运用能够极大缓解目前基于通用网络爬虫的搜索引擎中搜索覆盖率低,搜索精度低、网页更新不及时而无法满... 详细信息
来源: 评论