咨询与建议

限定检索结果

文献类型

  • 2 篇 期刊文献
  • 1 篇 学位论文

馆藏范围

  • 3 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 3 篇 工学
    • 2 篇 计算机科学与技术...
    • 1 篇 仪器科学与技术
    • 1 篇 软件工程
  • 1 篇 管理学
    • 1 篇 管理科学与工程(可...

主题

  • 3 篇 相似文档检测
  • 1 篇 topic
  • 1 篇 simhash算法
  • 1 篇 tf-idf算法
  • 1 篇 空间维度
  • 1 篇 大规模数据处理
  • 1 篇 主题聚类
  • 1 篇 model
  • 1 篇 链接分析
  • 1 篇 指纹计算
  • 1 篇 中国web信息博物馆...
  • 1 篇 多维搜索
  • 1 篇 汉明距离

机构

  • 1 篇 河南师范大学
  • 1 篇 北京大学
  • 1 篇 北京工业大学

作者

  • 1 篇 田甜
  • 1 篇 何丹丹
  • 1 篇 张兴兰
  • 1 篇 王磊

语言

  • 3 篇 中文
检索条件"主题词=相似文档检测"
3 条 记 录,以下是1-10 订阅
排序:
基于链接和内容分析的主题聚类算法设计和实现
基于链接和内容分析的主题聚类算法设计和实现
收藏 引用
作者: 王磊 北京大学
学位级别:硕士
Web的永久保存具有重要意义,国际范围内许多组织和政府机构相继建立了大型的历史网页存档系统来永久保存网页,如Internet Archive和Web InfoMal。而如何对蕴含在海量网页存档系统中的信息进行有效的挖掘和利用是一个尚待解决的问题。... 详细信息
来源: 评论
基于改进的Simhash算法的相似文档识别技术
收藏 引用
计算机科学与应用 2020年 第2期10卷 371-378页
作者: 张兴兰 何丹丹 北京工业大学 北京
[目的/意义]:为了实现在海量文本中更加高效准确检测相似文本。[方法]:本文对基于Simhash算法的相似文档识别技术进行研究改进,对Simhash签名值的计算方法作出改进,分词阶段使用ICTCLAS分词系统,文本特征词的权重计算方法采用TF-IDF技... 详细信息
来源: 评论
多维搜索引擎的构建与应用
收藏 引用
软件导刊 2009年 第6期8卷 25-27页
作者: 田甜 河南师范大学计算机与信息技术学院 河南新乡453007
现阶段主流搜索引擎技术可以概括为基于空间的搜索。在未来的发展过程中,信息的表示方式更加丰富,搜索用户对信息检索的需求逐步提高,由此提出多维搜索的概念。多维搜索引擎不受物理条件的限制,对不同类型的数据进行灵活操纵、抽取和组... 详细信息
来源: 评论