咨询与建议

限定检索结果

文献类型

  • 2 篇 期刊文献

馆藏范围

  • 2 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 2 篇 工学
    • 2 篇 计算机科学与技术...
    • 2 篇 软件工程
    • 1 篇 控制科学与工程
  • 1 篇 管理学
    • 1 篇 管理科学与工程(可...

主题

  • 2 篇 重复模式挖掘
  • 1 篇 缩进轮廓
  • 1 篇 信息抽取
  • 1 篇 粒度分析
  • 1 篇 串联重复波段
  • 1 篇 web内容挖掘
  • 1 篇 后缀树
  • 1 篇 web数据抽取

机构

  • 1 篇 国防科学技术大学
  • 1 篇 解放军电子工程学...
  • 1 篇 信息工程大学

作者

  • 1 篇 王鹏坡
  • 1 篇 石昭祥
  • 1 篇 wang peng-po
  • 1 篇 袁霖
  • 1 篇 wang xiao-bin
  • 1 篇 尹刚
  • 1 篇 李翔
  • 1 篇 wang huai-min
  • 1 篇 li xiang
  • 1 篇 zhu yan-xu
  • 1 篇 王晓斌
  • 1 篇 shi dian-xi
  • 1 篇 史殿习
  • 1 篇 shi zhao-xiang
  • 1 篇 yuan lin
  • 1 篇 王怀民
  • 1 篇 朱沿旭
  • 1 篇 yin gang

语言

  • 2 篇 中文
检索条件"主题词=重复模式挖掘"
2 条 记 录,以下是1-10 订阅
排序:
基于缩进轮廓的HTML文档重复模式挖掘方法
收藏 引用
计算机科学 2011年 第8期38卷 165-168页
作者: 朱沿旭 王怀民 史殿习 尹刚 袁霖 李翔 国防科学技术大学计算机学院 长沙410073 信息工程大学电子技术学院 郑州450004
HTML文档重复模式挖掘是找到Web页面编码模版的关键,是Web数据自动抽取和Web内容挖掘的基础。传统的基于字符串匹配和树匹配的重复模式挖掘方法虽然具有较高的精确度,但是其性能对于处理海量的Web页面来说仍然是一个挑战。为了提高性能... 详细信息
来源: 评论
自动粒度选择的半结构化页面信息抽取
收藏 引用
计算机工程与应用 2009年 第6期45卷 165-167,172页
作者: 王晓斌 王鹏坡 石昭祥 解放军电子工程学院网络工程系602教研室 合肥230037
半结构化页面的数据记录间存在结构相似性,在先序遍历DOM树生成的标记序列中表现为重复出现的模式,可利用后缀树进行挖掘。由于标记序列可以在块粒度和文本粒度两个级别上展现,而不同粒度下产生的最佳抽取模式在抽取效果方面又表现出不... 详细信息
来源: 评论