咨询与建议

限定检索结果

文献类型

  • 1 篇 期刊文献

馆藏范围

  • 1 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 1 篇 工学
    • 1 篇 控制科学与工程
    • 1 篇 计算机科学与技术...
    • 1 篇 软件工程
  • 1 篇 管理学
    • 1 篇 管理科学与工程(可...

主题

  • 1 篇 有效信息率
  • 1 篇 最小正文子树
  • 1 篇 网页格式信息
  • 1 篇 博客信息抽取
  • 1 篇 切分位置信息量
  • 1 篇 视觉信息

机构

  • 1 篇 中国科学院计算技...
  • 1 篇 中国科学院研究生...
  • 1 篇 厦门大学

作者

  • 1 篇 廖祥文
  • 1 篇 bai shuo
  • 1 篇 cao dong-lin
  • 1 篇 曹冬林
  • 1 篇 白硕
  • 1 篇 许洪波
  • 1 篇 xu hong-bo
  • 1 篇 liao xiang-wen

语言

  • 1 篇 中文
检索条件"主题词=切分位置信息量"
1 条 记 录,以下是1-10 订阅
排序:
基于网页格式信息量的博客文章和评论抽取模型
收藏 引用
软件学报 2009年 第5期20卷 1282-1291页
作者: 曹冬林 廖祥文 许洪波 白硕 中国科学院计算技术研究所网络科学与技术研究部 北京100190 中国科学院研究生院 北京100049 厦门大学智能科学系 福建厦门361005
信息论的角度出发,提出了一个基于网页格式信息量的博客文章和评论抽取模型.首先,结合网页视觉上的位置信息和文本的有效信息来定位网页正文.其次,利用博客网页中的格式信息作为信息单元并计算每个信息块所包含的格式信息量,通过计算... 详细信息
来源: 评论