咨询与建议

限定检索结果

文献类型

  • 1 篇 期刊文献

馆藏范围

  • 1 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 1 篇 工学
    • 1 篇 计算机科学与技术...
  • 1 篇 管理学
    • 1 篇 管理科学与工程(可...

主题

  • 1 篇 html-tree
  • 1 篇 网页分类
  • 1 篇 特征向量

机构

  • 1 篇 上海交通大学
  • 1 篇 上海市数字媒体处...

作者

  • 1 篇 li ming-yue
  • 1 篇 李铭岳
  • 1 篇 周军
  • 1 篇 zhou jun

语言

  • 1 篇 中文
检索条件"主题词=HTML-Tree"
1 条 记 录,以下是1-10 订阅
排序:
基于改进html-tree的中文网页特征向量提取方法
收藏 引用
信息技术 2009年 第1期33卷 10-14页
作者: 李铭岳 周军 上海交通大学图像通信与信息处理研究所 上海200240 上海市数字媒体处理与传输重点实验室 上海200240
中文网页特征向量的提取是提高中文网页分类准确度和召回度的关键。经过研究html网页的结构特点,提出一种基于改进的html-tree及网页元素权重的中文网页文本预处理方法,并在此基础上进行网页文本特征向量的提取。该方法充分利用不同类... 详细信息
来源: 评论