咨询与建议

限定检索结果

文献类型

  • 4 篇 期刊文献
  • 2 篇 学位论文
  • 1 篇 会议

馆藏范围

  • 7 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 7 篇 工学
    • 4 篇 计算机科学与技术...
    • 4 篇 软件工程
    • 3 篇 仪器科学与技术
    • 1 篇 信息与通信工程
    • 1 篇 控制科学与工程
  • 1 篇 军事学
    • 1 篇 军队指挥学
  • 1 篇 艺术学
    • 1 篇 设计学(可授艺术学...

主题

  • 7 篇 html结构
  • 2 篇 中文文本分类
  • 2 篇 向量空间模型
  • 2 篇 链接关系
  • 1 篇 网页信息
  • 1 篇 句对齐
  • 1 篇 信息检索
  • 1 篇 网络评论
  • 1 篇 中英问句翻译
  • 1 篇 web信息提取
  • 1 篇 属性向量
  • 1 篇 分段检索
  • 1 篇 平行文本
  • 1 篇 统计翻译模型
  • 1 篇 平行网页获取
  • 1 篇 url模式
  • 1 篇 搜索引擎
  • 1 篇 平行语料库
  • 1 篇 准确率
  • 1 篇 web数据

机构

  • 2 篇 清华大学
  • 2 篇 北京工业大学
  • 1 篇 军事交通学院
  • 1 篇 北京大学
  • 1 篇 蒙特利尔大学
  • 1 篇 郑州轻工业学院

作者

  • 2 篇 郭晓
  • 1 篇 樊得强
  • 1 篇 jiang zong-li
  • 1 篇 孙茂松
  • 1 篇 sun maosong
  • 1 篇 张敏
  • 1 篇 liu yang
  • 1 篇 汪建伟
  • 1 篇 liu qi
  • 1 篇 nie jian-yun
  • 1 篇 chen jiang
  • 1 篇 聂建云
  • 1 篇 宋睿华
  • 1 篇 蒋宗礼
  • 1 篇 马少平
  • 1 篇 guo xiao
  • 1 篇 杨冬青
  • 1 篇 高军
  • 1 篇 刘洋
  • 1 篇 刘奇

语言

  • 7 篇 中文
检索条件"主题词=HTML结构"
7 条 记 录,以下是1-10 订阅
排序:
URL模式与html结构相结合的平行网页获取方法
收藏 引用
中文信息学报 2013年 第3期27卷 91-99页
作者: 刘奇 刘洋 孙茂松 清华大学计算机科学与技术系智能技术与系统国家重点实验室 清华信息科学与技术国家实验室(筹)北京100084
平行语料库是对机器翻译、跨语言信息检索等应用技术具有重要支撑作用的基础数据资源。虽然互联网上的平行网页数量巨大且持续增长,但由于平行网站的异构性和复杂性,如何快速自动获取高质量的平行网页进而构造平行语料库仍然是巨大的挑... 详细信息
来源: 评论
利用平行网页建立中英文统计翻译模型
收藏 引用
中文信息学报 2001年 第1期15卷 1-12页
作者: 聂建云 陈江 蒙特利尔大学RALI实验室
建立翻译模型的目的是试图从平行文本 (或翻译例句 )中自动抽取翻译关系。本文将描述我们在建立中英文统计翻译模型上的尝试。我们所用的平行文本是从万维网上自动获得的半结构性平行文本。在训练过程中 ,我们尽量利用文本中的html结构... 详细信息
来源: 评论
基于网页结构与链接关系的中文文本分类
基于网页结构与链接关系的中文文本分类
收藏 引用
作者: 郭晓 北京工业大学
学位级别:硕士
随着计算机、通信技术的高速发展,以及互联网基础设施建设与网络信息工具的推广应用,网络上的信息正在以几何级数进行着增长。如何从网络上海量的信息资源中获得有用的部分,成为了当前信息检索领域重要的研究课题。\n 网络搜索引... 详细信息
来源: 评论
WEB个性化信息采集与管理关键技术研究
WEB个性化信息采集与管理关键技术研究
收藏 引用
作者: 樊得强 郑州轻工业学院
学位级别:硕士
根据国家信息产业部对振兴软件业和推动社会服务信息化的具体要求,以及政府、企事业单位对WEB个性化信息采集与管理的需求,Web信息服务行业已成为目前最热门的行业之一。然而面对目前通用搜索引擎的诸多缺陷,使得人们不再满足于充当... 详细信息
来源: 评论
一种提高Web信息检索精度的分段检索方法
收藏 引用
广西师范大学学报(自然科学版) 2003年 第A01期21卷 151-155页
作者: 宋睿华 马少平 张敏 清华大学计算机系智能技术与系统国家重点实验室 北京100084
在Web上存在一些长文档,它们包含着多个子主题,如果把这样的文档分成段,每个段的内容只围绕一个主题,将会提高检索质量.阐述了使用html结构中带有语义特征的标记来将多主题的文档分成段,在此基础上,对10G规模的Web数据实现了分段检索的... 详细信息
来源: 评论
基于网页结构与链接关系的中文文本分类方法
收藏 引用
现代电子技术 2010年 第22期33卷 54-56,63页
作者: 郭晓 蒋宗礼 北京工业大学计算机学院 北京100124
提出一种通过综合考虑网页的html结构信息以及网页间的链接关系,修改网页文本在向量空间模型表示中的权值,对网页进行分类的方法。考虑到页面里处在不同html标记下的内容具有不同的语义含义,某些特殊标记下的内容具有较重要的意义,对网... 详细信息
来源: 评论
一种基于显示属性的网页信息提取方法
一种基于显示属性的网页信息提取方法
收藏 引用
2007年全国网络与信息安全技术研讨会
作者: 汪建伟 高军 王腾蛟 杨冬青 北京大学信息科学技术学院 北京 100871 军事交通学院 天津 300161 北京大学信息科学技术学院 北京 100871
在目前的Web信息提取技术中,很多都是基于html结构的,由于html结构的经常变化,使提取模板需要经常更新,而提取模板的更新需要很多领域知识。本文提出一种基于显示属性的Web信息提取方法,通过将网页文本按照其显示属性的不同进行分组,以... 详细信息
来源: 评论