咨询与建议

限定检索结果

文献类型

  • 5 篇 期刊文献

馆藏范围

  • 5 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 5 篇 工学
    • 5 篇 计算机科学与技术...
    • 5 篇 软件工程

主题

  • 1 篇 词汇链融合
  • 1 篇 名实体识别
  • 1 篇 知网
  • 1 篇 谱聚类
  • 1 篇 最大熵模型
  • 1 篇 判别式模型
  • 1 篇 语言分析
  • 1 篇 中文信息处理
  • 1 篇 条件随机域
  • 1 篇 时间
  • 1 篇 多文档自动文摘
  • 1 篇 概念相似度
  • 1 篇 计算机应用
  • 1 篇 信息融合
  • 1 篇 分裂-合并(dm)
  • 1 篇 标记偏置
  • 1 篇 标准化互信息(nmi...
  • 1 篇 主题层次聚类
  • 1 篇 《知网》
  • 1 篇 聚类集成

机构

  • 5 篇 哈尔滨工业大学
  • 1 篇 哈尔滨理工大学
  • 1 篇 盐城工学院
  • 1 篇 哈尔滨工程大学

作者

  • 3 篇 wang xiao-long
  • 3 篇 王晓龙
  • 3 篇 刘远超
  • 2 篇 liu yuan-chao
  • 1 篇 lu zhimao
  • 1 篇 lang fei
  • 1 篇 卢志茂
  • 1 篇 liu ming
  • 1 篇 徐志明
  • 1 篇 xu yong-dong
  • 1 篇 liu yuanchao
  • 1 篇 孙广路
  • 1 篇 sun guang-lu
  • 1 篇 liu bing-quan
  • 1 篇 顾国昌
  • 1 篇 郎非
  • 1 篇 郑逢强
  • 1 篇 zheng feng-qiang
  • 1 篇 徐森
  • 1 篇 刘铭

语言

  • 5 篇 中文
检索条件"机构=哈尔滨工业大学计算机学院智能技术与自然语言处理研究室"
5 条 记 录,以下是1-10 订阅
排序:
基于信息融合的多文档自动文摘技术
收藏 引用
计算机学报 2007年 第11期30卷 2048-2054页
作者: 徐永东 徐志明 王晓龙 哈尔滨工业大学计算机学院智能技术与自然语言处理研究室 哈尔滨150001
提出了一个面向多文档自动文摘任务的多文本框架(Multiple Document Framework,MDF),该框架通过系统地描述不同层面的文本单元之间的相互关系以及文档集合蕴含的事件在时间上的发生及演变,将多篇文档在不损失文档集合原有信息的前提下... 详细信息
来源: 评论
主题分析技术在文档聚类中的应用
收藏 引用
哈尔滨工业大学学报 2009年 第3期41卷 53-57页
作者: 刘铭 刘远超 王晓龙 哈尔滨工业大学计算机科学与技术学院智能技术及自然语言处理实验室 哈尔滨150001
为解决高频特征对文章的主题信息反映不够全面,无法获得高质量聚类结果的问题,同时为获得聚类后各类别反映信息的精确描述,采用词汇链反映文章所描述的主题信息,并依据文本间词汇链的相似度进行聚类.将聚类后属于同一类别并反映相同主... 详细信息
来源: 评论
使用“分裂-合并'策略改进文本聚类集成算法的研究
收藏 引用
技术通讯 2010年 第7期20卷 714-718页
作者: 卢志茂 徐森 刘远超 顾国昌 哈尔滨工程大学模式识别与自然计算研究室 哈尔滨150001 盐城工学院计算机工程系 盐城224051 哈尔滨工业大学智能技术与自然语言处理实验室 哈尔滨150001
探讨了'分裂-合并'(DM)策略对文本聚类集成算法改进的效果。首先在聚类成员生成阶段运行使用DM策略的超球K均值(SKM)算法r次,每次生成较多的文本子簇,并根据子簇的相似性使用凝聚层次聚类方法合并这些子簇,得到r个聚类成员,随... 详细信息
来源: 评论
条件随机域模型及在语言分析系统中的应用
收藏 引用
电机与控制学报 2008年 第1期12卷 113-116页
作者: 孙广路 王晓龙 郎非 刘远超 哈尔滨工业大学计算机科学与技术学院智能技术与自然语言处理研究室 黑龙江哈尔滨150001 哈尔滨理工大学公共外语教学部 黑龙江哈尔滨150080
分析了判别式模型的标记偏置问题对序列化标记的影响,利用条件随机域模型的全序列概率归一思想解决标记偏置问题。在条件随机域模型和特征选择的基础上,将语言分析任务转化成序列化标记问题进行求解,建立了由分词、词性标注和组块分析... 详细信息
来源: 评论
《知网》在命名实体识别中的应用研究
收藏 引用
中文信息学报 2008年 第5期22卷 97-101页
作者: 郑逢强 林磊 刘秉权 孙承杰 哈尔滨工业大学智能技术与自然语言处理实验室计算机科学与技术学院 黑龙江哈尔滨150001
命名实体识别是自然语言处理领域的一项基础研究,它对于语言的深层处理有重要意义。该文以最大熵模型为基础来进行名实体识别,提出了基于《知网》的两种改进策略来增强模型的泛化性能。第一种策略是将《知网》中词的义原作为特征加入到... 详细信息
来源: 评论