咨询与建议

限定检索结果

文献类型

  • 6 篇 会议
  • 5 篇 期刊文献

馆藏范围

  • 11 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 11 篇 工学
    • 11 篇 计算机科学与技术...
    • 10 篇 软件工程
  • 1 篇 管理学
    • 1 篇 管理科学与工程(可...

主题

  • 5 篇 话题模型
  • 3 篇 话题演化
  • 2 篇 latent dirichlet...
  • 2 篇 中文信息处理
  • 2 篇 趋势分析
  • 1 篇 种子文档
  • 1 篇 线索文档划分
  • 1 篇 文档窗口
  • 1 篇 信息抽取
  • 1 篇 微博
  • 1 篇 话题关联
  • 1 篇 线索抽取
  • 1 篇 lda
  • 1 篇 命名实体识别
  • 1 篇 字段值
  • 1 篇 latent
  • 1 篇 信息中心
  • 1 篇 计算机应用
  • 1 篇 对比
  • 1 篇 数据库查询

机构

  • 10 篇 上海交通大学
  • 1 篇 萨尔州大学-上海交...
  • 1 篇 德国人工智能研究...

作者

  • 8 篇 李芳
  • 2 篇 单斌
  • 1 篇 毛顺福
  • 1 篇 冯礼
  • 1 篇 蒋德良
  • 1 篇 陆纬
  • 1 篇 徐佳俊
  • 1 篇 钱哲怡
  • 1 篇 hans uszkoreit
  • 1 篇 周凯
  • 1 篇 周振宇
  • 1 篇 楚克明
  • 1 篇 付中阳
  • 1 篇 李峰
  • 1 篇 姚天昉
  • 1 篇 徐飞玉
  • 1 篇 沈嘉懿
  • 1 篇 贺亮
  • 1 篇 杨飏

语言

  • 11 篇 中文
检索条件"机构=上海交通大学计算机系中德语言技术实验室"
11 条 记 录,以下是1-10 订阅
排序:
基于LDA模型的论坛热点话题识别和追踪
收藏 引用
中文信息学报 2016年 第1期30卷 43-49页
作者: 徐佳俊 杨飏 姚天昉 付中阳 萨尔州大学-上海交通大学语言技术联合实验室上海交通大学计算机系 上海200240
在当今处于信息数量爆炸式增长的互联网时代,如何分析海量文本中的信息并从而提取出所蕴含的有利用价值的部分,是一个值得关注的问题。然而论坛语料作为网络语料,其结构和内容较一般语料相比更为复杂,文本也更加短小。该文提出的方法利... 详细信息
来源: 评论
特定事件微博与新闻报道话题对比研究
收藏 引用
中文信息学报 2014年 第1期28卷 47-55页
作者: 周振宇 李芳 上海交通大学计算机科学与工程系中德语言技术联合实验室 上海200240
该文描述了基于特定事件的新闻报道和微博在话题层面的对比研究。首先利用LDA话题模型抽取两种媒体上关于特定事件的话题,然后提出了话题关注度、差异度、演化度的定义和计算公式,改进了不同媒体话题差异度的计算方法,最后,选取四个不... 详细信息
来源: 评论
基于关键词和命名实体识别的新闻话题线索抽取
收藏 引用
计算机应用与软件 2011年 第12期28卷 168-171页
作者: 钱哲怡 李芳 上海交通大学计算机系中德语言技术实验室 上海200240
如何自动结构化新闻话题,从不同角度和不同侧面了解新闻话题,解决网络新闻信息过载的问题成为研究的热点。提出将新闻话题进行线索化的观点,根据抽取线索算法得到关键词和命名实体集合作为每一条线索主旨,并将新闻报道归类到线索中作为... 详细信息
来源: 评论
基于话题模型的科技文献话题发现和趋势分析
基于话题模型的科技文献话题发现和趋势分析
收藏 引用
第十一届全国计算语言学学术会议
作者: 贺亮 李芳 上海交通大学计算机科学与工程系中德语言技术联合实验室
自动挖掘科技文献话题,总结研究领域的发展趋势及最新研究动态,能给科技工作者的研究工作提供帮助。本文提出一种话题发现和趋势分析的方法,该方法首先利用LDA话题模型抽取科技文献的话题,然后计算话题的强度和影响力,最后研究话题的趋... 详细信息
来源: 评论
基于LDA话题演化研究方法综述
收藏 引用
中文信息学报 2010年 第6期24卷 43-49,68页
作者: 单斌 李芳 上海交通大学计算机科学与工程系中德语言技术联合实验室 上海200240
现实生活中不断有新话题的产生和旧话题的衰减,同时话题的内容也会随着时间发生变化。自动探测话题随时间的演化越来越受到人们的关注。Latent Dirichlet Allocation模型是近年提出的概率话题模型,已经在话题演化领域得到较为广泛的应... 详细信息
来源: 评论
基于种子文档和话题模型的话题演化研究
基于种子文档和话题模型的话题演化研究
收藏 引用
第六届全国信息检索学术会议
作者: 单斌 李芳 上海交通大学计算机科学与工程系 中德语言技术联合实验室
现实生活中不断有新话题的产生和旧话题的消亡,话题的内容也随着时间不断的变化。因此自动探测话题演化越来越受到学者的关注。Latent Dirichlet Allocation模型是近年提出的概率话题模型,已经在话题演化领域得到较为广泛的应用。但是... 详细信息
来源: 评论
基于LDA新闻话题的演化
基于LDA新闻话题的演化
收藏 引用
第五届全国信息检索学术会议
作者: 楚克明 李芳 上海交通大学计算机系中德语言技术实验室
新闻话题及其它的演化研究可以帮助人们快速了解和获取新闻内容。本文提出了一种挖掘新闻话题随时间变化的方法,通过话题抽取、话题过滤和话题关联实现话题的演化。首先应用LDA对不同时间段的文集进行话题的自动抽取,话题数目在不同时... 详细信息
来源: 评论
中文组织机构名称与简称的识别
收藏 引用
中文信息学报 2007年 第6期21卷 17-21页
作者: 沈嘉懿 李芳 徐飞玉 Hans Uszkoreit 上海交通大学计算机系 上海200240 德国人工智能研究中心语言技术实验室
本文提出了一种基于规则识别中文组织机构全称和简称的方法。全称的识别首先借助机构后缀词库获得其右边界,然后通过规则匹配并借助贝叶斯概率模型加以决策获得其左边界。简称的识别是在全称的基础上应用其对应的简称规则实现的。在开... 详细信息
来源: 评论
中文新闻事件要素自动抽取研究
中文新闻事件要素自动抽取研究
收藏 引用
2007中国计算机大会
作者: 李芳 毛顺福 蒋德良 陆纬 周凯 冯礼 李峰 上海交通大学计算机系中德语言技术实验室,上海,200240
网络新闻已成为传播的主要媒体,本文描述了自动抽取新闻报道中提及事件的发生时间、地点以及结果的一种方法。实现了基于时间与地点,新闻报道中多个事件的信息抽取,自动识别事件结果描述中数字之间的包含、并列关.实验结果表明该... 详细信息
来源: 评论
中文计算语言学信息中心介绍
中文计算语言学信息中心介绍
收藏 引用
中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议
来源: 评论