咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于多种词特征的微博突发事件检测方法 收藏

基于多种词特征的微博突发事件检测方法

Microblog Bursty Events Detection Method Based on Multiple Word Features

作     者:张仰森 段宇翔 王建 吴云芳 ZHANG Yang-sen;DUAN Yu-xiang;WANG Jian;WU Yun-fang

作者机构:北京信息科技大学智能信息处理研究所北京100101 北京大学计算语言学研究所北京100871 国家经济安全预警工程北京实验室北京100044 

出 版 物:《电子学报》 (Acta Electronica Sinica)

年 卷 期:2019年第47卷第9期

页      面:1919-1928页

核心收录:

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金(No.61772081) 科技创新服务能力建设-科研基地建设-北京实验室-国家经济安全预警工程北京实验室项目(No.PXM2018-014224-000010) 

主  题:微博 突发事件 突发特征词 D-S证据理论 凝聚式层次聚类 

摘      要:近年来,各领域内频频发生各类突发事件,对社会稳定发展产生了一定程度的影响.本文提出了一种基于多种词特征的微博突发事件检测模型,可以在海量微博数据中对突发事件进行检测,便于相关决策者进行微博监控和舆论引导,尽可能减少突发事件给社会带来的危害.首先根据时间信息对微博数据进行时间切片,对每一个时间窗口内的数据分别计算各个词语的词频特征、话题标签特征和词频增长率特征;然后基于D-S证据理论和层次分析法,确定词的各个特征权重,并进行加权融合得到词的突发特征值,将突发特征值大的词挑选出来构成突发特征词集,构建基于共现度和结合紧密度的突发事件特征词集的耦合度矩阵;最后将该耦合度矩阵作为凝聚式层次聚类算法的输入,生成一棵由突发词为叶子节点的二叉树,并采用内部相似度的二叉树剪枝算法对聚类结果进行划分,即可实现对相应时间窗口突发事件的检测.实验结果表明,基于突发词的事件检测模型在簇内部相似度阈值等于1.1时效果最好,正确率达到0.8462、召回率达到0.8684、F值为0.8571,表明了本文所提方法的有效性.

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分