咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向虚假新闻检测的社交媒体多模态数据集构建 收藏

面向虚假新闻检测的社交媒体多模态数据集构建

Construction of multi-modal social media dataset for fake news detection

作     者:高国鹏 房耀东 韩彦芳 钱振兴 秦川 GAO Guopeng;FANG Yaodong;HAN Yanfang;QIAN Zhenxing;QIN Chuan

作者机构:上海理工大学光电信息与计算机工程学院上海200093 复旦大学计算机科学技术学院上海200433 

出 版 物:《网络与信息安全学报》 (Chinese Journal of Network and Information Security)

年 卷 期:2023年第9卷第4期

页      面:144-154页

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金(U20B2051,62172280) 上海市自然科学基金(21ZR1444600) 

主  题:社交媒体 虚假新闻检测 多模态 多类别 数据集 

摘      要:社交媒体的出现正在改变着人们的生活,通过社交媒体可以便捷地获取和分享新闻,但同时助力了虚假新闻的滋生和传播,从而严重影响社会安全和稳定。因此,虚假新闻检测引起了研究者广泛关注。尽管存在多种基于深度学习的解决方案,但这些方法需要大量的数据作为支撑。现有的虚假新闻数据集,尤其是中文数据集不仅稀缺,而且数据集中的新闻大多属于同一个类别。为了更好地检测虚假新闻,构建了一个新的多模态的虚假新闻数据集(MFND,multi-modal fake news dataset),其中包含政治、经济、娱乐、体育、国际、科技、军事、教育、健康和社会生活这10个类别的中文和英文新闻数据。对提出的虚假新闻数据集的词频和类别进行分析,并与现有的虚假新闻数据集在新闻数量、新闻类别、模态信息和新闻语种等方面进行了对比,结果显示MFND在类别信息和新闻语种方面表现突出。另外,利用现有的典型虚假新闻检测方法在MFND上进行训练和验证,实验结果表明,相较于现有主流的虚假新闻数据集,MFND可以为模型提供10%左右的性能提升。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分