一种基于半监督学习的DHT网络敏感内容识别方法-内蒙古大学图书馆

文献详情 >一种基于半监督学习的DHT网络敏感内容识别方法收藏

一种基于半监督学习的DHT网络敏感内容识别方法

专利申请号：CN202211531946.1

公开号：CN116306613A

发明人：纪天啸李致姚晓徐彦婷

代理人：刘芳

代理机构：北京艾纬铂知识产权代理有限公司

专利类型：发明专利

申请日：20230623

公开日：20221201

专利主分类号：G06F40/284

关键词：半监督学习标签数据敏感内容数据集文件元数据注意力机制定义规则记忆网络人工标注人工干预数据驱动数据训练网络数据训练效果有效信息种子信息数据量小样本学习型构建算法标注样本文本

摘要：本发明公开了一种基于半监督学习的DHT网络敏感内容识别方法，通过爬取DHT网络得到网络数据并对其中部分数据进行人工标注，构建了文件元数据数据集，同时针对种子信息文本自身具有的有效信息较为分散等特征，采用基于注意力机制的双向长短期记忆网络模型进行敏感内容识别，运用基于数据驱动的学习型算法极大减少了人工干预定义规则的需求，同时针对DHT网络数据训练过程中存在的数据量少、数据不平衡及无效样本多等问题，采用基于有标签数据和无标签数据同时进行训练的半监督学习方法有效提升了模型在小样本标注数据集上的训练效果。

本地馆藏 | 借阅须知 | 我要预约

已订购，未入库

sda

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

CADAL相关文献

一种基于半监督学习的DHT网络敏感内容识别方法

读者评论与其他读者分享你的观点

请选择收藏分类：

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

CADAL相关文献

一种基于半监督学习的DHT网络敏感内容识别方法

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：