版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN202210356737.1
公 开 号:CN115129807A
代 理 人:吴朝阳
代理机构:北京远大卓悦知识产权代理有限公司
专利类型:发明申请
申 请 日:20220930
公 开 日:20220406
专利主分类号:G06F16/33
关 键 词:媒体主题 细粒度分类 分类模型 评论数据 向量化 预处理 数据集 语料 评论 文本 情感倾向 输入结构 占用资源 输出层 正则化 分类 构建 标注 注意力 多头 输出 部署
摘 要:本发明公开了一种基于自注意的社交媒体主题评论的细粒度分类方法,包括:步骤a、对社交媒体主题评论数据进行预处理和细粒度分类标注,得到文本语料数据集,向量化得到向量化文本语料数据集;步骤b、构建基于多头输入结构层、LSTM层、自注意力层、正则化层、分类输出层的分类模型,经多次训练得到训练后的分类模型;步骤c、将待分类的社交媒体主题评论数据进行预处理、向量化后,输入到训练后的分类模型中,输出得到该社交媒体主题评论数据的细粒度分类。本发明具有对社交媒体主题评论进行情感倾向的细粒度分类的有益效果。提供一种基于自注意的社交媒体主题评论的细粒度分类系统,具有占用资源更少,更容易部署在本地的有益效果。