版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN202010932371.9
公 开 号:CN112149413A
发 明 人:杨菁林 吴震 贺敏 唐积强 张露晨 林绅文 董琳 马秀娟 施力 张林波 陈梓瑄 潘晓 刘刚 胡晓光 周洋
代 理 人:郭伟刚;邹秋菊
代理机构:44217 深圳市顺天达专利商标代理有限公司
专利类型:发明申请
申 请 日:20201229
公 开 日:20200907
专利主分类号:G06F40/284(20200101)
关 键 词:互联网网站 目标特征向量 文本特征 递归神经网络 卷积神经网络 文本数据 词向量 拼接 计算机可读存储介质 神经网络识别 概率预测 神经网络 输出概率 预测向量 向量化 并联 向量 查找 输出
摘 要:本发明提供一种基于神经网络识别互联网网站所属业态的方法、装置以及计算机可读存储介质。该方法包括:获取互联网网站业态的文本数据集,从所述文本数据集中提取文本特征词;基于所述文本特征词对所述文本特征词进行词向量化以获取词向量序列;将所述词向量序列分别输入递归神经网络及卷积神经网络模型,分别得到所述递归神经网络及卷积神经网络模型输出的目标特征向量,并将所述目标特征向量进行并联拼接;将已拼接的所述目标特征向量输入全连接神经网络,最后输出概率预测向量;查找所述概率预测向量中的最大值,并以所述最大值对应的业态作为所述互联网网站的所属业态。通过本发明,实现了高精度识别互联网网站的所属业态。