版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN201811290174.0
公 开 号:CN111125354A
发 明 人:徐文斌
代 理 人:赵囡囡;董文倩
代理机构:11240 北京康信知识产权代理有限责任公司
专利类型:发明专利
申 请 日:20200508
公 开 日:20181031
专利主分类号:G06F16/35(20190101)
关 键 词:待分类文本 向量 深度分类 分类结果 文本分类 文章表示 句子 词语 文本 预处理 分类处理 分类效果 训练学习 训练样本 传统的 向量化
摘 要:本发明公开了一种文本分类方法及装置。其中,该方法包括:通过对文本进行预处理,得到待分类文本;将上述待分类文本输入至目标深度分类模型,其中,上述目标深度分类模型通过训练学习已标识观点类别的训练样本确定;依据上述目标深度分类模型对上述待分类文本进行向量化表示,确定上述待分类文本的词语表示向量、句子表示向量和文章表示向量,并基于上述词语表示向量、上述句子表示向量和上述文章表示向量对上述待分类文本进行分类处理,确定上述待分类文本的分类结果,其中,上述分类结果至少包括:观点类别。本发明解决了传统的文本分类方案分类效果较差,导致无法准确确定文本的实际观点类别的技术问题。