版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN201910912343.8
公 开 号:CN110781675A
代 理 人:盛安平
代理机构:11111 北京市万慧达律师事务所
专利类型:发明专利
申 请 日:20200211
公 开 日:20190925
专利主分类号:G06F40/289(20200101)
关 键 词:分类 类目 分类模型 分词 文本 方法和装置 分类器模型 分词处理 融合处理 文本分类 训练数据 组合算法 不均衡 分类器 数据量 申请 融合 预测
摘 要:本申请涉及一种文本分类方法和装置,所述方法包括:对文本进行分词处理,提取文本中的分词信息;分别使用第一分类模型和第二分类模型对所述分词信息进行分类预测,分别获得对应的第一分类列表和第二分类列表;将第一分类列表和第二分类列表进行融合处理,获得最终分类列表。本申请的方案提供一种组合算法,融合了两种不同的分类器模型,形成一个适用于大规模类目的以及不均衡训练数据的分类器;适用于数据量大,类目体系复杂,类目数量上万,且类目之间有交叉包含等情况。