咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >文本分类方法和装置 收藏
文本分类方法和装置

文本分类方法和装置

专利申请号:CN201910912343.8

公 开 号:CN110781675A

发 明 人:左赛 魏树桂 王丹丹 赵楠 徐祥朕 

代 理 人:盛安平

代理机构:11111 北京市万慧达律师事务所

专利类型:发明专利

申 请 日:20200211

公 开 日:20190925

专利主分类号:G06F40/289(20200101)

关 键 词:分类 类目 分类模型 分词 文本 方法和装置 分类器模型 分词处理 融合处理 文本分类 训练数据 组合算法 不均衡 分类器 数据量 申请 融合 预测 

摘      要:本申请涉及一种文本分类方法和装置,所述方法包括:对文本进行分词处理,提取文本中的分词信息;分别使用第一分类模型和第二分类模型对所述分词信息进行分类预测,分别获得对应的第一分类列表和第二分类列表;将第一分类列表和第二分类列表进行融合处理,获得最终分类列表。本申请的方案提供一种组合算法,融合了两种不同的分类器模型,形成一个适用于大规模类目的以及不均衡训练数据的分类器;适用于数据量大,类目体系复杂,类目数量上万,且类目之间有交叉包含等情况。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分