一种结合监督学习的中文文本分类方法-内蒙古大学图书馆

文献详情 >一种结合监督学习的中文文本分类方法收藏

一种结合监督学习的中文文本分类方法

专利申请号：CN201710642072.X

公开号：CN107590177A

发明人：刘兴李晓飞韩光

代理人：朱小兵

代理机构：32200 南京经纬专利商标代理有限公司

专利类型：发明申请

申请日：20180116

公开日：20170731

专利主分类号：G06F17/30(20060101)

关键词：算法分类条件变换矩阵文本分类自然语言处理技术结果准确度算法表达式文本相似度改进测试文本迭代更新分类标准权重向量损失函数训练参数中文文本最小距离随机数相似度训练集收敛标签文本监督学习分类引入

摘要：本发明公开了一种结合监督学习的中文文本分类方法，属于自然语言处理技术领域，WMD算法用于文本分类领域时，因分类标准的不同导致特定条件下文本分类的结果准确度较低。为使WMD算法适应不同分类条件，本发明结合监督学习的方法，引入变换矩阵A和初始值为1的权重向量w来改进算法。为了训练参数A，w,利用NCA算法对带标签的训练集进行训练，得到变换矩阵A的初始值,而后利用随机数β对A，w进行迭代更新直到该算法的损失函数收敛。利用最终的A，w改进WMD算法表达式并以此计算文本的最小距离，该距离的大小代表在特定分类条件下待测试文本的相似度的高低。本发明改进了不同分类条件下文本相似度的准确性，具有一定实用价值。

本地馆藏 | 借阅须知 | 我要预约

已订购，未入库

sda

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

CADAL相关文献

一种结合监督学习的中文文本分类方法

读者评论与其他读者分享你的观点

请选择收藏分类：

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

CADAL相关文献

一种结合监督学习的中文文本分类方法

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：