咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >一种结合监督学习的中文文本分类方法 收藏
一种结合监督学习的中文文本分类方法

一种结合监督学习的中文文本分类方法

专利申请号:CN201710642072.X

公 开 号:CN107590177A

发 明 人:刘兴 李晓飞 韩光 

代 理 人:朱小兵

代理机构:32200 南京经纬专利商标代理有限公司

专利类型:发明申请

申 请 日:20180116

公 开 日:20170731

专利主分类号:G06F17/30(20060101)

关 键 词:算法 分类条件 变换矩阵 文本分类 自然语言处理技术 结果准确度 算法表达式 文本相似度 改进 测试文本 迭代更新 分类标准 权重向量 损失函数 训练参数 中文文本 最小距离 随机数 相似度 训练集 收敛 标签 文本 监督 学习 分类 引入 

摘      要:本发明公开了一种结合监督学习的中文文本分类方法,属于自然语言处理技术领域,WMD算法用于文本分类领域时,因分类标准的不同导致特定条件下文本分类的结果准确度较低。为使WMD算法适应不同分类条件,本发明结合监督学习的方法,引入变换矩阵A和初始值为1的权重向量w来改进算法。为了训练参数A,w,利用NCA算法对带标签的训练集进行训练,得到变换矩阵A的初始值,而后利用随机数β对A,w进行迭代更新直到该算法的损失函数收敛。利用最终的A,w改进WMD算法表达式并以此计算文本的最小距离,该距离的大小代表在特定分类条件下待测试文本的相似度的高低。本发明改进了不同分类条件下文本相似度的准确性,具有一定实用价值。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分