咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于潜在语义分析的中文文本层次分类技术 收藏

基于潜在语义分析的中文文本层次分类技术

Technology of Chinese Documents Multi-hierarchy Categorization Based on Latent Semantic Analysis

作     者:王怡 盖杰 武港山 王继成 

作者机构:南京大学软件新技术国家重点实验室南京大学计算机系江苏南京210093 

出 版 物:《计算机应用研究》 (Application Research of Computers)

年 卷 期:2004年第21卷第8期

页      面:151-154,165页

核心收录:

学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金资助项目 (6 0 0 730 30 ) 国家"86 3"计划基金资助项目 (2 0 0 2AA1170 10 10 ) 

主  题:潜在语义分析 类重心分类 向量空间模型 文本分类 特征向量 

摘      要:从网络文本自动分类的需求出发 ,针对基于VSM模型的分类处理中词条无关假设和词条维度过高等问题 ,对基于类中心向量的分类方法进行了改进。利用LSA分析中的SVD分解获得Web文档的语义特征向量 ,并在此基础上进行分类处理 ,在不损害分类精度的同时提高了分类及其后处理速度 ,并设计实现了一个原型系统。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分