咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >结合类频率的关联中文文本分类 收藏

结合类频率的关联中文文本分类

Integrating Class Frequency Into Association Rules Based Chinese Text Categorization

作     者:钱铁云 王元珍 冯小年 

作者机构:华中科技大学计算机学院数据库与多媒体技术研究所湖北武汉430074 中国电力财务有限公司华中分公司湖北武汉430077 

出 版 物:《中文信息学报》 (Journal of Chinese Information Processing)

年 卷 期:2004年第18卷第6期

页      面:30-36页

核心收录:

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 

基  金:科技部科技电子政务系统关键技术及应用系统的研究资助 (2 0 0 1BA110B0 1) 

主  题:计算机应用 中文信息处理 基于关联的分类 中文文本分类 词类频率 类别特征词集合 

摘      要:该文提出一种词类频率和关联中文文本分类相结合的算法ARCTC。此算法将文档视作事务 ,关键词视作项 ,并针对文本事务的特性 ,提出利用词的类频率筛选与分类相关性不大的词汇 ,然后将改进的关联规则挖掘算法用于挖掘项和类别间的相关关系。挖掘出的规则用于形成类别特征词的集合 ,可用来和类标号未知文档的词的集合求交集 ,交集元素个数最多者即为所分类别。实验证明 ,该算法在提高训练时间和测试时间的同时具有较好的召回率、准确率和F Measure。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分