版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:绥化学院计算机科学与技术系黑龙江绥化152061 中国科学院成都计算机应用研究所成都610041 中国科学院研究生院北京100039
出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)
年 卷 期:2009年第45卷第17期
页 面:129-132页
核心收录:
学科分类:08[工学] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:四川省科技计划项目(No.2008GZ0003) 四川省科技厅科技攻关项目(No.07GG006-014)
摘 要:目前很多知识库中的领域特征主要依靠专家手工来获得,不但费时费力,而且知识库的质量受专家知识与经验的限制。虽然也存在一些领域特征的自动获取方法,但它们提取的特征集大多存在冗余。因此,较具代表性的领域特征集的有效自动获取成为一个亟待解决的问题。首先分析了一些领域词语自动获取方法的不足,对它们加以改进,然后利用改进方法实现在大规模分类语料中自动获取领域词语的目的,最后利用粗集理论对所得领域词语集进行属性约简,从而得到冗余度低、代表性好的领域特征集。实验验证了所提方法的有效性和实用性。