咨询与建议

限定检索结果

文献类型

  • 1 篇 期刊文献

馆藏范围

  • 1 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 1 篇 工学
    • 1 篇 计算机科学与技术...
    • 1 篇 软件工程

主题

  • 1 篇 支持向量机
  • 1 篇 特征提取
  • 1 篇 互信息
  • 1 篇 文本分类

机构

  • 1 篇 国立信息与通讯技...
  • 1 篇 上海交通大学

作者

  • 1 篇 井佐原均
  • 1 篇 申红
  • 1 篇 吕宝粮
  • 1 篇 内山将夫

语言

  • 1 篇 中文
检索条件"机构=国立信息与通讯技术研究所计算语言实验室"
1 条 记 录,以下是1-10 订阅
排序:
文本分类的特征提取方法比较与改进
收藏 引用
计算机仿真 2006年 第3期23卷 222-224页
作者: 申红 吕宝粮 内山将夫 井佐原均 上海交通大学计算机科学与工程系 上海200030 国立信息与通讯技术研究所计算语言实验室
文本的特征提取是文本分类过程中的一个重要环节,它的好坏将直接影响文本分类的准确率。该文介绍了词条的χ2统计方法(CHI)、词条与类别的互信息(MI)、信息增益(IG)、词条的期望交叉熵(CE)等文本特征提取方法,并对其取词策略进行了改进... 详细信息
来源: 评论