版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN201610367978.0
公 开 号:CN106055633A
发 明 人:佟玲玲 杜翠兰 钮艳 易立 李鹏霄 刘洋 查奇文 万欣欣 孙旷怡
代 理 人:田卫平
代理机构:工业和信息化部电子专利中心
专利类型:发明申请
申 请 日:20161026
公 开 日:20160530
专利主分类号:G06F17/30(20060101)
关 键 词:特征集 微博 主客观 分类模型 训练语料 中文 标点符号 个性化特征 支持向量机 测试语句 情感影响 依存关系 语义描述 中文文本 主观 情感词 分类 句法 链接 预设 字数
摘 要:本发明提出了一种中文微博主客观句分类方法,所述方法包括:根据预设的主观句训练语料集和客观句训练语料集形成如下的六个特征集:3‑POS主观模式特征集、句法依存关系特征集、情感词特征集、情感影响因子特征集、语气词及标点符号特征集、字数及链接特征集;根据所述六个特征集,利用支持向量机SVM算法,形成中文微博主客观句分类模型,以利用所述中文微博主客观句分类模型对待测试语句进行主客观句分类。所述方法不但考虑了中文文本的语言学特点,同时也充分利用微博的个性化特征,使得本文所选取的特征更加接近微博本身的语义描述。