版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN201410779142.2
公 开 号:CN104462439A
发 明 人:刘粉香
代 理 人:吴贵明;张永明
代理机构:11240 北京康信知识产权代理有限责任公司
专利类型:发明专利
申 请 日:20150325
公 开 日:20141215
专利主分类号:G06F17/30(20060101)
关 键 词:词语 关联度 文本信息 关联事件 速度和准确性 分词处理 数据提取 词组 关联词
摘 要:本发明公开了一种事件的识别方法和装置。其中,该方法包括:对文本信息进行分词处理得到第一词语和多个第二词语;获取第一词语对应文本信息的第一多维数组和各个第二词语对应文本信息的第二多维数组;使用第一多维数组和各个第二多维数组计算第一词语与各个第二词语的第一关联度数据;按照第一关联度数据提取第二词语,得到第一关联词集合;计算该集合中的各个第三词语与第二词语的集合中的第四词语的第二关联度数据;将符合第二预设条件的第二关联度数据对应的第四词语作为第五词语,得到第一词语的事件词组。通过本发明,解决了现有技术中识别关键词的关联事件的速度慢、准确性差的问题,实现了提高识别关联事件的速度和准确性的效果。