版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN202110175965.4
公 开 号:CN112818239A
发 明 人:郑礼雄 任彦 曹华平 薛晨 易立 陆希玉 王云荣 窦禹 王一宇 杨昕雨
代 理 人:张晓芳
代理机构:11528 北京恒博知识产权代理有限公司
专利类型:发明申请
申 请 日:20210518
公 开 日:20210209
专利主分类号:G06F16/9535(20190101)
关 键 词:文本集合 文本 计算机存储介质 聚类算法 特征提取 相关装置 用户聚类 关联性 准确率 聚类 预设 申请
摘 要:本申请公开了一种用户聚类方法、相关装置及计算机存储介质,其中,该方法包括:获取多个用户的文本集合;其中,每个用户的文本集合包括至少一个文本;对所述每个用户的文本集合中的至少一个文本进行特征提取,得到所述每个用户的至少一个关键词;基于所述每个用户的至少一个关键词,利用预设的聚类算法对所述多个用户进行聚类,确定所述每个用户所属的类别。由此,本申请实施例可以通过文本中关键词的相似性,提高文本中各关键词之间的关联性,从而提高确定用户所属的类别准确率。