版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN202110644378.5
公 开 号:CN113377912B
代 理 人:盐城市大丰区丰晟知识产权代理事务所(特殊普通合伙)葛潇敏
代理机构:盐城市大丰区丰晟知识产权代理事务所(特殊普通合伙)
专利类型:发明专利
申 请 日:20230630
公 开 日:20210609
专利主分类号:G06F16/33
关 键 词:移动应用 场景 算法 类别标签 小片段 标尺 移动手机用户 自然语言处理 动态调整 偏好矩阵 前后移动 时长序列 使用应用 特征向量 统计计算 长序列 构建 归类 聚类 估算 画像 刻画 量化 衡量 应用
摘 要:本发明公开一种基于自然语言处理的移动手机用户画像建立方法,首先获取移动应用使用序列和对应的使用应用时长序列;对于各移动应用使用序列,根据序列中前后移动应用的不同,动态调整移动应用的量化特征向量;对每个移动应用序列拆分为一系列场景小片段;对所有移动应用场景小片段进行聚类;使用HashingTF算法,估算每个类别各个移动应用的频次,给每个场景类别命名,以此作为衡量使用移动应用行为的标尺;使用som算法和Kmeans++算法,得到每个长序列对应的类别标签;结合场景标尺,统计计算不同类别标签下移动应用使用序列的场景构成的tgi值,以此构建移动应用使用序列的场景偏好矩阵。此种方法可更加精准地对移动应用使用用户进行刻画和描述,实现精准的归类。