版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN202011285295.3
公 开 号:CN112380215B
代 理 人:北京山允知识产权代理事务所(特殊普通合伙)胡冰
代理机构:北京山允知识产权代理事务所(特殊普通合伙)
专利类型:发明专利
申 请 日:20230728
公 开 日:20201117
专利主分类号:G06F16/22
关 键 词:时间窗 特征表 迭代 开发效率 人员特征 特征评价 特征生成 自动特征 字段合并 合并 表生成 分箱 聚合 运算 筛选 转换 保留
摘 要:本发明涉及一种基于交叉聚合的自动特征生成方法,包括:S1,对于待处理的数据表进行分箱并转换二值特征;S2,基于所述二值特征,计算多个特征评价指标;根据指定的特征生成每轮需保留的特征数量m、交叉特征数量n和待交叉特征数量k;从生成的二值特征中挑选k个,从上一次迭代生成的交叉特征中挑选n个;将k个二值特征和n个交叉特征进行交叉运算生成新的交叉特征;从新生成的交叉特征中挑选m个作为本轮迭代生成的交叉特征;S3,将步骤S2中生成的二值特征与数据表原始字段合并;S4,对于每个时间窗来筛选数据;S5,合并所有时间窗生成的特征表;S6,合并所有表生成的特征表。本发明的方法大幅度提高使用人员特征开发效率。