咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >一种基于交叉聚合的自动特征生成方法 收藏
一种基于交叉聚合的自动特征生成方法

一种基于交叉聚合的自动特征生成方法

专利申请号:CN202011285295.3

公 开 号:CN112380215B

发 明 人:周楚杰 杨帆 黄馨 

代 理 人:北京山允知识产权代理事务所(特殊普通合伙)胡冰

代理机构:北京山允知识产权代理事务所(特殊普通合伙)

专利类型:发明专利

申 请 日:20230728

公 开 日:20201117

专利主分类号:G06F16/22

关 键 词:时间窗 特征表 迭代 开发效率 人员特征 特征评价 特征生成 自动特征 字段合并 合并 表生成 分箱 聚合 运算 筛选 转换 保留 

摘      要:本发明涉及一种基于交叉聚合的自动特征生成方法,包括:S1,对于待处理的数据表进行分箱并转换二值特征;S2,基于所述二值特征,计算多个特征评价指标;根据指定的特征生成每轮需保留的特征数量m、交叉特征数量n和待交叉特征数量k;从生成的二值特征中挑选k个,从上一次迭代生成的交叉特征中挑选n个;将k个二值特征和n个交叉特征进行交叉运算生成新的交叉特征;从新生成的交叉特征中挑选m个作为本轮迭代生成的交叉特征;S3,将步骤S2中生成的二值特征与数据表原始字段合并;S4,对于每个时间窗来筛选数据;S5,合并所有时间窗生成的特征表;S6,合并所有表生成的特征表。本发明的方法大幅度提高使用人员特征开发效率。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分