版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN202310763406.4
公 开 号:CN116975629A
代 理 人:王英;阎敏
代理机构:北京易光知识产权代理有限公司
专利类型:发明专利
申 请 日:20231031
公 开 日:20230626
专利主分类号:G06F18/214
关 键 词:映射关系文件 目标样本 数据记录 特征文件 数据处理领域 待处理数据 人工智能 标记结果 处理数据 存储介质 第一数据 电子设备 流式处理 数据特征 同一对象 数据处理 大数据 云计算 匹配 传输 合并
摘 要:本公开提供了数据处理方法、装置、电子设备及存储介质,涉及数据处理领域,尤其涉及大数据、云计算、人工智能等技术领域。具体实现方案为:将来源于第一特征文件的数据记录和来源于映射关系文件的数据记录进行合并,得到待处理数据集;对待处理数据集和目标样本集中的多条数据记录,按照数据记录的来源,以及目标样本集中和映射关系文件的匹配情况进行标记,得到第一标记结果集;进而确定出目标样本集在第一特征文件的第一数据特征。本公开基于流式处理方式对第一特征文件、目标样本集和映射关系文件进行标记,通过标记的方式来同一对象在不同标识下的数据特征,该方式简单易行,不需要传输整个映射关系文件,适于处理大批量的数据。