版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN202211070750.7
公 开 号:CN115408397A
发 明 人:倪守航
代 理 人:高勇
代理机构:北京集佳知识产权代理有限公司
专利类型:发明专利
申 请 日:20221129
公 开 日:20220902
专利主分类号:G06F16/22
关 键 词:添加数据 预设 内容标识 字符串匹配算法 对照表 预处理 数据表标识符 数据表删除 状态标识符 存储介质 存储资源 分类结果 金融领域 聚类模型 表结构 大数据 数据列 占用率 冗余 合并 应用
摘 要:本发明公开了一种数据表的合并方法、系统、设备及存储介质,可应用于大数据领域或金融领域。其中,方法包括:基于预设字段名对照表和预设字符串匹配算法,对待处理数据表进行预处理,获得待处理数据表中各字段名的内容标识,将各字段名的内容标识作为输入,输入到预设聚类模型中,获得各字段名的分类结果,将待处理数据表中的待添加数据列,添加至与目标数据表标识符对应的目标数据表中,其中,待添加数据列是待处理数据表中,添加状态标识符的内容为允许添加的字段名所在的数据列,在待添加数据列中的数据均添加至目标数据表后,将待处理数据表删除。本发明降低了冗余表结构对存储资源的占用率。