版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN202310945859.9
公 开 号:CN116681086A
发 明 人:邓理平
代 理 人:龚秀亮
代理机构:深圳市恒程创新知识产权代理有限公司
专利类型:发明专利
申 请 日:20230901
公 开 日:20230731
专利主分类号:G06F40/30
关 键 词:字段 敏感词 分级 关联矩阵 数据分级 二维表 相似度 词库 存储介质 方式构建 数据治理 文本语义 敏感 准确率 构建 聚合 匹配 运算 转换
摘 要:本发明涉及数据治理技术领域,并公开了一种数据分级方法、系统、设备及存储介质,该方法包括:构建敏感词库,并确定敏感词库中敏感词字段的敏感词字段级别;通过文本语义匹配的方式构建待分级字段和敏感词字段的相似度关联矩阵;基于敏感词字段、敏感词字段级别和待分级字段将相似度关联矩阵转换为目标二维表;根据目标二维表中敏感词字段级别进行聚合运算,获得待分级字段各分级级别对应的得分值;通过得分值确定待分级字段对应的分级级别。相比现有技术,本发明有效提高了数据分级的准确率和效率。