版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN201910886029.7
公 开 号:CN110633301B
发 明 人:宋晗
代 理 人:济南信达专利事务所有限公司姜明
代理机构:济南信达专利事务所有限公司
专利类型:发明专利
申 请 日:20230602
公 开 日:20190919
专利主分类号:G06F16/2455
关 键 词:抽取数据 引擎 数据规则 追溯 重现 数据抽取过程 定位数据 海量数据 基础数据 数据抽取 随机抽取 运行过程 抽取 概率 保证
摘 要:本发明公开了一种基于引擎设置抽取数据的方法及系统,属于数据抽取技术领域。本发明的基于引擎设置抽取数据的方法基于海量数据,按照数据规则设置进行数据随机抽取,保证数据规则设定的基础数据内的全部数据被抽中的概率一致,同时运行过程重现和过程追溯。该发明的基于引擎设置抽取数据的方法在数据抽取过程中能够快速的定位数据并进行抽取,同时允许过程重现,过程追溯,具有很好的推广应用价值。