版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN201110317014.2
公 开 号:CN102509001A
代 理 人:徐文权
代理机构:61200 西安通大专利代理有限责任公司
专利类型:发明申请
申 请 日:20120620
公 开 日:20111018
专利主分类号:G06F19/00(20110101)
关 键 词:值点 数据分析结果 时序数据 方差 聚类 参数配置模块 数据格式转换 多种数据 分析精度 固有特征 数据分析 数据清洗 图形视图 先验条件 专家知识 自动识别 对数据 失效性 数据集
摘 要:本发明提供了一种对时序数据野值点进行自动去除的方法。本发明所述野值识别方法可以通用多种数据,即对于不同形态的参数,可以使用同一野值识别规则,降低专家知识等先验条件的影响。该方法包括识参数配置模块,识别数据集的载入、数据格式转换及清洗模块,基于方差的密度聚类野值点识别模块,和野值点识别结果的解释模块及数据分析结果图形视图组件、用户交互组件等必须组件。该方法利用基于方差的密度聚类,结合时序数据的固有特征,进行野值点自动识别。从而帮助数据分析人员进行数据清洗,减少野值数据对数据分析精度,判定结果的影响,避免了数据分析结果的失效性。