一种对缺失数据进行恢复处理的方法,涉及一种计算机数据处理方法,该方法按照 k NN规则,通过提取工业中完整的数据集,计算出缺失样本相应的 k 个近邻,即满足阈值条件下或者控制限下的样本,用于提取在缺失数据样本局部信息中缺失数...
详细信息
标准号:
CN104461772A
一种对缺失数据进行恢复处理的方法,涉及一种计算机数据处理方法,该方法按照 k NN规则,通过提取工业中完整的数据集,计算出缺失样本相应的 k 个近邻,即满足阈值条件下或者控制限下的样本,用于提取在缺失数据样本局部信息中缺失数据的相关信息。应用误差最小化准则,计算该缺失数据的近邻样本的权重。得到权值后,对相应的近邻样本进行加权重构,重构出缺失的数据点,从而完善了数据的完整性。使得计算机的运行时间大大缩短,提高了运行效率,降低了噪声的影响,提高了补值的精确度。该方法能够有效的提取工业中完整数据集中的相关信息。
暂无评论