RFID(射频识别)技术以其非接触式识别的特点得到了越来越广泛的应用。每种应用的实现都会形成一个庞大的市场,可以说RFID技术的应用已成为当今推动经济增长的一个重要引擎。RFID中间件作为RFID应用系统的核心,直接关系到RFID技术的应用成效,受到了学者和业界的广泛关注。其中RFID数据的清洗已成为RFID中间件的核心功能,RFID数据清洗的效率和质量直接影响着RFID应用系统的服务水平。这是因为现实中复杂多样的应用环境,会造成大量的不可靠数据,这些不可靠的数据严重影响了RFID应用系统的服务性能和质量。因此,本文重点研究了基于RFID中间件的数据清洗算法。首先,本文研究扩展设计了一种基于EPCGlobal标准的RFID轻量级中间件,并较详细地说明了其中数据清洗功能模块的设计。现有的RFID中间件无法完美契合本文所要结合使用的两种数据清洗算法。为了得到更好的数据清洗效果,本文根据两种算法所适用的清洗场景扩展设计出了合适的RFID中间件。该中间件分为三个模块:设备适配模块,数据处理模块,事务处理模块。其中数据处理模块又分为三个部分:数据预清洗模块,数据缓存队列,数据清洗模块。在数据处理模块中嵌入本文研究改进的两种算法用于清洗不同级别的脏数据。其次,研究改进了一种适用于单标签环境下清洗漏读数据和冗余数据的算法。现有的单标签数据清洗算法无法综合清洗多种脏数据而且清洗效果不甚理想。为了更好地解决单标签情况下漏读数据和冗余数据的清洗问题,本文通过对基于二项分布式模型的单标签清洗算法SCBD的剖析,设计了一种改进的SCBD单标签清洗算法GSCBD。通过对标签级数据清洗算法SMURF(Statistical Smoothing for Unreliable RFID data)、SCBD和GSCBD比对实验与结果分析,验证了改进后的GSCBD算法比SMURF和SCBD算法在标签级冗余数据和漏读数据清洗方面获得更好的清洗效果。最后,针对RFID数据流中阅读器级别的冗余数据清洗问题,研究设计了一种改进的基于时间戳的排序相邻数据清洗算法(SNM‐TS)。目前解决重复数据问题的算法大多是基于排序/合并的思想。把这种解决重复数据问题的算法引入到RFID数据流冗余数据的清洗中,有不能完全适用于RFID环境的问题。针对RFID数据的特点,对SNM(Sorted Neighborhood Method)进行了改进研究,使之更适用于RFID环境下冗余数据的清洗。通过仿真实验及结果分析,验证了SNM‐TS算法在获得高质量RFID数据的同时有效地提高了数据清洗的效率。
暂无评论