随着位置定位技术和无线通信技术的快速发展,越来越多的智能移动终端等定位设备能够记录移动对象的运动轨迹,因此人们能够收集大量的时空轨迹数据。时空轨迹渐变移动簇模式挖掘是时空轨迹模式挖掘的重要组成部分,可广泛应用于城市规划、生物保护和动物移动习性研究等方面。针对目前已有的渐变移动簇模式挖掘相关算法的不足,本文从模式挖掘的有效性和效率进行研究,取得如下研究成果:1.提出了基于ClusterGrowth算法的时空轨迹渐变移动簇模式并行挖掘算法PTRGCP(Parallel algorithm for mining Time Relaxed Gradual Clustering Pattern),该算法利用Spark框架并行挖掘渐变移动簇模式。将所有采样点划分为多个具有不同时间戳的采样点集合,并对每个采样点集合进行并行聚类。将聚类得到的簇对应的时间戳上时间信息转换成对应的序列号,相同序列号的簇被划分到同一个计算节点上,通过交集操作确定具有包含关系的簇序列,最后,将所有的簇序列收集到主节点上,并输出最大有趣渐变移动簇模式,实验结果表明,算法PTRGCP具有良好的有效性和效率。2.为了提高算法PTRGCP的效率,提出了基于网格索引的时空轨迹渐变移动簇模式并行挖掘算法 PTRGCP-G(Parallel algorithm for mining Time Relaxed Gradual Clustering based on Grid index)。该算法在聚类过程中通过建立网格索引提高聚类算法中的空间查询效率,从而提高渐变移动簇模式的挖掘效率,实验结果表明,算法PTRGCP-G比算法PTRGCP效率高。3.提出了时空轨迹渐变移动簇模式增量挖掘算法ITRGCP(Incremental updating Time Relaxed Gradual Clustering pattern),该算法用于更新时空轨迹渐变移动簇模式。对时空轨迹数据执行去噪和轨迹插值等预处理操作,然后通过IncrementalDBSCAN算法进行增量聚类。通过对历史渐变移动簇模式和新得到的簇执行交集操作,得到现有渐变移动簇,最后输出所有的渐变移动簇模式。实验结果表明,算法ITRGCP是有效的。4.为了提高算法ITRGCP的效率,提出了基于Spark并行计算框架的PITRGCP(Parallel algorithm for Incremental updating Time Relaxed Gradual Clustering pattern)算法,用于并行更新时空轨迹渐变移动簇模式,将时空轨迹数据转换为键值对的形式,其中键为采样点的时间戳,值为采样点的经纬度。将具有相同时间戳的采样点并行划分到多个具有不同时间戳的采样点集合。采样点集合IncrementalDBSCAN聚类算法进行并行聚类。将簇集中于主计算节点,且广播到其他所有的计算节点。将原有的模式输入到计算集群中。通过增量交集算法更新现有的渐变移动簇模式。实验结果表明,算法PITRGCP比算法ITRGCP效率更高。
近年来,随着全球定位技术、无线通信以及电子数码产品的发展,越来越多具有定位功能的车载设备和手持设备得到广泛普及,使得人们能够以较高时空分辨率记录移动对象的位置信息,并且产生大量时空轨迹数据。时空轨迹异常检测是时空轨迹模式挖掘中的一个重要研究内容,可广泛应用于交通规划与监测、自然现象分析等领域。为了解决海量时空轨迹的异常检测问题,本文利用云计算环境中的MapReduce并行计算模型实现时空轨迹异常检测,取得以下研究成果。1.提出了两种基于TRAOD算法的异常轨迹并行检测算法PTRAOD(Parallel algorithm for TRAjectories Outlier Detection)和GPTRAOD(Grid-based Parallel algorithm for TRAjectories Outlier Detection). PTRAOD算法利用MapReduce并行编程模型,在各个计算节点并行地检测轨迹段是否异常,然后对各个节点检测出的异常轨迹段进行合并,并计算异常轨迹段占整条轨迹的长度比例阈值。在检测异常轨迹段的过程中,为了减少不必要的轨迹段相似性计算,提出了利用网格索引的GPTRAOD算法,该算法通过建立网格索引,实现区域查询,减少轨迹段相似性计算的候选集,从而减少计算量。2.提出了一种基于TOP-EYE算法的异常轨迹并行检测算法PDAT-TOP(Parallel Detecting Anomalous Trajectories based on TOP-EYE)。该算法利用MapReduce编程模型,将轨迹进行分组,并使得分组均衡,由各个计算节点并行地采用基于演化计算的方式检测异常轨迹,从而提高算法效率。实验结果表明PDAT-TOP算法具有较好的可扩展性和加速比。3..提出了一种新的用于检测兴趣区域间异常轨迹的算法DATIR(Detecting Anomalous Trajectories between Interest Regions),不同于已有的从局部采样点进行检测的算法,DATIR算法综合考虑了轨迹的局部特征和全局特征,利用聚类方法检测兴趣区域间的标准路径和异常轨迹。为了提高海量轨迹数据的异常检测效率,在DATIR算法的基础上,提出了一种并行检测算法PDATIR(Parallel algorithm for Detecting Anomalous Trajectories between Interest Regions)。实验结果表明,DATIR算法能够有效地检测兴趣区域间的异常轨迹,且PDATIR算法在大数据集上显示出了明显的性能优势。
暂无评论