版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者单位:国防科技大学
学位级别:硕士
导师姓名:黄芝平;解军成
授予年度:2017年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)]
摘 要:随着定位技术的发展成熟和智能移动终端的极大普及,基于位置的服务得到了快速的发展和应用,随之产生了海量的位置信息。对海量位置信息深入的分析和挖掘已然成为更好实现基于位置服务的一种趋势,具有很好的现实意义和应用价值。对海量位置信息挖掘分析存在存储难度大、计算需求高、挖掘分析难、结果分析繁琐等难题。针对这些难题首先研究了位置信息预处理技术,根据位置信息的时空规则特性改进密度聚类算法,实现了轨迹聚类和噪点剔除;然后研究了空间填充曲线中的Z次序曲线把地球平面空间划分成网格,并设计了网格的VC编码和邻域的求取算法;之后在VC编码的基础上研究了海量位置信息的热点区域提取、热门路径挖掘、序列模式挖掘、伴行模式挖掘等挖掘分析工作,提出了层次聚类的热点区域提取算法、基于VC码的FP-growth和PrefixSpan算法的数据项生成方法、伴行模式挖掘算法等;最后采用旧金山的出租车GPS定位数据对本文算法进行了验证及评估。实验结果表明,本文提出的海量位置信息挖掘算法在与分布式数据库和Spark挖掘平台结合使用的情况下具有较好的挖掘效率,算法运行时间随数据规模基本成线性增长,能够胜任海量位置信息的挖掘任务。