人口流动是诸多社会现象的驱动力,如传染病传播、经济发展、文化交流、环境变化、交通需求等。挖掘人口流动时空演化模式并分析其空间相互作用规律,刻画人口流动影响因素并构建合适的人口流动预测模型对于社会发展稳定具有重要意义。目前,有关人口流动研究的主要数据来源为人口普查或抽样调查数据等静态数据,难以有效表征大规模人口流动的时空特征和支撑数据驱动方法进行人口流动相关研究。此外,如何基于人口流动的时序特征挖掘人口流动的隐藏驱动机制,并进行权重人口流动网络高精度重构研究还少见报道。针对以上问题,本文基于百度LBS(Location Based Service,基于位置服务)数据和国内某运营商提供的手机定位数据,围绕“如何使用数据驱动方法刻画人口流动特征”,“如何挖人口流动隐藏驱动机制”以及“如何定量分析社会环境、地理环境和人口特征等多方面因素对人口流动的影响”三个科学问题展开研究,并提出了基于神经网络算法的人口流动网络重构方法,实现了区域间人口流动强度高精度预测和权重人口流动网络重构。本文的主要研究工作及创新点包括:1)基于百度LBS数据,挖掘分析了我国人口流动的时空特征及其演化模式。针对现有研究缺乏准确、完整和高时空分辨率的人口流动时序数据问题,本文创新地使用了百度LBS数据对我国人口流动时空特征及其演化模式进行挖掘,有效解决了已有研究对我国季节性人口流动流量时序变化特征、空间分布格局以及时空演化模式三方面的认识不足问题。研究发现,我国人口流动在时间上存在明显的周期效应,以及节假日前后的跨城市人口流动存在强烈的“回流”效应;人口流动网络空间分布格局存在较强的空间聚集效应;不同时期内的人口流动网络空间分布格局存在较大差异。2)为揭示人口流驱动机制,本文基于传统物理启发式人口流动模型,提出了“距离—吸引力指数”模型和隐藏机制挖掘方法。首先,对比总结了现有人口流动预测模型背后的数学机理及其特点,并分析不同人口流动模型与不同时空尺度下的人口流动现象之间的联系;接着,提出了量化人口出行机制演化的“距离—吸引力指数模型”;最后,利用现有介入机会类模型证明了不同时期下的流动人口目的地选择机制差异。在此基础上,结合各时期实际人口流动特点进行分析,证明了本方法的有效性和可靠性。3)定量刻画了人口特征、地理与社会环境因素对我国人口流动的影响。本文采用相关系数矩阵和统计描述等方法,定量刻画了社会环境、地理环境特征和人口特征对人口流动的影响。社会环境因素变量与各地级市人口流入、流出及净流量间的相关性分析结果表明,第一、第三产业占比是影响人口净流入的主要因素;在地理特征维度,不同等级城市间的人口流动存在明显的“递进现象”,即五线城市人口主要流向四线城市、四线城市主要流往三线城市(以此类推)的逐级补充现象;在人口特征方面,随着年龄的增加,移动人口旅行距离逐渐缩短,即在中远距离人口流动中19-39岁区间的青壮年人口相对比例较高,而39-59岁区间的中老年人主要在中近距离地区进行移动。4)针对现有人口流动模型预测精度低、适应性弱等缺陷,提出了基于深度神经网络的人口流动网络重构方法。本文综合考虑了城市经济、教育、医疗、地理特征等因素,提出了基于深度神经网络的人口流动网络重构框架(HMNR,Human Mobility Network Reconstruction by Deep Neural Network)与人口流量预测模型(HMPDNN,Human Mobility Prediction by Deep Neural Network)。实验结果证明,HMNR能够以0.658以上的网络相似度重构人口流动权重网络;HMPDNN模型在不需要获取各地人口总流出的前提下,大幅度地提高了预测准确率,均方误差RMSE为RMSE=841.783,仅为传统模型中预测效果最好的引力模型的四分之一不到,这表明本文提出的方法和模型具有较高的预测精度和泛化能力,是对传统人口流动预测模型的一种有效补充。同时,该方法将为人口流动网络建模以及其他网络的链路预测相关研究提供有效的科学借鉴,以及国家经济发展和社会进步相关政策的制定提供科学的辅助决策支持。
暂无评论