版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者单位:北京邮电大学
学位级别:硕士
导师姓名:邹华
授予年度:2020年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)]
摘 要:如今人们对于身体健康的关注程度越来越高,而且很多穿戴设备都具有了收集一些用户的健康运动相关数据的功能,越来越多的运动数据被收集或者记录。这些数据目前大多仅仅用于执行一些运动数据统计,但这些运动数据中蕴含着能够获取个人身体特征和运动情况的潜在信息,可以使用数据挖掘技术对这些数据进行分析来挖掘这些潜在信息和规律。进一步地如果设置异常规则,可以为用户提供对于个人运动情况的监测服务。本课题旨在设计和实现基于多时间维度的运动数据的分析和监测平台,应用数据挖掘技术,对目前能够获取到的运动数据进行分析。这其中包括对于分离不同运动风格的算法以及对用户未来运动情况的分析和预测的算法。相比较一些传统的收集运动数据的平台,本平台在收集用户数据的基础上,不仅能够对信息进行统计,还具有分析用户数据,对用户运动数据进行异常检测的功能,而且本平台具有比较美观友好的用户交互界面。为了实现本平台,本文首先阐述了本平台的研究背景和意义,明确了需要完成的主要工作并且介绍了论文的结构,对本平台的关键数据分析技术进行了调研、研究和介绍。然后本文明确了本平台的具体功能需求,对主要功能需求中需要解决的关键问题进行了阐述。论文首先提出了一种作为预处理方法的异常数据的检测规则并在运动数据集上进行了分析展示,然后提出一种基于傅立叶变换的聚类算法对用户的运动风格进行分离并且使用自定义的搜索策略来确定聚类簇的数目,实验结果证明该方法比起原始的K-means聚类方法在运动数据集上具有更好的效果。然后提出一种基于双元多层次神经网络和支持向量机的融合模型(Binary Netural Network-SVM)对历史运动数据进行分析并且对于未来的运动趋势做出预测。实验结果证明该方法不仅能够输出多时间维度的预测值,而且比起单一的算法模型具有更高的精确性,并且在对典型用户的分析中发现了天气特征对于运动情况具有较大的影响情况。于是本文还在使用天气特征对未来运动趋势做出修正预测的基础上,使用基于shapley value的特征重要性评估方法对天气和空气质量特征与运动数据的相关性进行可视化展示并分析。在解决了关键问题的基础上,对整个平台的总体架构还有各模块的接口进行了总体设计,并且明确了核心的系统层次交互流程。在此基础上对本分析与监测平台的几个核心模块进行了详细设计,这其中包括类图的设计、方法的设计还有模块内部交互流程的设计。在详细设计完成后,对于系统测试情况进行了详细的说明,这其中包括测试环境的部署情况和单元测试还有集成测试。最后指出了本平台未来需要完成的进一步工作。