从GPS轨迹点序列中识别停留点,是轨迹分析的重要预处理步骤,是用户行为分析、个性化兴趣点推荐等位置服务的基础,停留点识别方法的识别能力对位置服务的可用性和可靠性有着根本性的影响.针对现有方法未考虑轨迹点的时间连续性或仅考虑时间连续性的一个方向所导致的停留点识别能力不足的问题,本文提出一种新的基于密度的停留点识别方法(Stay Point Identification based on Density,SPID).该方法考虑了轨迹点的时空聚集,兼顾了轨迹点的时间连续性和方向性.在GeoLife数据集上的实验结果验证了该方法的识别能力强于基准方法,可以进一步识别基准方法不能识别的两类停留点.
基于语义抽取的机器阅读理解是目前人工智能与大数据相结合的热点应用之一。针对复杂多文本机器阅读理解任务中的语义理解与答案提取问题,提出一种结合外部知识的动态多层次语义理解与答案抽取模型。首先,利用改进的门控单元循环神经网络匹配文本内容与问题集;然后,分别在向量化文本内容及问题集上实施多维度动态双向注意力机制分析,提高语义匹配精度;接着,利用动态指针网络确定问题答案范围,改进网络模型语义匹配效率,降低答案提取冗余度;最后,结合外部知识与经验改进候选答案精准性排序,得到最终答案。实验以Wikilinks 数据作为外部知识,在主流MS-MARCO英文数据集与DuReader 中文数据集上进行测试分析,并与ReasoNet、FastQAEXT、R-Net、S-Net、Verification model 等主流模型进行对比,本文模型语义匹配与答案提取精度显著提升。同时,对不同领域的复杂文本阅读理解任务具有较高鲁棒性。
暂无评论