船舶异常行为检测是海上航行安全的重要保障,因此对船舶异常行为进行检测研究不仅能够协助海事部门对水域进行更有效的实时监管,而且能够帮助管理人员对水域内的船舶行为进行更清晰的识别,及时发现船舶的异常运动轨迹与船舶异常运动的位置点,提高水域监管效率。本文主要以船舶异常行为为研究对象,采用孤立森林算法来对船舶异常行为检测的问题进行研究。主要研究方法是先对船舶自动识别系统(Automatic Identification System,AIS)提供的原始数据进行预处理,对船舶轨迹点进行简化、分割后利用基于密度的聚类算法(Density-Based Spatial Clustering of Application with Noise,DBSCAN)对船舶轨迹段进行聚类,从聚类结果中选择出异常的轨迹类、把远离正常类典型轨迹的路线判定为异常轨迹。然后在聚类结果的正常类中加工出表征船舶运动特征的六组特征数据,将孤立森林(Isolation Forest,iForest)算法引入船舶异常行为检测。利用iForest算法模型分别计算六组特征数据的异常分值,再运用集成分析和熵权法综合不同的运动特征得分算出最终分值。最后采用测试集评估指标来设定异常运动判断标准,导入验证集数据检验算法有效性。结果表明:实验中已知异常轨迹和异常点的查全率为100%,查全率与查准率受阈值选取的影响较大,算法性能的接收者操作特征曲线(Receiver Operating Characteristic Curve,ROC)较优,曲线下面积(Area Under the Curve,AUC)的值为 0.9883。该方法综合了船舶间的相互影响,使异常检测更加全面,算法更适合海量数据的数据集,能够更好地提高海事部门对船舶的监管效率。本文主要工作成果:(1)从船舶异常行为检测研究结果的角度对船舶异常行为检测进行综述并分类,发现当前船舶异常行为检测的研究中存在异常检测结果单一、大量研究未考虑船舶间相互作用、误报率高等问题。(2)提出了一种结合DBSCAN算法和iForest算法的船舶异常行为检测框架,将检测结果清晰地分为轨迹位置异常、航速异常、航向异常、转向异常、转向率异常、相对距离异常、相对速度异常及其他异常这8种。(3)首次将iForest算法应用于海上交通领域,探讨了这种不用对“正常”行为建模,而是针对异常数据在数据集中的特征来进行船舶异常行为检测的可行性。
暂无评论