可变形部件模型(deformable part models,DPM)是近年来在VOC目标检测大赛中表现优异的算法之一,曾赢得2007年VOC挑战赛冠军,目前已经成为主流的通用目标检测算法。基于DPM的目标检测方法的基本思想是将目标类别划分为子类别,将目标实例...
详细信息
可变形部件模型(deformable part models,DPM)是近年来在VOC目标检测大赛中表现优异的算法之一,曾赢得2007年VOC挑战赛冠军,目前已经成为主流的通用目标检测算法。基于DPM的目标检测方法的基本思想是将目标类别划分为子类别,将目标实例细分为各个部件,然后通过检测各个部件去判断目标实例的存在,通过分别检测各个子类别去判断目标类别的存在。本文在全面细致地研究学习DPM的基础上,针对行人检测问题提出改进方法,并通过实验验证该方法的有效性。同时,实验显示该方法也适用其它类别的目标检测任务。在学习研究DPM目标检测算法的同时我们将它用于多种目标检测任务的工程实践中,发现DPM目标检测算法虽然有较高的检测精度,却是以较大的计算量为代价,从而限制了它的应用发展。论文主要针对DPM检测速度慢的问题进行研究改进,提出了单点计算模型和快速层定位算法,并以此为基础提出了基于贪婪搜索的DPM检测算法(Greedy DPM)。本文的主要工作和创新点是全面细致地解析了基于DPM的目标检测理论和实现细节。提出单点计算模型,将DPM得分的计算限制在一个点上进行,从而可以对图像局部位置是否存在目标进行快速测试。提出了快速层定位算法,在多层金字塔中迅速定位目标实例所在层,避免了暴力搜索带来的计算负担。在单点计算模型和快速层定位算法的基础上,提出了基于贪婪搜索的DPM检测算法,该算法仅需在传统DPM的基础上增加一个不敏感阈值,从而在面对复杂场景时方便调节参数且具有较好的鲁棒性。
基于视觉的目标检测技术可以被直接地应用到视频监控、安全驾驶、人机交互和互动娱乐等领域中,具有广泛的商业应用价值和市场前景,因而一直是计算机视觉和图像处理领域中的研究热点。近年来,随着科学技术的发展,目标检测技术取得了显著的成果,但是由于目标的变化幅度可能较大和易受到光线、遮挡等影响,导致目标检测技术在较为复杂场景上的表现有所欠缺。主要表现为:目前较好的算法的检测准确性依然较低,检测速度依然较慢,离实际应用有着明显的差距。此外,在目标检测中如何平衡准确性和实时性仍然是个很有挑战性的研究课题。可变形部件模型(Deformable Part Model,以下简称为DPM)最近几年在通用目标检测领域得到了极大的关注。这个检测算法通过描述各个部件和部件间的位置关系来表示目标,在处理目标遮挡和类内变化方面有着良好的效果。在学习和研究DPM目标检测算法时,发现DPM目标检测算法虽然有着较高的检测精度,却是以较大的计算量为代价,从而限制了其应用发展。论文主要针对DPM检测速度慢的问题进行研究改进,提出由粗到精的检测思想和快速搭建特征金字塔算法,并在此基础上对特征金字塔进行分层检测。本文的主要工作和创新点如下:第一、全面细致地讲解了基于DPM的目标检测理论和实现细节。第二、将感兴趣区域提取与DPM目标检测算法相结合,形成由粗到细的目标检测方法,对图片进行预处理,获得适用于DPM的建议窗口,能够大大提高检测速度。第三、针对HOG特征单一的问题,提出多特征互补融合方法来对目标进行检测,提高目标检测的准确性,同时,使用近似值计算方法快速搭建特征金字塔,大大降低了计算特征梯度所带来的计算量负担。第四、在针对滤波器响应方面,提出分层检测算法,利用根模型的特点,快速找出存在潜在目标的特征层,然后再使用部件模型进行匹配,来检测是否存在目标,这样能够避免对每层使用根模型和部件模型进行匹配而带来的计算负担。综上所述,本文针对基于可变形部件模型的目标检测任务进行了学习和研究,并且针对其中存在的检测速度慢和检测精度低等问题,提出相应的优化算法。实验表明,本文有效提升了基于DPM的目标检测的效果,并且在保持良好检测准确性的情况下显著提高了检测速度。
车辆检测算法是智能交通领域的一项重要研究课题,在安全驾驶辅助技术中起着重要作用。因可变形部件模型具有较高的准确率和较好的检测效率,已经被广泛应用到车辆检测领域。在当前形势下,降低被部分遮挡车辆的漏检率问题和降低非车辆的误检率问题一直是基于机器视觉的车辆检测技术中的两大技术难点,车辆检测算法仍然存在着较大提升空间。本文对传统图像检测中基于可变形部件模型的车辆检测算法进行了深入研究,并主要针对降低车辆检测中的漏检率和误检率两个方面问题进行了改进,具体的研究工作如下:(1)在深入分析可变形部件模型原理的基础上,本文创造性地提出了基于双车辆可变形部件模型的车辆检测算法。其基本思想是,首先对图像采用分区域匹配,避免模型与窗口匹配程度低而产生漏检,然后融合匹配结果从而降低车辆检测中多车辆检测情况下被部分遮挡车辆检测的漏检情况。这种双车辆可变形部件模型的车辆检测算法,可充分减少被遮挡车辆漏检概率。实验结果表明:本算法在存在部分遮挡车辆的车辆检测中要优于现有算法,能够满足安全驾驶辅助技术应用中的实用性要求。(2)针对车辆检测中存在的非车辆被误检为车辆的问题,在构建双车辆可变形部件模型的基础上,本文创造性地提出了基于双车辆可变形部件模型和卷积神经网络的车辆检测算法。将深度学习高效提取特征的优势引入到基于视觉的车辆检测领域,从而避免了传统车辆特征提取效率差等问题。本文采用的卷积神经网络就是以深度学习为基础,将可变形部件模型特征提取过程步骤展开,可变形部件模型特征提取层和卷积神经网络的卷积层一一映射,使可变形部件模型重构为卷积神经网络,用卷积神经网络学习到的特征来替换可变形部件模型所使用的HOG特征,使可变形部件模型能够得到更加全面的车辆特征,从而降低车辆误检率。实验结果表明:本算法在车辆的检测中能够进一步降低车辆被误检的概率,使车辆检测算法更加完善。本文训练基于双车辆可变形部件和卷积神经网络的车辆检测模型,并在江苏大学“江大智能行”号无人驾驶汽车平台进行算法的试验验证。源代码为VS2008工程文件形式,操作系统为Win7 64位操作系统,开发工具为Microsoft visual studio 2008、Matlab2012a。
行人检测近几年已成为模式识别发展的一个重要领域。首先,行人检测的应用领域十分广泛,在人机交互、智能监控摄像头及移动智能设备上面都有着重要的应用。其次,行人检测也是当前物体检测领域的一个难点所在。由于行人和刚性物体不同,在不同角度和不同姿态下变化非常大,并且自然场景中行人的位置具有任意性,与物体发生遮挡具有随机性。这些都严重影响了行人检测的实际效果,进而制约着智能移动设备和智能摄像头的用户体验。可变形部件模型(Deformable Part Model,DPM)是近年来比较流行的行人检测算法之一,该模型是在梯度方向直方图特征(Histograms of Oriented Gradients,HOG)和支撑向量机分类器(Support Vector Machine,SVM)的基础上进行了扩展,划分出根分类器和部件分类器,其中根分类器的位置可以判定滑动窗口中的物体的大体轮廓,而部件分类器的作用是通过进一步的细节特征判断窗口是否为行人部件,这样由粗糙到精细的检测策略达到了良好的检测效果。本文在可变形部件模型的基础上,充分考虑到不同部件分类器的投票权重的关系,提出了一种加权的可变形部件模型的方法。同时,本文还提出了一种通过根分类器和滑动窗口卷积和分割来判断遮挡位置的策略,然后调整遮挡部分和非遮挡部分的部件分类器的权重,这种策略能一定程度上提高检测的准确率。本文的主要贡献如下:(1)充分分析了DPM模型的根分类器和部件分类器之间的关系,提出了基于权重可变的部件分类器模型;(2)充分分析了根分类器和滑动窗口特征向量的关系,判断滑动窗口中的遮挡位置信息,根据信息进行权重调整;(3)在INRIA行人数据库中进行验证,基于加权的DPM模型的方法的检测率高于传统方法。
计算机科学的兴起,促进了模式识别以及机器学习等领域的理论研究和实际应用。行人检测作为该领域研究的重点,复杂的检测环境及其较大的非刚体特性,给其大范围应用带来了极大的挑战。相较于正常光照环境下的行人检测效果,现有算法在背景多样、前景遮挡以及雾霾等受光照影响较大的复杂工况下性能严重下降。如果直接对雾霾等复杂工况下采集的图像进行目标检测会产生比较严重的误检和漏检。因此,针对这一问题,本文提出了一种基于可变形部件模型的雾霾环境下的行人检测算法来提升雾霾环境下行人检测的效率。主要研究内容如下:首先,雾霾图片的判定研究。通过对大量相同环境下的清晰图片和雾霾图片进行综合对比,发现它们在均方差、峰值信噪比、结构相似性以及信息熵等参数方面存在明显的差异。以图像信息熵为质量评价指标,将输入图像的信息熵与设定阈值进行比较,进而决定是否需要去雾操作。实验表明,该方法能有效对输入图像的雾霾进行鉴定判别。其次,雾霾图片去雾清晰化研究。目前,图像去雾技术主要包括以数学建模为基础的图像复原技术和基于人体视觉的图像增强技术。通过比较Retinex、暗通道先验(Dark Channel Prior,DCP)等经典去雾算法的去雾效果,本文以DCP算法为基础,改进了算法中全局光照强度推算流程,使去雾过程中出现的色斑和失真现象得到了解决。同时对输入图像进行下采样操作间接改进了透射率的求解过程,从而达到了提升去雾效率的目的。改进后的去雾算法为雾霾环境下行人的检测与定位奠定了基础。最后,基于可变形部件模型(Deformable Part Model,DPM)的雾霾环境下的行人检测算法的研究。本文对比了HOG+SVM、Haar+Adaboost、DPM等这几种行人检测算法在雾霾行人数据集上的检测效果。针对DPM检测速度慢这一不足,本文在DPM算法的基础上,采用区域建议法来代替传统的滑动窗口,减少了目标检测过程中特征图以及候选窗口的数量。并将其与改进的DCP去雾算法进行融合,得到一种在雾霾环境下提高行人检测精度的同时也能有效提高检测速度的解决方案。实验结果表明,本文算法在雾霾环境下的行人检测精度达到了由初始的76.64%提升到89.94%,基本满足了实际应用的需求。
暂无评论