针对路面缺陷形态侧向狭窄、尺度多变和长程依赖特性导致检测精度低和漏检率高的问题,提出基于YOLOv8_n改进的强化形态感知的路面缺陷检测算法。首先,在主干网络融合阶段提出边缘增益聚焦模块(EEFM),采用条形池化核捕捉定向和位置感知信息并强化深层特征的边缘细节,增强细长特征的表达能力。其次,设计双链特征重分配金字塔网络(DCFRPN),重构融合方式,提供大范围感知和丰富定位信息的多尺度特征,提升对多尺度缺陷的融合能力。此外,构造形态感知任务交互检测头(MATIDH),增强分类与定位之间的任务交互,动态调整数据表征,融合多尺度带状卷积,优化细长缺陷的分类和回归。最后,提出PWIoU(Penalized Weighted Intersection over Union)损失函数,动态分配不同质量预测框的梯度增益,优化Box框的回归方式。实验结果表明,在RDD2022数据集上,所提算法相较于基线的精确率和召回率分别提升3.5和2.3个百分点,平均精度均值在50%交并比阈值下的值提升3.2个百分点,验证了所提算法的有效性。
针对视觉结构类似导致的文种相似性问题,基于局部三值模式的相邻共生矩阵(co-occurrence of adjacent local ternary patterns,CoALTP)提出一种具有判别性和鲁棒性的局部三值模式的相邻共生矩阵(discriminant and robust co-occurrence ...
详细信息
针对视觉结构类似导致的文种相似性问题,基于局部三值模式的相邻共生矩阵(co-occurrence of adjacent local ternary patterns,CoALTP)提出一种具有判别性和鲁棒性的局部三值模式的相邻共生矩阵(discriminant and robust co-occurrence of adjacent local ternary patterns,DRCoALTP)方法,用于获取图像纹理。计算文档图像的相邻稀疏局部三值模式(adjacent sparse local ternary patterns,ASLTP),将采样点数量设定为8,以便获得详细的局部纹理,设计出一种基于自适应中值滤波思想的半自适应阈值方法,用于提取灰度图像中心像素周边对角邻域像素的编码值。ASLTP在邻域像素位置存放稀疏局部三值模式(local ternary patterns,LTP)的值,提取灰度共生矩阵(gray-level co-occurrence matrix,GLCM),从4个方向统计使用ASLTP后灰度图像像素之间的频率关系。该算法在阿拉伯文、俄文、简体中文、哈萨克文、藏文、蒙古文、土耳其文、维吾尔文、英文、吉尔吉斯斯坦文和塔吉克斯坦文11个文种的自建印刷体文档图像数据集中验证。试验结果表明,相较于基线和先进的纹理方法,改进后的方法更具判别性,平均识别准确率为99.14%。为改善CoALTP方法可能产生低效分类特征的问题,提出半自适应阈值方法,有效提高识别率并抑制噪声。此外,针对算法产生的高维特征,采用基于均方差的特征选择方法,通过支持向量机(support vector machine,SVM)分类器特征选择后,识别速度提高284%,对11个文种的平均识别准确率达99.44%。
暂无评论