针对引线框架表面不规则缺陷难以进行准确检测的问题,提出一种融合注意力和多级残差的引线框架表面缺陷检测方法。首先,提出一种多尺度全局注意力模块,通过捕获缺陷边缘区域的通道和空间信息,进一步获取引线框架全局信息以提高分割精度。其次,为了实现缺陷信息的多尺度融合,设计一种多级残差融合注意力网络模块,提取表面划痕缺陷的全局语义信息。此外,编码器采用平滑最大化单元(smooth maximum unit,SMU)激活函数,以改善检测时的细节缺失现象。对比实验结果表明,所提引线框架表面缺陷检测方法的平均交并比(mean intersection over union,MIoU)指标在自制引线框架表面缺陷数据集上,相比于4种典型方法分别提升了25.05%、26.79%、12.11%、21.02%;消融实验证明所提检测方法具有较好的缺陷检测性能,能获得更多的有效缺陷信息。
人脸图像年龄估计已经成为人机交互和计算机视觉领域中一项非常重要的任务,具有广泛的实际应用价值。针对目前人脸图像年龄估计准确度较低的问题,本文提出了一种基于深度多级残差网络和较大数据集微调的人脸年龄估计方法,以提高人脸图像年龄估计的准确度。首先,本文介绍了五种典型的卷积神经网络模型,并对其原理及网络结构进行详细的描述。为进一步提高模型的学习能力,抑制梯度消失,本文在残差网络的基础上构建了多级残差网络模型,用其作为基础卷积神经网络模型解决人脸年龄估计准确度较低的问题;其次,本文提出人脸图像年龄估计方法框架,先在ImageNet数据集上对深度多级残差网络预训练,使网络学习基本图像特征表达;再构建IMDB-WIKI-101数据集微调深度多级残差网络,实现一般物体图像到人脸年龄图像的迁移学习,使模型适应于人脸图像年龄估计,减少过拟合并提高网络学习能力;然后,考虑到人脸图像年龄估计准确度受性别影响,同龄男女呈现的人脸图像特征不同。与一般物体图像相比,各年龄组图像之间存在时序关系。因此,在年龄组分类时采用了两种特殊的训练方法:性别预训练与特定权重损失层。此外,为减少过拟合现象,在网络训练时加入随机深度算法。最后,本文详细介绍了三种年龄估计的评估指标,并对Adience、MORPH Album2和FG-NET三种人脸图像数据集进行了描述。年龄估计可以分为年龄分类和年龄回归两类,采用本文提出的方法对Adience数据集进行年龄组分类,获得目前最高的单一分类准确度和1-off准确度,分别为67.74%和97.52%;在MORPH Album 2和FG-NET两种数据集上利用深度期望算法进行年龄值估计,分别获得目前最好的年龄平均绝对误差值2.34年和2.17年。本文利用152层多级残差网络在三种数据集上均获得了目前最好的年龄估计结果。实验结果表明,结合深度多级残差网络和大规模数据集微调,能有效提高人脸图像年龄估计准确度。
暂无评论