版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:武汉科技大学计算机科学与技术学院武汉430065 武汉科技大学大数据科学与工程研究院武汉430065 智能信息处理与实时工业系统湖北省重点实验室武汉430065
出 版 物:《计算机应用》 (journal of Computer Applications)
年 卷 期:2025年第45卷第1期
页 面:247-252页
学科分类:1305[艺术学-设计学(可授艺术学、工学学位)] 13[艺术学] 081104[工学-模式识别与智能系统] 08[工学] 0804[工学-仪器科学与技术] 081101[工学-控制理论与控制工程] 0811[工学-控制科学与工程]
基 金:国家自然科学基金资助项目(62071456) 湖北省自然科学基金资助项目(2018CFB575)
摘 要:目前大多数胶囊网络方法通过改进迭代路由的方式提高分类精度,而忽略了迭代路由本身复杂的计算量带来的负担。虽然有方法采用无迭代的路由训练胶囊网络,但是精度不佳。针对以上问题,提出无迭代路由图胶囊网络的场景分类模型。首先,利用简单卷积层提取输入图像的初始特征;接着,提出通道和胶囊间双融合的全局注意力模块,通过依次进行通道和胶囊之间的注意力生成全局权重系数来加权高级胶囊特征,使加权后的高级胶囊特征更具判别性,以突出重要的胶囊,从而提高分类性能;同时,引入能计算图像间相似性的等变正则化项,以建模胶囊网络的显式等变性,从而潜在地提升网络性能;最后,基于边界损失和等变损失的组合损失函数训练整个网络,以得到富于判别性的分类模型。在多个基准场景数据集上的实验结果验证了所提方法的有效性和效率。实验结果表明,所提方法在加拿大高级研究所的10类图像数据集(CIFAR-10)上的分类准确率达到90.38%,与动态路由胶囊网络(DRCaps)方法相比,提高了15.74个百分点;并且在仿射手写数字图像(AffNIST)数据集和航空影像数据集(AID)上,分别取得了98.21%和86.96%的分类准确率。可见,所提方法有效提高了场景分类性能。