针对各种环境声音对声音事件识别的影响,提出一种基于优化的正交匹配追踪(OOMP)和深度置信网(DBN)的声音事件识别方法。首先,利用粒子群优化(PSO)算法优化OMP稀疏分解,在实现正交匹配追踪(OMP)的快速稀疏分解的同时,保留声音信号的主体部分,抑制噪声对声音信号的影响;接着,对重构声音信号提取Mel频率倒谱系数(MFCC)、OMP时-频特征和基音频率(Pitch)特征,组成OOMP的复合特征;最后,使用DBN对提取的OOMP特征进行特征学习,并对40种声音事件在不同环境不同信噪比下进行识别。实验结果表明,OOMP特征结合DBN的方法适用于各种环境声下的声音事件识别,而且能有效地识别各种环境下的声音事件,即使在信噪比(SNR)为0 d B的情况下,仍然能保持平均60%的识别率。
随着遥感技术的不断发展,遥感影像的空间分辨率得到显著提高,影像中地物目标的清晰和丰富细节给高分辨率遥感影像的场景分类带来了巨大的挑战。高分辨率遥感影像场景分类是遥感图像解译中的重要组成部分,由于影像场景中地物类别的多样性、地物种类可变性大、同一地物类别的多样性,使得传统的影像场景分类方法不能描述复杂场景的高层次语义信息。而近些年深度学习算法的出现为影像高层次内在特征的提取提供了有效的方法。实现高分辨率遥感影像场景分类的关键是影像特征的选择和提取,而影像的纹理特征是遥感影像处理领域最常用的特征。针对因样本量少而导致的影像场景分类精度不高的问题,本文结合双树复小波变换、自适应步长技术和深度置信网模型提出了一种基于自适应深度置信网模型(Adaptive deep belief network,ADBN)的高分辨率遥感影像场景分类方法。本文的主要研究内容如下:(1)提出一种新的自适应学习率方法,该方法不仅可以根据重构误差的变化动态调整学习率的大小,而且考虑了重构误差的变化量对学习率的影响,基于此构建了自适应深度置信网模型,并在MNIST数据集上进行了实验分析,结果表明该模型可以更快的收敛,并且在数据集的分类准确率方面有所提升。(2)提取出高分辨率遥感影像小波域的纹理特征作为特征向量用于场景的分类。本文采用基于双树复小波变换的方法,将图像分解为多层子带图像,并利用广义Gamma密度模型和局部二值模式分别对影像的高频子带和低频子带进行特征向量的构建,实验证明该方法能够在高分辨率遥感影像场景分类中取得较好的结果。(3)本文还研究了基于小波域的纹理特征和ADBN模型在不同空间分辨率的高分辨率遥感影像场景的分类效果。通过对比分类精度、Kappa系数以及分类时长方面选取了最优的网络层数和隐藏层节点数,并且与传统的分类方法进行比较证明了本文提出的模型在不同空间分辨率下的高分辨率遥感影像场景中同样具有适用性与稳健性。
受限制的玻尔兹曼机(RBM)是一种无向图模型.基于RBM的深度学习模型包括深度置信网(DBN)和深度玻尔兹曼机(DBM)等.在神经网络和RBM的训练过程中,过拟合问题是一个比较常见的问题.针对神经网络的训练,权值随机变量(weight random variabl...
详细信息
受限制的玻尔兹曼机(RBM)是一种无向图模型.基于RBM的深度学习模型包括深度置信网(DBN)和深度玻尔兹曼机(DBM)等.在神经网络和RBM的训练过程中,过拟合问题是一个比较常见的问题.针对神经网络的训练,权值随机变量(weight random variables)、Dropout方法和早期停止方法已被用于缓解过拟合问题.首先,改变RBM模型中的训练参数,使用随机变量代替传统的实值变量,构建了基于随机权值的受限的波尔兹曼机(weight uncertainty RBM,简称WRBM),接下来,在WRBM基础上构建了相应的深度模型:Weight uncertainty Deep Belief Network(WDBN)和Weight uncertainty Deep Boltzmann Machine(WDBM),并且通过实验验证了WDBN和WDBM的有效性.最后,为了更好地建模输入图像,引入基于条件高斯分布的RBM模型,构建了基于spike-and-slab RBM(ssRBM)的深度模型,并通过实验验证了模型的有效性.
暂无评论