电子鼻是一种用于气味检测的仿生系统,主要由气体传感器阵列以及模式识别算法构成。在连续工作的在线场景中,由于环境因素的影响,混合气味干扰和传感器漂移成为损害电子鼻识别性能的两个主要原因。一方面,电子鼻工作时难免受到其他混合气味的干扰,无法准确地识别出目标气味。另一方面,漂移校正是电子鼻在线工作中不可或缺的环节,而基于机器学习的漂移校正手段越来越受欢迎。其中,主动学习漂移校正方法被看作是一种适合电子鼻长期在线工作场景的漂移处理手段。主动学习方法利用特定样本挑选准则选择最具有价值的样本构成漂移校正集,从而减小分类器训练集与实际测试样本之间的分布差异,增强电子鼻的识别准确率。然而,实际场景中无法定量控制气味种类、浓度和流量,导致样本集会产生类不均衡问题。同时,可靠性低的气味鉴别专家可能为选择的样本提供错误标签并加入到校正集中。这些因素均会影响主动学习漂移校正效果。因此,本研究旨在通过解决以上问题保障电子鼻长期稳定工作,具体研究工作包括:(1)本研究提出一种多子空间学习方法用于电子鼻混合气味成分检测。该方法分为特征预处理和成分判别两阶段,前者目标在于学习多个投影矩阵将原始样本变换到彼此独立的特征子空间中,使得混合气味与单一气味分布相近。后者基于集成学习思想利用多个二分类器判别混合气味的组成成分。与其他参考方法相比,所提出的多子空间学习方法不需要完备类型的训练数据,更符合实际场景。利用采集的三元混合气味实验数据集进行算法性能评估,结果表明提出的混合气味检测方法在所有测试方法中取得了最高的识别准确率。(2)针对校正样本集类不均衡问题提出一种双重规则采样(Dual Rule Sampling,DRS)的主动学习方法。该方法同时衡量样本的不确定性和少数类样本相似度,选择最有价值的样本构成漂移校正集。同时,DRS能够根据当前的类不均衡程度自适应改变样本挑选策略。采用两个数据集评估所有使用方法的性能,结果表明:DRS方法能够有效缓解类不均衡带来的影响。与其他参考方法相比,DRS获得了最高的识别准确率,具有优异的漂移补偿效果。(3)针对样本标签错误,本文提出一种基于高斯混合模型的误标概率估计(Mislabel-Probability Estimation method based on Gauss Mixture Model,MPEGMM)算法。该方法基于概率统计模型衡量每个样本被错误标记的概率,并估计整个校正集中含噪声标签样本的数量。此外,通过比较每个样本的预期信息熵增量来选取其中最有价值的样本进行二次标记。实验结果表明,提出的MPEGMM方法能够准确地找到被错误标记的样本,提升了校正集的质量。与其他噪声标签检测方法相比,MPEGMM不仅具有较高的噪声标签检测准确率,也获得了更高的识别准确率提升效果,这说明MPEGMM能够通过二次标记有效保证主动学习漂移校正方法的性能。
暂无评论