版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:中南民族大学生物医学工程学院 认知科学国家民委重点实验室 医学信息分析及肿瘤诊疗湖北省重点实验室 武汉理工大学信息工程学院
出 版 物:《分析化学》 (Chinese Journal of Analytical Chemistry)
年 卷 期:2022年第50卷第9期
页 面:1415-1429页
核心收录:
学科分类:081704[工学-应用化学] 1001[医学-基础医学(可授医学、理学学位)] 07[理学] 08[工学] 0817[工学-化学工程与技术] 070302[理学-分析化学] 0703[理学-化学] 10[医学]
基 金:国家自然科学基金项目(Nos.61501526,61178087) 中南民族大学中央高校基本科研业务费专项资金项目(No.CZQ22006)资助
摘 要:血红蛋白浓度是人体的一项重要生理指标,其异常将导致多种疾病。近红外光谱分析技术可以快速、无试剂检测人体中血红蛋白的含量。但是,红外光谱重叠严重、有效信息弱、易受外界噪声干扰,因此通常需要对光谱数据进行数据集划分和预处理,建立定量模型,以去除干扰信息对预测模型的不良影响。如何选择最佳划分方法、最佳划分比例和最佳预处理方法仍是一个问题。针对此问题,本研究以190份不同浓度血红蛋白血液样本和150份不同浓度血红蛋白仿体溶液样本的近红外光谱数据为研究对象,研究等间隔划分法、 K_S法(Kennard Stone)、 SPXY法(Sample set partitioning based on joint x-y distances method)以及双向算法(Duplex)在41种不同划分比例下偏最小二乘(Partial least squares, PLS)模型的预测能力;将小波变换(Wavelet transform, WT)、标准正态变量变换(Standard normal variate, SNV)、直接正交信号校正(Direct orthogonal signal correction, DOSC)、 S_G(Savitzky Golay)一阶求导这4种单独预处理方法(考虑顺序)组成65种预处理方法组合,研究这65种预处理组合对PLS定量分析模型预测精度的影响。实验结果表明:两种数据集的PLS模型最优数据集划分方法均为SPXY法,血液样本最佳划分比例为0.48,仿体溶液最佳划分比例为0.90。65种预处理方法中,血液样本的最佳预处理组合为S_G1+WT,此时预测集相关系数(Correlation coefficient of prediction set,Rp)为0.9808,预测集均方根误差(Root mean square error of prediction set, RMSEP)为0.2701;仿体溶液样本的最佳预处理组合为SNV+WT,此时Rp为0.9952, RMSEP为3.8154。预处理组合时,两种算法叠加的效果最好。本研究结果为此类光谱数据的处理提供了一种新的思路和方法。