关键词:
油莎豆
近红外光谱技术
K最近邻算法
产地溯源
摘要:
目的采用近红外光谱技术对油莎豆进行分析,并应用化学计量学中识别模式对油莎豆进行产地溯源。方法采用近红外光谱法结合化学计量学软件,对来自河北、湖南、山东、新疆、云南等地408份油莎豆样品进行产地溯源,分别采用多元散射校正、多量标准化或多量标准化耦合去趋势算法3种光谱预处理方法和支持向量机(support vector machine,SVM)、簇类独立分类(soft independent modeling of class analogy,SIMCA)、正交偏最小二乘判别(orthogonal partial least squares discriminant analysis,OPLS-DA)、偏最小二乘判别(partial least squares discriminant analysis,PLS-DA)、和K最近邻算法(K-nearest neighbor algorithm,KNN)等5种识别模式进行产地识别。结果SVM、SIMCA、OPLS-DA、PLS-DA和KNN等5种模式的建模识别率分别为91.89%、94.47%、62.37%、65.32%和100.00%。选择KNN作为产地识别模型,分析不同预处理方法、数据预处理及样本距离对模型预测结果稳定性的影响,筛选出最优模型参数。选用多元散射校正光谱预处理方式,在UV标度化、Pareto标度化、自动标度化或中心化任一种数据预处理条件下,样本距离选用街区距离,测试集识别率能达到100.00%。结论近红外光谱结合KNN模式的技术具有分析速度快、操作简单、样本预处理容易、无损、在线的定性定量分析等优点,具有一定应用前景。