公开/公告号CN113310938A
专利类型发明专利
公开/公告日2021-08-27
原文格式PDF
申请/专利权人 华中农业大学;
申请/专利号CN202110503863.0
申请日2021-05-10
分类号G01N21/3577(20140101);G06F30/27(20200101);G06K9/62(20060101);G06F111/08(20200101);G06F113/08(20200101);
代理机构42001 武汉宇晨专利事务所(普通合伙);
代理人张红兵
地址 430070 湖北省武汉市洪山区狮子山街1号
入库时间 2023-06-19 12:22:51
技术领域
本发明属于奶品分析技术领域,具体涉及一种巴氏杀菌的水牛鲜奶和奶牛鲜奶的快速鉴定方法。
背景技术
Dal等人(2018)在实验室中制备掺有不同浓度奶牛奶的水牛马苏里拉奶酪,使用液相色谱-串联质谱分析定量奶中的物种特异性低分子量生物标志物,从而实现对掺假的水牛马苏里拉奶酪的鉴别,β-胡萝卜素和麦角钙化固醇的定量结合使检测牛奶的灵敏度阈值为5%,该方法需要离心、水浴培养、提取分析物等操作
(PLSR)预测模型用于定量预测奶牛和水牛的掺假,该模型的相关系数达到0.99,交叉验证(RMSECV)和预测(RMSECP)中的模型均方根误差分别为1.16和6.24
中红外光谱分析是近年来快速发展起来的一种快速、无损、无公害、可多组分同时分析的现代技术。已有研究表明,中红外光谱可较好地预测水牛奶的酸度特征:例如在校准集和验证集中分别正确分类为未凝结91.57%和67.86%的牛奶样品
发明内容
本发明的目的是针对巴氏杀菌的水牛鲜奶和奶牛鲜奶的鉴定方法存在的缺陷,确定巴氏杀菌的水牛鲜奶和奶牛鲜奶的快速鉴定的最佳预处理和建模算法组合方法,提高上述两类鲜奶的鉴别速度和准确率。
本发明的技术方案如下所述:
一种巴氏杀菌的水牛鲜奶和奶牛鲜奶的快速鉴别方法,所述方法包括以下步骤:
1)奶样的选取
分别采集巴氏杀菌的水牛鲜奶和奶牛鲜奶样本;
2)采集中红外光谱(简称MIR)
利用乳成分检测仪对水牛鲜奶和奶牛鲜奶进行扫描,通过相连的计算机输出每个样本对应的透光率;
3)数据预处理
将原始光谱数据由透光率(T)转化为吸光度(A),去除异常值;
4)划分数据集
将数据集按照分层抽样的原则划分为训练集和测试集,两者分别占数据集的80%和20%;
5)确定建模光谱波段
筛选巴氏杀菌的水牛鲜奶和奶牛鲜奶的差异波段,并去除水的吸收区域;
6)建立模型与筛选最优模型
以训练集样本的中红外光谱为输入值,以巴氏杀菌的水牛鲜奶和奶牛鲜奶的类别为输出值,使用不同光谱预处理方法和不同建模算法组合建立模型,使用准确率、灵敏度、特异性和AUC指标对模型进行评估和筛选,筛选出最优模型;
7)最优模型的验证与应用
另取水牛鲜奶和奶牛鲜奶样本,使用筛选出的最优模型对样本进行鉴别,评估其应用性能。
其中:
步骤2)中采集中红外光谱时,将水牛鲜奶和奶牛鲜奶样本分别倒入直径3.5cm,高9cm的圆柱形采样管中,保证液面高度大于6cm,然后将其在42℃水浴锅中水浴15-20min,再将固体光纤探头伸到液体中吸样检测;
步骤3)中根据A=log
步骤5)中使用的筛选差异波段的方法为Pearson相关性检验和相关性的显著性检验,最终选择用于建模的光谱波段为925.92-1041.66cm
步骤6)中使用的光谱预处理方法为用一阶微分(Diff)、标准正态变量变换(SNV)、多元散射校正(MSC)和SG卷积平滑,使用的建模算法为随机森林(RF)和支持向量机(SVM)。
步骤7)中选择的最优模型为无预处理和支持向量机算法组合,最优模型在训练集、测试集和验证集中的准确率均为1,且验证过程不超过5分钟,即本发明选择的最优模型可以对巴氏杀菌的水牛鲜奶和奶牛鲜奶实现快速、精准鉴别。
与现有技术相比,本发明的有益效果在于:
(1)本发明的发明点在于,筛选得到最有建模的光谱波段为925.92-1041.66cm
(2)本发明最优模型的预处理和建模算法组合为不处理和支持向量机算法,准确率可达到1;(3)本发明可在5分钟内实现对样本的精准、快速鉴别,实现了对巴氏杀菌的水牛鲜奶和奶牛鲜奶的快速检测,克服了常规方法耗时、耗材等缺点。
附图说明
图1:本发明建模波段的光谱图。即二类鲜奶在建模波段的吸光值图。附图标记说明:图1中横坐标为光谱波数,纵坐标为吸光度,建模波段为925.92-1041.66cm
图2:测试集的ROC曲线。附图标记说明:ROC曲线可以衡量模型在测试集的性能,横坐标为假阳性率,纵坐标为真阳性率,AUC为ROC曲线下与坐标轴围成的面积,取值范围在0.5和1之间,若AUC越接近1.0,表明本发明的方法的真实性越高,图2中AUC为1,表明本发明的模型真实性高。
图3:测试集的分类概率图。附图标记说明:横坐标为预测概率,纵坐标为预测的类别,例如图中左下方圆点表示此样本被分为0类的概率为0.942,即判定为正确分类;图3中表明测试集中的样本均被正确分类,且0类即水牛鲜奶被正确分类的概率为0.942-0.959,1类即奶牛鲜奶被正确分类的概率为0.980-0.994。表明本发明的模型能够对样本实现高概率的正确分类。
具体实施方式
本发明所述技术方案,如未特别说明,均为本领域的常规方案。所述试剂或材料,如未特别说明,所述试剂或材料均来源于商业渠道。
在本发明的技术方案中,一阶微分(Diff)、标准正太変量変换(SNV)、多元散射校正(MSC)和SG卷积平滑等技术参数的调整,为本领域技术人员根据研究对象进行的常规调整。
在本发明实施例中,所述中红外光谱数据预处理、模型构建及验证等均通过Python3.8.3实现。
实施例1:巴氏杀菌的水牛鲜奶和奶牛鲜奶快速鉴别方法的建立
仪器与设备:选用FOSS公司生产的MilkoScan
具体操作步骤如下:
(1)采集奶样
分别在市场上购买销售量较大的四个商业品牌不同批次巴氏杀菌的奶牛鲜奶98个,不同批次的巴氏杀菌的水牛鲜奶样本25个。
(2)采集中红外光谱(MIR)
将奶样分别倒入直径3.5cm,高9cm的圆柱形样品管中,保证液面高度大于6cm,然后将其在42℃水浴锅中水浴15-20min,再将固体光纤探头伸到液体中吸样检测,通过软件得到样品的透光率。
(3)数据预处理
依据A=log
(4)划分数据集
将数据集按分层抽样法分为训练集(n=96:水牛鲜奶19个,奶牛鲜奶77个)和测试集(n=24:其中,水牛鲜奶奶样5个,奶牛鲜奶奶样19个)。
在建模过程中,数值0代表水牛鲜奶类,1代表奶牛鲜奶类。表2为两类鲜奶常规乳成分的描述性统计,由表2可知,水牛鲜奶的乳脂、乳蛋白、非乳脂固形物(SNF)和总固形物(TS)的百分含量均极显著高于奶牛鲜奶(P<0.01),二者常规乳成分存在极显著的差异(P<0.01)。
表1剔除异常值时的样本量变化
表2两类鲜奶常规乳成分的描述性统计
注:同行数据肩标不同字母表示差异显著(P<0.05),有相同字母表示差异不显著(P>0.05)。
(5)确定建模光谱波段
对光谱数据进行Pearson相关性检验,并对相关性进行显著性分析,且去除水的吸收区域,最终选择925.92-1041.66cm
(6)建立模型与筛选最优模型
分别采用一阶微分(Diff)、标准正态变量变换(SNV)、多元散射校正(MSC)和SG卷积平滑对光谱数据进行预处理,同时也与不使用预处理的数据进行比较。
使用随机森林(RF)和支持向量机(SVM)算法利用训练集数据建立分类模型,并对测试集中的样本进行预测。在不同预处理下,RF和SVM算法的建模结果如下表所示。
表3不同预处理下RF和SVM的建模结果
在上述二分类模型中,以准确率、灵敏度、特异性和AUC评价模型的性能,其中,准确率为正确判断占所有判断的概率,其值越接近1越好;灵敏度表示二分类中某一类被正确分类的比例,其值越接近1越好;特异性表示二分类中另一类被正确分类的概率,其值越接近1越好;AUC是ROC曲线下的面积,其直观地反映了ROC曲线表达的分类能力,AUC=1代表此分类器为完美分类器,0.5 利用选择的最优分类模型,预测测试集的24个样本。以ROC曲线衡量模型在测试集的性能,以假阳性率为横坐标,真阳性率为纵坐标,得到如图2所示的ROC曲线图。AUC为ROC曲线下与坐标轴围成的面积,其取值范围在0.5和1之间,AUC越接近1.0,表明本发明的真实性越高。由图2可知,本实施例中测试集的AUC为1,说明模型在测试集上的分类效果很好。 图3为测试集中类别分类的概率,例如图3中左下方的圆点表示此样本被分为0类的概率为0.942,且为正确分类。由图3可知,测试集中的所有样本均被正确分类,且概率为0.942-0.994。 实施例2:巴氏杀菌的水牛鲜奶和奶牛鲜奶快速鉴别方法的应用 取10个巴氏杀菌的水牛鲜奶和奶牛鲜奶样本对模型进行验证,将预测结果与真实结果对比。此10个样本的类型已提前记录。 具体方法:采用实施例1的测定光谱、数据预处理等方法,利用筛选的最优模型(不处理+SVM)对10个鲜奶样本进行预测。输出结果见表4所示。 表4模型的应用结果
本发明模型鉴定的结果与真实情况完全相同,3个水牛鲜奶和7个奶牛鲜奶,即达到100%准确率。 本发明的最优模型使用的光谱波段为925.92-1041.66cm 实施例3:巴氏杀菌的水牛鲜奶和奶牛鲜奶快速鉴别方法的再应用 取30个巴氏杀菌的水牛鲜奶和120个奶牛鲜奶样本对模型进行验证,方法与实施例2相同。输出结果见表5所示。 表5模型的应用结果
本模型对巴氏杀菌的水牛鲜奶的鉴别准确率为90%,对巴氏杀菌的奶牛鲜奶的鉴别准确率为99.17%,即达到总体97.33%的准确率。 主要参考文献 [1]汪六三等,基于近红外光谱和机器学习的大豆种皮裂纹识别研究[J/OL].农业机械学报:1-15[2021-04-27].http://kns.cnki.net/kcms/detail/11.1964.s.20210329.1535.006.html. [2]C.C.Fagan,C.Everard,C.P.O’Donnell,G.Downey,E.M.Sheehan,C.M.Delahunty,D.J.O’Callaghan.Evaluating Mid-infrared Spectroscopy as a NewTechnique for Predicting Sensory Texture Attributes of Processed Cheese[J].Journal of Dairy Science,2007,90(3); [3]Dal BC,Panero S,Navarra M A,et al.Screening and Assessment of LowMolecular Weight Biomarkers of Milk from Cow and Water Buffalo:an AlternativeApproach for the Rapid Identification of Adulterated Water BuffaloMozzarellas[J].Journal of Agricultural&Food Chemistry,2018:acs.jafc.8b01270; [4]Francesca,Trimboli,Nicola,et,al.Detection of buffalo milkadulteration with cow milk by capillary electrophoresis analysis.[J].Journalof Dairy Science,2019; [5]Manuelian C L,Visentin G,Boselli C,et al.Short communication:Prediction of milk coagulation and acidity traits in Mediterranean buffalomilk using Fourier-transform mid-infrared spectroscopy[J].Journal of DairyScience,2017:S0022030217306276; [6]Soyeurt H.,Grelet C.,McParland S.,Calmels M.,Coffey M.,Tedde A.,Delhez P.,Dehareng F.,Gengler N..Acomparison of 4different machine learningalgorithms to predict lactoferrin content in bovine milk frommid-infraredspectra[J].Journal of Dairy Science,2020,103(12); [7]Ullah R,Khan S,Ali H,et al.Potentiality of using front facefluorescence spectroscopy for quantitative analysis of cow milk adulterationin buffalo milk[J].Spectrochimica Acta Part A Molecular and BiomolecularSpectroscopy,2019,225:117518; [8]Xu W,Knegsel A,Vervoort J,et al.Prediction of metabolic status ofdairy cows in early lactation with on-farm cow data and machine learningalgorithms[J].Journal of Dairy Science,2019,102(11)。
机译: 基于巴氏杀菌奶蒸发的巴氏杀菌即饮冷藏鲜奶及其制备方法
机译: 一种浓缩和发酵乳制品,特别是新鲜奶酪,新鲜奶酪产品和凝乳的制备方法
机译: 一种浓缩和发酵乳制品,特别是新鲜奶酪,新鲜奶酪产品和凝乳的制备方法