技术领域
本发明涉及品质检测分析技术领域,具体涉及一种提高小麦粉的粗蛋白校正模型适应性的建模方法。
背景技术
小麦粉制品以其高蛋白、高营养价值被人们作为饮食上解决温饱问题的主食。近年来,中国经济快速发展,消费者生活水平不断提高,特色面粉,如全麦面粉、自发面粉、专用面粉等越来越多。为适应中国市场的需求,对特色面粉的品质快速检测方法的研究是非常必要的。
目前大多数研究采用近红光谱技术建立单一品种的小麦粉品质指标的校正模型,结合化学计量学方法优化校正模型,虽然提升了校正模型的预测精度和预测速度,但是建模样品本身具有单一性,所建模型的适应性、应用范围和实际适用效果并不理想,对各种商业化面粉或者其他特色面粉的品质无法精准预测。
发明内容
针对现有技术中存在不足,本发明提供了一种提高小麦粉的粗蛋白校正模型适应性的建模方法,实现对商业化特色面粉的粗蛋白含量进行精准预测。
本发明是通过以下技术手段实现上述技术目的的。
一种提高小麦粉的粗蛋白校正模型适应性的建模方法,包括步骤:
S1,收集3类小麦粉样品,并对所述3类小麦粉样品进行近红外光谱数据采集和粗蛋白理化值测量;
S2,将3类小麦粉样品分别划分为校正集和预测集;
S3,通过校正集中的小麦粉样品近红外光谱数据与粗蛋白含量值之间的数学关系,建立3类小麦粉样品的三组分混合粗蛋白校正模型,利用三组分混合粗蛋白校正模型预测所述预测集的小麦粉样品粗蛋白含量。
进一步的技术方案,在建立三组分混合粗蛋白校正模型前,利用矢量归一化处理近红外光谱数据。
进一步的技术方案,所述3类小麦粉样品包括通用面粉、自发面粉和全麦面粉。
进一步的技术方案,所述三组分混合粗蛋白校正模型预测所述预测集的小麦粉样品粗蛋白含量,通过校正集相关系数Rc、校正集交互验证均方根误差RMSECV、预测集相关系数Rp和预测集交互验证均方根误差RMSEP进行评价。
进一步的技术方案,采集近红外光谱数据的光谱仪参数设置为:扫描波长范围为900-2500nm、波长点为1601个、分辨率为8cm
进一步的技术方案,所述粗蛋白理化值的测量采用国标法。
进一步的技术方案,所述校正集和预测集的划分采用K-S算法,即把所有的小麦粉样品均看作训练集候选样本,依次从中挑选样本划入训练集。
更进一步的技术方案,所述依次从中挑选样本划入训练集,具体为:首先选择欧氏距离最远的两个小麦粉样品划入训练集,然后通过计算剩下的每一份小麦粉样品到训练集内每一个已知小麦粉样品的欧式距离,找到距离已知小麦粉样品最远及最近的两个样本,并将这两个样本划入训练集,重复上述过程,直到样本数量达到要求。
与现有技术相比,本发明具有以下优点及有益效果:
本发明通过校正集中的小麦粉样品近红外光谱数据与粗蛋白含量值之间的数学关系,建立3类小麦粉样品的三组分混合粗蛋白校正模型,利用三组分混合粗蛋白校正模型预测所述预测集的小麦粉样品粗蛋白含量,扩大了校正模型的应用范围,有效提高了校正模型的抗干扰能力;本发明在建立三组分混合粗蛋白校正模型前,利用矢量归一化处理近红外光谱数据,进一步提升了校正模型的预测精度。本发明方法能快速检测各类商业化特色面粉的粗蛋白含量,解决了现阶段对特色面粉品质研究的市场需求,具有良好的实际应用价值。
附图说明
图1为本发明所述提高小麦粉粗蛋白校正模型适应性的建模方法流程图;
图2为3类小麦粉样品的近红外光谱图;
图3(a)为本发明矢量归一化预处理光谱数据后建立的三组分混合粗蛋白校正模型的校正集线性拟合图;
图3(b)为本发明矢量归一化预处理光谱数据后建立的三组分混合粗蛋白校正模型的预测集线性拟合图。
具体实施方式
下面结合附图以及具体实施例对本发明作进一步的说明,但本发明的保护范围并不限于此。
如图1所示,一种提高小麦粉粗蛋白校正模型适应性的建模方法,具体包括如下步骤:
步骤(1),小麦粉样品的收集
共收集215份小麦粉样品,并分为3类:其中两类是分别购于国内各地区超市的市售通用面粉142份和市售自发面粉16份,另一类取自江苏某面粉厂提供的小麦颗粒,经多功能粉碎机粉碎、过100目筛后制成的全麦面粉57份。
步骤(2),近红外光谱的采集
采用的仪器:上海棱光S450近红外光谱仪,配有积分球漫反射系统、PTFE参比模块和聚苯乙烯波长标准片,能自动完成参比校正和波长监控;
光谱测量条件:仪器扫描波长范围为900~2500nm,波长点共1601个,分辨率为8cm
光谱测量方法:将215份小麦粉样品各称重300g,装于仪器配套样品杯中,样品填充高度为3.0cm;采集光谱时,每个样品重复采集3次光谱,并取平均原始光谱,共得到215条原始光谱,得到如图2所示的3类小麦粉原始光谱图;每次样品测量前均采用相同的测量条件进行扫描并扣除背景。
步骤(3),小麦粉粗蛋白理化值测量
小麦粉粗蛋白理化值测量参照国标法GB/T31578-2015《粮油检验粮食及制品中粗蛋白测定杜马斯燃烧法》规定的方法和实验条件进行检测;每份小麦粉样品平行检测3次,保证3次检测的组内最大相对极差不大于4%,取3次检测结果的平均值;3类小麦粉样品的具体粗蛋白含量范围见表1。
表1 3类小麦粉理化实测粗蛋白含量值
步骤(4),小麦粉样品的样本集划分
基于Kennard-Stone(K-S)算法将小麦粉样品划分为校正集和预测集,即把所有的小麦粉样品都看作训练集候选样本,依次从中挑选样本划入训练集。首先选择欧氏距离最远的两个小麦粉样品划入训练集,然后通过计算剩下的每一份小麦粉样品到训练集内每一个已知小麦粉样品的欧式距离,找到距离已知小麦粉样品最远及最近的两个样本,并将这两个样本划入训练集,然后重复上述过程,直到样本数量达到要求。最终确定通用面粉校正集100份、预测集42份,自发面粉校正集11份、预测集5份,全麦面粉校正集40份、预测集17份。
步骤(5),以通用面粉建立粗蛋白校正模型预测自发面粉和全麦面粉
取100份通用面粉校正集建立单一通用面粉粗蛋白校正模型(即利用偏最小二乘回归方法建立校正集小麦粉样品的近红外光谱数据与粗蛋白含量值之间的数学关系),预测42份通用面粉预测集样本的粗蛋白含量,通过校正集相关系数Rc、校正集交互验证均方根误差RMSECV、预测集相关系数Rp和预测集交互验证均方根误差RMSEP评价该校正模型的预测结果,评价结果见表2。
表2通用面粉粗蛋白校正模型的预测结果评价
由表2可知,通用面粉粗蛋白校正模型的预测结果中:Rp为0.9606、RMSEP为0.4425,说明该粗蛋白校正模型的预测结果已经较为理想,可对自发面粉和全麦粉面进行粗蛋白含量预测。
取16份自发面粉和57份全麦面粉作为通用面粉粗蛋白校正模型的外部验证样品,考察通用面粉粗蛋白校正模型对未知样本的适应性。采用通用面粉粗蛋白校正模型预测自发面粉和全麦面粉的结果见表3。
表3通用面粉粗蛋白校正模型对自发面粉和全麦面粉的粗蛋白含量预测结果
由表3可知,通用面粉粗蛋白校正模型对自发面粉的粗蛋白含量预测结果较差,部分原因是自发粉中添加有酵母等添加剂,影响了面粉的光谱吸收,说明该模型不适用于自发面粉的预测;通用面粉校正模型对全麦面粉的粗蛋白含量预测结果相对较好,但是全麦面粉中存在一定量的小麦麸皮,且麸皮中本身也含有蛋白质组分,导致模型预测准确度不高,说明该校正模型也不适用于全麦面粉的预测。
步骤(6),通用面粉与自发面粉和全麦面粉建立二组分、三组分混合粗蛋白校正模型
鉴于单一通用面粉建立的粗蛋白校正模型在外界干扰因素(酵母、麸皮)影响下,预测效果不佳,因此建立通用面粉+自发面粉、通用面粉+全麦面粉、通用面粉+自发面粉+全麦面粉的粗蛋白校正模型,并对所有预测集的样本粗蛋白含量进行预测,预测结果评价与单组分通用面粉校正模型对比,对比结果见下表4。
表4单一面粉校正模型和二组分、三组分混合校正模型的预测结果评价对此
由表4可知,与通用面粉建立的单组分粗蛋白校正模型比较,通用面粉与自发面粉二组分混合粗蛋白校正模型的预测结果评价中,Rc由降为0.9588、RMSECV升为0.5108、Rp降为0.9514、RMSEP降为0.4144,说明自发面粉对模型的干扰较大,在原有样本中加入自发面粉,导致混合模型整体的预测效果降低;通用面粉与全麦面粉二组分混合粗蛋白校正模型的预测结果评价中,Rc升为0.9804、RMSECV降为0.3983、Rp升为0.9736、RMSEP降为0.3872,说明全麦面粉对模型的干扰较小,在原有样本中加入全麦面粉,不仅提升了混合模型整体的预测精度,对预测集样本的预测结果也小幅度提升。对3类小麦粉样品进行三组分混合建模,预测结果评价中,Rc升为0.9762、RMSECV降为0.4237、Rp升为0.9722、RMSEP降为0.3851,建立的3类样本混合粗蛋白模型整体预测效果和预测精度均有所提升,说明通用面粉与自发面粉和全麦面粉进行三组分混合粗蛋白建模的方法是可行的,通用面粉与自发面粉和全麦面粉的三组分混合粗蛋白校正模型能有效提高校正模型的适应性,增强模型的抗干扰能力,大大提高了校正模型的实用价值。
为了优化三组分混合粗蛋白校正模型的稳定性和预测精度,在建立三组分混合粗蛋白校正模型前,本实施例选择三种预处理方法对小麦粉样品的近红外光谱数据进行处理,然后建立三组分混合粗蛋白校正模型,利用进行光谱数据预处理的三组分混合粗蛋白校正模型对预测集的样本粗蛋白含量进行预测,预测结果见表5。
表5进行光谱数据预处理的三组分混合粗蛋白校正模型预测结果
由表5可知,采用SNV(标准正态变量变换)、矢量归一化和MSC(多元散射校正)方法处理后的近红外光谱数据,建立的三组分混合校正模型的预测准确度均有提升,其中矢量归一化处理后的近红外光谱数据,建立的三组分混合校正模型预测效果最好,其Rc达到0.9810、RMSECV为0.3749、Rp为0.9805、RMSEP为0.3242。最终确定以矢量归一化处理近红外光谱数据,有效提升三组分混合校正模型的预测精度和稳定性,线性拟合结果见图3(a)、图3(b),由图3可知,对近红外光谱数据预处理后,建立的三组分混合校正模型,可有效提高小麦粉粗蛋白校正模型的适应性,增强模型的抗干扰能力,提高模型的稳健性和预测精度。
所述实施例为本发明的优选的实施方式,但本发明并不限于上述实施方式,在不背离本发明的实质内容的情况下,本领域技术人员能够做出的任何显而易见的改进、替换或变型均属于本发明的保护范围。
机译: 一种处理面粉,粗粉或小麦粉的改进方法。
机译: 提高小麦粉基烤制和油炸产品蛋白质成分的方法
机译: 一种提高小麦粉面团质量的方法