首页> 中国专利> 一种无创筛查非酒精性脂肪性肝炎模型的构建方法、预测系统、设备及存储介质

一种无创筛查非酒精性脂肪性肝炎模型的构建方法、预测系统、设备及存储介质

摘要

一种无创筛查非酒精性脂肪性肝炎模型的构建方法、预测系统、设备及存储介质,属于脂肪肝检测领域。现有脂肪性肝炎病的方法存在的准确率低和费用昂贵等缺点。一种无创筛查非酒精性脂肪性肝炎模型的构建方法,采集脂肪性肝炎病人的血清、影像和病理数据;血清特征数据预处理;血清特征统计筛选;B超特征提取和筛选;使用支持向量机SVM整合有效B超特征;获取的血清指标特征和B超的R‑NASH特征进行组合,采用多元logistic回归方法,得到非酒精性脂肪性肝炎诊断模型;通过模型对比和效能分析,根据ROC曲线的最大约登指数来确认评价NASH的模型阈值范围,从而获得最终参数固定的模型,用于预测。

著录项

说明书

技术领域

本发明涉及一种筛查脂肪性肝炎的模型的构建,特别涉及一种无创筛查非酒精性脂肪性肝炎模型的构建方法、预测系统、设备及存储介质。

背景技术

目前,脂肪性肝炎的诊断需要通过B超、CT平扫肝脏密度或者血液检测等方法来进行,而B型超声检查是诊断脂肪性肝炎重要而实用的手段,其诊断的准确率有70%左右, CT平扫肝脏密度普遍降低,肝/脾CT平扫密度比值≤1可明确脂肪性肝炎的诊断,根据肝/脾CT平扫密度比值可判断脂肪性肝炎病的程度,其准确性略优于B超,但具有费用昂贵及放射性等缺点。

发明内容

本发明为了解决现有脂肪性肝炎病的方法存在的准确率低和费用昂贵等缺点的问题,而提供了一种无创筛查非酒精性脂肪性肝炎模型的构建方法、预测系统、设备及存储介质。

一种无创筛查非酒精性脂肪性肝炎模型的构建方法,所述的检测方法通过以下步骤实现:

步骤一、采集脂肪性肝炎病人的血清、影像和病理数据;

收集数据,包括病人的基本信息、NASH和非NASH病理活检数据、肝脏B超图像和血清实验室检查数据;以及对应病人的肝脏BMP格式的超声图像;

其中,

NASH的中文含义为非酒精性脂肪性肝炎;

基本信息包括年龄、性别、身高、体重、BMI计算、饮酒史、是否合并糖尿病、肝炎病史;BMI的含义是身体质量指数,简称体质指数又称体重,英文为Body Mass Index,简称BMI;

血清实验室检查数据包括白细胞计数、血小板计数、谷丙转氨酶、谷草转氨酶、谷氨酰转肽酶、总胆红素、直接胆红素、凝血时间、碱性磷酸酶、白蛋白、血胆固醇、凝血国际标准化比值、血储铁蛋白、空腹血糖、尿酸、血脂、空腹胰岛素、HOMA指数;

步骤二、血清特征数据预处理;

除去NASH和非NASH病理活检数据,将其余血清变量统一进行如下标准化处理,处理方法为:

(1)将每个数值型变量从小到大排列,将小于第2.5%或者大于第97.5%的视为异常值并分别更改为2.5%和97.5%;

(2)将所有数值型变量归一化,公式为:X

步骤三、血清特征统计筛选;

选取采集的数据中的一部分作为训练组;之后,在训练组里通过斯皮尔曼相关性分析筛选出有显著相关性的指标;之后,通过前向条件多元logistic回归进行统计筛选得出与 NASH有关联的血清指标;其中,所述的血清指标为谷草转氨酶、血小板计数、血脂、BMI计算、尿酸;

步骤四、B超特征提取和筛选;

所述的B超特征提取的是指计算提取肝脏组织灰度纹理特征;其中,灰度纹理特征包括灰度共生矩阵、灰度行走游程矩阵、强度直方图和不变矩四方面;

所述的筛选操作包括以下三步:

(1)组内和组间观察者一致性检验超过0.8;

(2)将由(1)步得到的筛选结果进行如下筛选:利用方差阈值法进行初筛操作,涉及的阈值设为1.0;

(3)将由(2)步得到的筛选结果进行如下筛选:采用lasso回归法进行最终筛选;具体为:

首先,采用Lasso回归模型,筛选出有效B超特征,所述的Lasso回归模型的代价函数为:

其中,x

然后,将lasso回归法筛选出的非0系数变量作为最终建模的有效B超特征;

步骤五、使用支持向量机SVM整合有效B超特征;

利用支持向量机SVM模型对有效B超影像组特征进行预测,得到预测值R-NASH;其中,所述的SVM模型进行预测的步骤包括以下几步:

(1)选取高斯核函数:

(2)构造支持向量机模型:

0≤α

y

i代表第i个、j代表第j个、a

(3)利用得到的SVM模型,对B超影像组特征进行预测,得到预测值R-NASH:

其中,x为有效B超影像组特征构成的向量;

步骤六、获取的血清指标特征和B超的R-NASH特征进行组合,采用多元logistic回归方法,得到非酒精性脂肪性肝炎诊断模型,包括以下步骤:

(1)假定x

z=h

其中,θ

(2)求得模型参数,得到诊断模型为:

Y

步骤七、模型确认;

通过模型对比和效能分析,根据ROC曲线的最大约登指数来确认评价NASH的模型阈值范围,从而获得最终参数固定的模型,用于预测。

有益效果:

本发明是一种筛查非酒精性脂肪性肝炎模型,是利用多个脂肪性肝炎病人的血清、影像和病理数据来形成非酒精性脂肪性肝炎相关数据预测模型的。基于多个临床指标的筛查非酒精性脂肪性肝炎模型模型,不仅使得血清学和影像学之间的优劣进行互补,提高了模型的预测速度和准确性,能够为临床肝脏纤维化诊断提供参考。能在不做肝穿刺的情况下快速完成NASH初筛,以此能高效率随时监测病人肝脏病变程度,制定对应的临床干预措施。无创预测不仅减少了病人的经济负担和医生的时间成本,而且也避免了多余病人需要有创检查带来的痛苦和并发症,减轻了医疗负担。

附图说明

附图1是本发明的方法流程图;

附图2是采用ROC曲线进行效果评价与本发明设计模型之间对比示意图;

附图3是对肝脏组织进行圈画并计算提取灰度纹理特征示意图;

附图4是灰度共生矩阵计算方法图示;

附图5是灰度行走游程矩阵计算方法图示;

附图6是强度直方图相关特征计算方法图示;

附图7是计算不变矩的方法图示。

具体实施方式

具体实施方式一:

本实施方式的一种无创筛查非酒精性脂肪性肝炎模型的构建方法,如图1所示,所述的检测方法通过以下步骤实现:

步骤一、采集脂肪性肝炎病人的血清、影像和病理数据;

收集南京鼓楼医院肝胆胰中心数据,包括病人的基本信息、NASH(非酒精性脂肪性肝炎)和非NASH病理活检数据、肝脏B超图像和血清实验室检查数据;以及对应病人的肝脏BMP格式的超声图像,例如,是在南京鼓楼医院的超声科将对应病人的超声图像以 BMP格式拷贝。

其中,

NASH的中文含义为非酒精性脂肪性肝炎;

基本信息包括年龄、性别、身高、体重、BMI计算、饮酒史、是否合并糖尿病、肝炎病史;BMI的含义是身体质量指数,简称体质指数又称体重,英文为Body Mass Index,简称BMI;

血清实验室检查数据包括白细胞计数、血小板计数、谷丙转氨酶、谷草转氨酶、谷氨酰转肽酶、总胆红素、直接胆红素、凝血时间、碱性磷酸酶、白蛋白、血胆固醇、凝血国际标准化比值、血储铁蛋白、空腹血糖、尿酸、血脂、空腹胰岛素、HOMA指数;

步骤二、血清特征数据预处理;

除了NASH和非NASH病理活检数据不做预处理外,将血清变量统一进行如下标准化处理:

(1)将每个数值型变量从小到大排列,将小于第2.5%或者大于第97.5%的视为异常值并分别更改为2.5%和97.5%;

(2)将所有数值型变量归一化,公式为:X

步骤三、血清特征统计筛选;

选取采集的数据中的一部分作为训练组;例如以南京市鼓楼医院的肝胆胰中心病例作为训练组。之后,在训练组里通过斯皮尔曼相关性分析筛选出有显著相关性的指标;之后,通过前向条件多元logistic回归进行统计筛选得出最终的有意义与NASH最有关联的血清指标;其中,所述的血清指标为谷草转氨酶、血小板计数、血脂、BMI计算、尿酸;所述的血清指标为谷草转氨酶简称为AST、血小板计数简称为PLT、血脂简称为lipid、BMI 计算、尿酸简称为Uric acid;

步骤四、B超特征提取和筛选;

所述的B超特征提取的是指计算提取肝脏组织灰度纹理特征;其中,灰度纹理特征包括灰度共生矩阵、灰度行走游程矩阵、强度直方图和不变矩四方面;

所述的筛选操作包括以下三步:

(1)组内和组间观察者一致性检验(ICC)超过0.8;

(2)利用方差阈值法进行初筛操作,涉及的阈值设为1.0;

(3)采用lasso回归法进行最终筛选;具体为:

首先,采用Lasso回归模型,筛选出有效B超特征,从而剔除作用不大的特征,所述的Lasso回归模型的代价函数为:

其中,x

然后,将lasso回归法筛选出的非0系数变量作为最终建模的有效B超特征;

步骤五、使用支持向量机SVM整合有效B超特征;

利用支持向量机SVM模型对有效B超影像组特征进行预测,得到预测值R-NASH;其中,所述的SVM模型预测步骤包括以下几步:

(1)选取高斯核函数:

(2)构造支持向量机模型:

0≤α

y

i代表第i个、j代表第j个、a

(3)利用得到的SVM模型,对B超影像组特征进行预测,得到预测值R-NASH:

其中,x为有效B超影像组特征构成的向量;

步骤六、获取的血清指标特征和B超的R-NASH特征进行组合,采用多元logistic回归方法,得到非酒精性脂肪性肝炎诊断模型;其中,所述多元logistic回归方法包括以下步骤:

(1)假定x

z=h

其中,θ

(2)求得模型参数,得到诊断模型为:

Y

步骤七、模型确认;

通过模型对比和效能分析,根据ROC曲线的最大约登指数(敏感性加特异性-1)来确认评价NASH的模型阈值范围,根据确定出的阈值得到最终的模型的合理参数范围,从而获得最终参数固定的模型,用于预测;并应用到临床验证中。

基于多个临床数据的NASH初步评估模型,能在不做肝穿刺的情况下快速完成NASH初筛,以此能高效率随时监测病人肝脏病变程度,制定对应的临床干预措施。无创诊断不仅减少了病人的经济负担和医生的时间成本,而且也避免了多余病人需要有创检查带来的痛苦和并发症,减轻了医疗负担。

具体实施方式二:

与具体实施方式一不同的是,本实施方式的一种无创筛查非酒精性脂肪性肝炎模型的构建方法,还在步骤六和步骤七之间增加模型验证与比较的步骤,具体为:

将本发明模型与已有模型超声FLI检验比较。采用ROC曲线进行效果评价与模型之间对比,如图2所示。

ROC曲线横坐标代表特异性、纵坐标代表敏感度,一般曲线越高代表模型分类能力越好。实线曲线为新建模型,虚线曲线为已有模型,两者放一起比较,优劣能力能够明显区分。

具体实施方式三:

与具体实施方式一或二不同的是,本实施方式的一种无创筛查非酒精性脂肪性肝炎模型的构建方法,所述的步骤四中,B超特征提取的步骤使用的特征为:(原材料中的B超特征)

B超特征提取:

利用筛选软件(liverradiomics)读取B超图像,之后通过灰度拉伸的步骤将图像标准化,之后计算提取肝脏灰度纹理特征;灰度纹理特征包括灰度共生矩阵、灰度行走游程矩阵、强度直方图和不变矩四方面;如图3所示;

其中,筛选软件提取特征的算法为如下,

所述的计算灰度共生矩阵的方法为,根据灰度的空间相关特性来描述纹理,属于一种常用方法,包括:

自相关特征,英文全称Autocorrelation:指随机误差项的各期望值之间存在着相关关系,用于评价图像的清晰程度;

相关:它度量空间灰度共生矩阵元素在行或列方向上的相似程度,因此,相关值大小反映了图像中局部灰度相关性。当矩阵元素值均匀相等时,相关值就大;相反,如果矩阵像元值相差很大则相关值小。如果图像中有水平方向纹理,则水平方向矩阵的COR大于其余矩阵的COR值;COR全称Correlation,中文含义为相关;

集群突出物:物体在图中的突兀情况,纹路和纹案反差越大,prom值就越大;prom全称Clusterprominence,中文含义为集群突出物;

集群阴影,英文全称Clustershade:阴影大小(shade),可能和图片质量有关,更直观的是与服装的褶皱程度相关,越平整,shade值越小;测量矩阵的偏度并衡量均匀性的概念;当值很高时,图像是不对称的;shade中文含义阴影;

差异性,英文全称Dissimilarity:计算对比度时,权重随矩阵元素与对角线的距离以指数方式增长,如果改为线性增长,则得到相异性。

能量英文全称Energy:是灰度共生矩阵元素值的平方和,所以也称能量,反映了图像灰度分布均匀程度和纹理粗细度。如果共生矩阵的所有值均相等,则ASM值小;相反,如果其中一些值大而其它值小,则ASM值大。当共生矩阵中元素集中分布时,此时ASM 值大。ASM值大表明一种较均一和规则变化的纹理模式。

均质性,英文全称Homogeneity:测量图像的局部均匀性,非均匀图像的值较低,均匀图像的值较高。与对比度或相异性相反,同质性的权重随着元素值与对角线的距离而减小,其减小方式是指数形式的。

最大概率,英文全称Maximumprobability:表示图像中出现次数最多的纹理特征。

计算方法如图4所示。图中,j表示像素点y的灰度值,i表示像素点x的灰度值,p 表示概率,M、N表示M×N的矩阵。

具体实施方式四:

与具体实施方式三不同的是,本实施方式的一种无创筛查非酒精性脂肪性肝炎模型的构建方法,所述的计算灰度行走游程矩阵的方法如图5所示,灰度游程矩阵就是灰度值游行的长度所组成的矩阵,它只是对图像像素信息的度量和统计,在实际使用的过程中针对生成的灰度游程矩阵进行计算,得到基于灰度共生矩阵的图像特征信息。包括短期强调(SRE),长期强调(LRE),运行长度不均匀性(RLN),灰度级不均匀性(GLN),运行百分比(RP),低灰度级运行强调(LGRE),高灰度级别运行强调(HGRE),短期低灰度级强调(SRLGE),短期高灰度级强调(SRHGE),长期低灰度级强调(LRLGE),长期高灰度级强调(LRHGE)。

图5中,(i,j)点代表灰度为i的像素在图像某方向连续出现j次的计数,p表示概率,M表示图像上的灰度级数目;N表示图像上不同游程的数目;n

具体实施方式五:

与具体实施方式三或四不同的是,本实施方式的一种无创筛查非酒精性脂肪性肝炎模型的构建方法,所述的计算强度直方图的方法为,如附图6所示,强度直方图的相关特征是根据强度直方图计算的一阶特征,一阶特征是最简单的一阶特征,包括Mean(均值):强度直方图的统计均值、Variance(方差):强度直方图的统计方差、Entropy(熵):强度直方图的统计熵值、Energe(能量):强度直方图的统计能量总和;Kurtosis(峰度):表征概率密度分布曲线在平均值处峰值高低的特征数,描述由Sample构成的分布的峰值的否突兀或是平坦情况、直观看来,峰度反映了峰部的尖度。样本的峰度是和正态分布相比较而言的统计量,计算时间序列x的峰度,峰度用于度量x偏离某分布的情况,正态分布的峰度为3。如果峰度大于3,峰的形状比较尖,比正态分布峰要陡峭。反之亦然;在统计学中,峰度衡量实数随机变量概率分布的峰态,峰度高就意味着方差增大是由低频度的大于或小于平均值的极端差值引起的。Skewness(偏度):描述由Sample构成的分布的对称性的状况情况。

其中,描述由Sample构成的分布的对称性的状况情况为,计算时间序列x的偏度,偏度用于衡量x的对称性;若偏度为负,则x均值左侧的离散度比右侧强;若偏度为正,则 x均值左侧的离散度比右侧弱;对于正态分布(或严格对称分布),偏度等于O。

具体实施方式六:

与具体实施方式五不同的是,本实施方式的一种无创筛查非酒精性脂肪性肝炎模型的构建方法,所述的计算不变矩的方法为,如图7所示,矩是概率与统计中的一个概念,是随机变量的一种数字特征,一阶原点矩为期望,一阶中心矩μ1为0,二阶中心矩μ2是X 的方差Var(X),在统计学上,高于4阶的矩极少使用。三阶中心矩μ3用于衡量分布是否有偏,四阶中心矩μ4用于衡量分布(或密度)在均值附近的陡峭程度如何;

利用二阶和三阶规格中心矩导出7个不变矩组(Φ1Φ7),不变矩组(Φ1Φ7)在图像平移、旋转和比例变化时保持不变。

具体实施方式七:

本实施方式的一种无创筛查非酒精性脂肪性肝炎模型的构建方法的预测系统,所述系统包括:

数据采集模块,用于对采集脂肪性肝炎病人的血清、影像和病理数据进行预处理;

血清特征数据预处理模块,除去NASH和非NASH病理活检数据,将其余血清变量统一进行如下标准化处理;具体处理方法为:

(1)将每个数值型变量从小到大排列,将小于第2.5%或者大于第97.5%的视为异常值并分别更改为2.5%和97.5%;

(2)将所有数值型变量归一化,公式为:X

血清特征统计筛选,用于血清特征统计筛选;具体是,选取采集的数据中的一部分作为训练组;之后,在训练组里通过斯皮尔曼相关性分析筛选出有显著相关性的指标;之后,通过前向条件多元logistic回归进行统计筛选得出与NASH有关联的血清指标;其中,所述的血清指标为谷草转氨酶、血小板计数、血脂、BMI计算、尿酸;

B超特征提取和筛选模块,用于进行B超特征提取和筛选,通过lasso回归法筛选出的非0系数变量作为最终建模的有效B超特征,从而计算提取肝脏组织灰度纹理特征;其中,采用Lasso回归模型筛选出有效B超特征,所述的Lasso回归模型的代价函数为:

其中,x

特征整合模块,用于利用支持向量机SVM模型对有效B超影像组特征进行预测,得到预测值R-NASH,整合有效B超特征;

预测模型建立模块,用于将获取的血清指标特征和B超的R-NASH特征进行组合,采用多元logistic回归方法,得到非酒精性脂肪性肝炎筛选模型;

预测模型确认模块,同于确认评价NASH的模型阈值范围,从而获得最终参数固定的模型;其中,确认评价NASH的模型阈值范围是通过模型对比和效能分析,根据ROC曲线的最大约登指数来确认的,最终用于预测。

具体实施方式八:

本实施方式的一种用于无创筛查非酒精性脂肪性肝炎模型的构建方法的检测设备,包括:

处理器;

存储器,其中存储有所述处理器的可执行指令;

其中,所述处理器配置为经由执行所述可执行指令来执行所述的一种无创筛查非酒精性脂肪性肝炎模型的构建方法的步骤。

具体实施方式九:

本实施方式的一种计算机可读存储介质,用于存储程序,所述程序被执行时实现所述的一种无创筛查非酒精性脂肪性肝炎模型的构建方法的步骤。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号