首页> 中国专利> 基于影像组学的鉴别实性小儿肺炎支原体肺炎与肺炎链球菌肺炎的方法和系统

基于影像组学的鉴别实性小儿肺炎支原体肺炎与肺炎链球菌肺炎的方法和系统

摘要

本发明提供基于影像组学的鉴别实性小儿肺炎支原体肺炎与肺炎链球菌肺炎的方法和系统,所述方法包括:获取病患待识别CT肺窗图像;输入所述待识别CT肺窗图像至肺炎识别模型,所述肺炎识别模型对所述待识别CT肺窗图像进行定性分析操作,获得所述待识别CT肺窗图像的定性分析结果;其中,所述肺炎识别模型的构建方法包括:获取数据,所述数据为勾画了肺部病变ROI的MPP与APP患者的CT肺窗图像;提取ROI中的影像组学特征并构建影像组学模型;对影像组学模型进行数据训练和测试,将训练好的模型作为肺炎识别模型。本发明的方法可以较准确和客观对MPP与SPP进行鉴别,为临床医生提供额外的诊断信息,促进个性化精准治疗的发展。

著录项

  • 公开/公告号CN112807008A

    专利类型发明专利

  • 公开/公告日2021-05-18

    原文格式PDF

  • 申请/专利权人 山东大学齐鲁医院;

    申请/专利号CN202110110452.5

  • 申请日2021-01-27

  • 分类号A61B6/03(20060101);G06K9/62(20060101);G06T7/00(20170101);G06T7/11(20170101);G06T7/41(20170101);G16H30/00(20180101);G16H50/20(20180101);

  • 代理机构37221 济南圣达知识产权代理有限公司;

  • 代理人孙维傲

  • 地址 250012 山东省济南市文化西路107号

  • 入库时间 2023-06-19 11:03:41

说明书

技术领域

本发明涉及医学影像处理分析领域,具体涉及一种基于影像组学的鉴别实性小儿肺炎支原体肺炎与肺炎链球菌肺炎的方法和系统。

背景技术

公开该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不必然被视为承认或以任何形式暗示该信息构成已经成为本领域一般技术人员所公知的现有技术。

肺炎是全球5岁以下儿童死亡的最常见原因,占全球儿童死亡人数的15%。准确和早期的病原学诊断可指导临床医生合理用药,使总死亡率降低27%,肺炎特定死亡率降低42%,同时还可减少抗生素滥用,改善细菌耐药、降低医疗成本等。尽管各种儿童肺炎的发生率地域差异很大,但支原体与肺炎链球菌是公认的两种最常见的类型。发展中国家5岁以下儿童中,几乎一半的肺炎病例为肺炎链球菌,同时支原体肺炎约占20%~40%。由于患儿无法准确表达症状,且两者的临床表现类似,因此准确地鉴别具有重要的意义。在病原学的检测方面,由于上呼吸道样本存在病原微生物的定植,鼻拭子、口咽拭子或痰液检测并不能准确反映下呼吸道的感染情况;同时侵入性肺穿刺和支气管肺泡灌洗等技术无法作为儿童的常规检测手段。目前常用的病原学检测方法包括聚合酶链式反应(PCR)、直接免疫荧光、抗原检测和血清学等,但这些方法也存在无法显示肺部疾病的程度、检测周期时间较长、假阳性和假阴性结果等缺陷,在实际临床应用中受到很大限制。多重PCR检测可以同时检测几十种病原体,灵敏度高,但对呼吸道标本的类型要求也高。

小儿肺炎进展迅速,重者可致肺功能损害从而影响长期肺健康,甚至整个生命过程,因此及早确定病因并实施有效治疗可明显减少患儿死亡率。支原体肺炎(mycoplasmapneumoniae pneumonia,MPP)与肺炎链球菌肺炎 (streptococcus pneumoniaepneumonia,SPP)是儿童肺炎常见类型,在影像诊断方面,目前CT因无创、快速及密度分辨率高等优点成为儿童诊断肺炎的常规技术,在评估疾病程度、诊断和鉴别不同类型肺炎时起着重要的作用。但在实际临床应用中,往往多缺乏特征性的临床和影像学表现,大部分支原体肺炎与肺炎链球菌肺炎的影像学表现类似,导致定性诊断和鉴别困难,而且实验室培养检测周期较长,在一定程度上影响着及时用药治疗。

发明内容

为改善现有技术的不足,本发明提供一种基于影像组学的鉴别实性小儿肺炎支原体肺炎与肺炎链球菌肺炎的方法,可以针对特定的感兴趣区提取有效特征并构建、训练得到能够定性识别上述两种肺炎的模型,识别快速且准确,提高了临床实用性,可为临床医生提供有价值的诊断信息,促进个性化精准治疗的发展。

具体地,本发明提供了下述的技术特征,以下技术特征的一个或多个的结合构成本发明的技术方案。

在本发明的第一方面,本发明提供了一种识别实性小儿肺炎支原体肺炎与肺炎链球菌肺炎的方法,其包括:

获取病患待识别CT肺窗图像;

输入所述待识别CT肺窗图像至肺炎识别模型,所述肺炎识别模型对所述待识别CT肺窗图像进行定性分析操作,获得所述待识别CT肺窗图像的定性分析结果;

其中,所述肺炎识别模型的构建方法包括:

获取数据,所述数据为勾画了肺部病变感兴趣区(ROI)的实性小儿肺炎支原体肺炎(MPP)与肺炎链球菌肺炎(APP)患者的CT肺窗图像;所述肺部感兴趣区包括肺部实质病变区和周围的炎性渗出区(晕征区)。

提取ROI中的影像组学特征并构建影像组学模型;

对影像组学模型进行数据训练和测试,将训练好的模型作为肺炎识别模型。

可选地,勾画ROI可采用人工勾画,比如寻找资深医生进行勾画后另一名资深医生复查。

可选地,勾画可采用勾画设备,该类设备可对病灶进行识别和勾画,并输出勾画后的图像。

可选地,获取数据的过程还包括对对勾画了ROI的患者CT肺窗图像进行预处理,比如进行灰度归一化处理,以减少对比度和亮度变化的影响。

可选地,提取ROI中的影像组学特征包括将ROI量化为特征并进行有效性筛选。

将ROI量化的方式,比如,在本发明的一些实施方式中,可利用Radcloud 平台(http://radcloud.cn/)从CT图像中提取定量影像特征;将提取定量影像特征进行分组,分组方式包括但不限于描述符(其可通过常用的基本指标定量描述CT图像中体素强度的分布)、基于形状和大小的特征(比如反映区域形状和大小的三维特征)、纹理特征等等。然后,可选地,采用组内相关系数(intra-class correlation,ICC)法量化ROI;利用方差阈值、SelectBest和最小绝对值收缩选择算子(LASSO)逻辑回归模型对量化的ROI特征进行筛选以提取有效的影像组学特征。

在本发明的一些实施方式中,在提取有效的影像组学特征时,采用方差阈值法去除低于特定方差值的特征,采用SelectKBest选用所有p值小于特定值的特征,采用LASSO逻辑回归模型使用L1正则化器作为代价函数筛选特征。具体地,在一些实施方式中,比如通过ICC法进行量化,重复性较低的特征被排除在后续分析之外,丢弃ICC小于0.85的任何特征。通过降维和特征选取减少冗余特征、获得最佳效果。特征选择方法运用方差阈值(方差阈值=0.8)、SelectKBest和LASSO模型等。对于方差阈值法,阈值为0.8,从而去除方差小于0.8的特征值。SelectKBest方法属于单变量特征选择方法,利用p值分析特征与分类结果之间的关系,所有p值小于0.05的特征都将被使用。对于LASSO模型,使用L1正则化器作为代价函数,交叉验证的误差值为5,最大迭代次数为1000次。

可选地,所述影像组学模型采用分类器模型,选自k-最近邻算法(KNN)、支持向量机(SVM)、极端梯度推进(XGBoost)、随机森林(RF)、逻辑斯蒂回归(LR)和决策树(DT)中的一种或多种。

在本发明的一个或多个实施方式中,分类器模型为XGBoost时具有最优的分类效果。

在本发明的实施方式中,将勾画了ROI的患者CT肺窗图像随机分为测试组和训练组,对构建的影像组学模型进行训练和测试,将训练好的模型作为肺炎识别模型。

在本发明的一些实施方式中,训练数据集与测试数据集以一定的比例分层随机抽样建立,一般而言以7-9:1-3的比例为宜。

在本发明的实施方式中,预测性能的评估可采用受试者工作特性(ROC) 曲线,一般而言,0.5<AUC≤0.7模型预测效能较低,0.7<AUC≤0.9模型预测效能中等,AUC>0.9模型预测性能较高。

在本发明的实施方式中,为了更为精准的评价模型的性能,本发明还引入了准确率(precision,P)(指所有被预测为某一样本中实际预测正确的比例)、召回率(recall,R)(指实际为某一样本中被预测正确的比例)、F1分数 (F1-score)(基于准确率和召回率的调和平均)和支持度(support)(参与的总样本数)。

在本发明的第二方面,本发明提供了一种识别设备,其包括:存储器和处理器,所述存储器用于存储计算机程序,所述处理器,用于当执行所述计算机程序时,实现如上所述的识别实性小儿肺炎支原体肺炎与肺炎链球菌肺炎的方法。

在本发明的一个或多个实施方式中,存储器用于存储肺炎识别模型,以及,存储在存储器上并在处理器上运行的软件程序;处理器执行软件程序时实现以下步骤:

输入所述待识别图像至肺炎识别模型,所述肺炎识别模型对所述待识别图像进行识别,获得所述待识别图像的定性分析结果;

输出所述待识别图像的定性分析结果以及用于指示特征区域的输出图像。

在本发明的第三方面,本发明提供了一种识别实性小儿肺炎支原体肺炎与肺炎链球菌肺炎的系统,其包括:数据获取单元,数据处理单元,以及,可选地包括结果输出单元;

数据获取单元用于获取病患待识别CT肺窗图像;

数据处理单元用于输入所述待识别CT肺窗图像至肺炎识别模型,所述肺炎识别模型对所述待识别CT肺窗图像进行定性分析操作,获得所述待识别CT肺窗图像的定性分析结果;

结果输出单元用于输出所述待识别CT肺窗图像的定性分析结果。

在本发明的一个或多个实施方式中,一种识别实性小儿肺炎支原体肺炎与肺炎链球菌肺炎的系统,可以包括:医疗影像设备和识别设备;

医疗影像设备,用于拍摄病患肺部CT图像后发送CT肺窗图像;

识别设备,用于接收医疗影像设备发送的CT肺窗图像,(可选地,对所述CT图像进行预处理操作获得待识别CT肺窗图像),输入所述待识别CT 肺窗图像至肺炎识别模型,所述肺炎识别模型对所述待识别图像进行识别,获得所述待识别图像的定性分析结果;输出所述待识别图像的定性分析结果;以及,可选地发送定性分析结果;

以及,所述系统可选地,包括医生门诊设备用于录入病患的临床个性化数据和接收识别设备发送的定性分析结果。

在本发明的第四方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序被处理器执行时,实现如上所述的识别实性小儿肺炎支原体肺炎与肺炎链球菌肺炎的方法。

在本发明的一个或多个实施方式中,当所述计算机程序被处理器执行时,包括执行以下步骤:输入所述待识别图像至肺炎识别模型,所述肺炎识别模型对所述待识别图像进行识别,获得所述待识别图像的定性分析结果;输出所述待识别图像的定性分析结果以及用于指示特征区域的输出图像。

在本发明的实施方式中,本发明方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本申请实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备,比如可以是个人计算机、服务器、移动计算设备或者网络设备等,执行本申请各个实施例所述方法的全部或部分步骤。而所述的存储介质包括:U盘、移动硬盘、只读存储器(ROM、Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

通过上述技术手段,可实现以下有益效果:

本发明以包含肺部实质病变区和周围炎性渗出区域为感兴趣进行勾画并提取特征,能够最大范围的且最高效的提取有效的影像组学特征,更加精准的识别出两种疾病导致的病理改变,同时以此提取的有效特征构建基于影像组学的识别模型,提高了模型的可信度、敏感度和特异度。本发明提供的识别小儿MPP和APP的方法和系统,可以较准确和客观对MPP 与SPP进行识别,提高了识别的准确性,同时减少了预测过程中的工作量、增加了识别效率。

附图说明

构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。以下,结合附图来详细说明本发明的实施方案,其中:

图1为ROI勾画示意图,A为支原体ROI,B为肺炎链球菌ROI;左侧图像为未勾画,右侧图像未进行了勾画。

图2为特征选择的方差阈值横向条形统计图;每类方法(即图2纵坐标中的每组)中的上方色条均表示提取的所有影像组学特征数,下方色条均表示经方差阈值法筛选后的影像组学特征数,纵坐标为15类过滤方法(方差阈值=0.8)。

图3为最佳K特征选择的横向条形统计图。横坐标为特征的p值,纵坐标为通过slectKbest方法筛选出p值<0.05的特征。

图4为Lasso法特征筛选示意图;A:Lasso路径,横坐标为α的log 值,纵坐标表示特征的系数;B:MSE路径横坐标表示α的log值,纵坐标表示均方误差;C:Lasso模型回归系数,横坐标表示回归系数,纵坐标表示的是筛选出来的特征。

图5为score矩阵;A为实变区域ROI的score矩阵,B为实变+周围炎性渗出区域ROI的score矩阵。

图6为XGBoost模型的ROC曲线。黄色曲线为MPP组,蓝色曲线为 SPP组。

图7为本发明一种实施方式中所述的识别实性小儿肺炎支原体肺炎与肺炎链球菌肺炎的系统的结构示意图。

图8为本发明一种实施方式中所述的一种识别实性小儿肺炎支原体肺炎与肺炎链球菌肺炎的系统的结构示意图。

具体实施方式

下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件或按照制造厂商所建议的条件。

除非另行定义,文中所使用的所有专业与科学用语与本领域熟练人员所熟悉的意义相同。本发明所使用的试剂或原料均可通过常规途径购买获得,如无特殊说明,本发明所使用的试剂或原料均按照本领域常规方式使用或者按照产品说明书使用。此外,任何与所记载内容相似或均等的方法及材料皆可应用于本发明方法中。文中所述的较佳实施方法与材料仅作示范之用。

1材料和方法

1.1研究对象

本实施例经山东大学齐鲁医院和山东大学齐鲁儿童医院伦理委员会批准。收集2017年1月1日至2019年7月1日在山东大学齐鲁医院和山东大学齐鲁儿童医院就诊的MPP与SPP患儿,所有病例经临床和肺泡灌洗液核酸检测确诊,对入组患儿的胸部平扫CT图像进行回顾性分析。本实施例共入组患儿63例,其中支原体感染患儿30例,其中男15例,女15例,平均年龄23.6±14.7月,范围3月到53月;肺炎链球菌感染33例,其中男22例,女11例;平均年龄19.8±19.2月;年龄范围3月到44月。所有患儿符合肺炎的临床表现,如发热、咳嗽和存在相应影像学表现。然后将入组的63例小儿肺炎患者以7:3的比例分层随机抽样将所有患者分为训练组43例与测试组20例。

入组标准需同时满足:1、通过支气管镜取肺泡灌洗液,行核酸检测,证实为支原体感染与肺炎链球菌感染,且对应的治疗有效的患者;2、CT图像肺窗上均显示实变为主的病变;3两位有经验胸部影像学诊断副教授均无法鉴别肺炎的性质。排除标准需满足至少一项:1、影像学诊断和评价与核酸检测结果一致;2、CT图像有运动伪影、图像质量差、扫描条件差异大,层厚不一致的;3、对应治疗无效,或临床怀疑存在混合感染等情况无法确认病原学性质的;4、其他的肺炎或疾病,或者是无法确认的肺炎。

1.2CT扫描方法

采用SOMATOM Definition AS 64排螺旋CT,行常规CT胸部平扫,扫描范围:肺尖至膈顶下5cm,参数设置:管电压120KV,管电流 250~400mA/s(使用自动管电流调制),FOV:18~35cm,矩阵512×512,层厚5mm,层间距5mm,扫描时间为1.0s,不配合检查者常规服用镇静药。

1.3图像勾画

所有CT肺窗图像上病变的感兴趣区(ROI)都由两名分别具有5年与10 年工作经验的放射科医师双盲法进行评估勾画,前一名医生勾画结束后再由后一名资深医师进行复查。如果差异≥5%,由后者决定边界并重新勾画。病变ROI的勾画包括两种方法:第一种为实变区+周围的炎性渗出区(晕征区),如果病变含有空洞也涵盖在内,同时参照纵隔窗避开邻近的纵膈、胸膜、胸腔积液等;第二种则不包括周围的渗出区;勾画方式如图1所示。然后进行灰度归一化处理,以减少对比度和亮度变化的影响。最终,63例患者的CT 图像中分割出63个ROI,用于受试者分析。

1.4特征提取与筛选

利用Radcloud平台(http://radcloud.cn/)从CT图像中提取定量影像特征共1409个。这些特性可以分为三组。第一组(一阶统计量)由126个描述符组成,描述符通过常用的基本指标定量描述了CT图像中体素强度的分布。第二组 (基于形状和大小的特征)包含14个反映区域形状和大小的三维特征。第三组根据灰度级运行长度和灰度级共现纹理矩阵计算,将能够量化区域异质性差异的525个纹理特征归为3类(纹理特征)。纹理特征则刻画了图像中重复出现的局部模式与他们的排列规则,包括灰度共生矩阵(gray level co-occurrence matrix,GLCM)特征、灰度游程矩阵(gray level run length matrix, GLRLM)特征和灰度区域大小矩阵(gray level size zone matrix,GLSZM)特征等75种特征。此外,通过使用指数、对数、梯度、平方值、平方根、lbp-2D 和小波(小波-LHL、小波-LHH、小波-HLL、小波-LLH、小波-HLH、小波 -HHH、小波-HHL、小波-LLL)等14种滤波器对图像进行滤波处理,对纹理进行多分辨表示,在更精细的尺度上分析纹理。

针对观察者内和观察者间勾画变异,每个特征的观察者内和观察者间一致性通过计算的特征对之间的组内相关系数(intra-class correlation,ICC)进行量化,重复性较低的特征被排除在后续分析之外,丢弃ICC小于0.85的任何特征。通过降维和特征选取减少冗余特征、获得最佳效果。特征选择方法运用方差阈值(方差阈值=0.8)、SelectKBest和LASSO模型等。对于方差阈值法,阈值为0.8,从而去除方差小于0.8的特征值。SelectKBest方法属于单变量特征选择方法,利用p值分析特征与分类结果之间的关系,所有p 值小于0.05的特征都将被使用。对于LASSO模型,使用L1正则化器作为代价函数,交叉验证的误差值为5,最大迭代次数为1000次。

1.5影像学组模型构建

对入组的临床数据以及后续的影像组学统计分析,训练数据集与测试数据集以7:3的比例分层随机抽样建立训练组(n=43)与测试组(n=20),随机种子数为606个。使用KNN、SVM、XGBoost、RF、LR和DT 6个分类器,构建基于影像组学的机器学习模型对MPP与SPP进行建模。

1.6评价指标

为了评估预测性能,在训练数据集和测试数据集分别使用了受试者工作特性(ROC)曲线,即曲线下面积(AUC)。0.5<AUC≤0.7模型预测效能较低,0.7<AUC≤0.9模型预测效能中等,AUC>0.9模型预测性能较高。除此之外,用4个指标来评价模型的性能,包括准确率(precision,P)(指所有被预测为某一样本中实际预测正确的比例)、召回率(recall,R)(指实际为某一样本中被预测正确的比例)、F1分数(F1-score)(基于准确率和召回率的调和平均)、支持度(support)(参与的总样本数)。采用随机分组将测试集结果作为机器学习的评估方法从整体评估模型分类的精确度,取每次验证得分数字的平均数,建立精准度(score)矩阵,以此来筛选出合适的ROI,并选取最优的机器学习模型。

1.7统计分析

采用R3.0软件对数据进行统计分析。年龄用±s表示,组间比较采用独立样本t检验;性别、炎症部位采用x2检验。通过选取的特征与对应加权系数乘积的线性组合依次形成每个患者的影像组学标签,并据此计算每个患者基于各影像组学标签的风险评分。在训练组中分别MPP与SPP的影像组学特征进行统计分析,建立准确度(score)矩阵简单对比和评估不同影像组学模型的训练结果。运用受试者工作特征(ROC)曲线评估模型鉴别效能。 P<0.05表示有统计学意义。

2结果

2.1一般资料

Mpp组与Spp组患者年龄、性别、炎症部位均无统计学差异(P<0.05),如表1。

表1受试者一般资料比较

2.2特征提取与筛选结果

本实施例通过方差阈值法从经过ICC检验的1209个CT特征中筛选出449个特征(图2),然后用K个最佳方法筛选出34个特征(图3),最后用 LASSO算法筛选出7个最优特征(图4)。基于这7个特征和其回归系数构建影像组学评分(Rad-score)公式,公式为:Rad-score=特征*系数(表2) 表2实变+周围炎性渗出区域ROI筛选出的影像组学特征及其类别、滤波器、回归系数

2.3影像组学模型的鉴别效能

实变区ROI的精准度矩阵得分见图5中A图所有分类器的测试集ROC 曲线分析结果见表3。当ROI包含周围炎性渗出区域后,所有分类器score 得分均有明显提升(图5中B图),所有分类器测试集的ROC曲线分析结果见表4,其中XGBoost分类器得分最高,使用此分类器训练时,MPP测试集的AUC值为0.889(95%可信区间:0.72~1.00,敏感度0.89,特异度0.82), SPP测试集的AUC值为0.889(95%可信区间:0.72-1.00,敏感度0.82,特异度0.89)(图6)。分类器的4个指标(准确率,召回率,F1分数,支持度)见表 5。

表3实变区域ROI测试集分类器的ROC曲线分析结果

表4实变+周围炎性渗出区域ROI测试集分类器的ROC曲线分析结果

表5实变+周围炎性渗出区域ROI训练集的四个指标评价结果

3讨论

本实施例中的病例全部选取肺泡灌洗液,对常见13种的病原菌(肺炎链球菌、金黄色葡萄球菌、耐甲氧西林葡萄球菌、大肠埃希氏菌、肺炎克雷伯菌、铜绿假单胞菌、鲍曼不动杆菌、嗜麦芽窄食单胞菌、流感嗜血杆菌、嗜肺军团菌、结核分枝杆菌符合群、肺炎支原体、肺炎衣原体)进行多重 PCR检测,作为诊断支原体与肺炎链球菌、排除混合感染的诊断依据。同时根据对应的治疗结果和随访影像学吸收情况进行结果验证,以最大程度上保证病例结果的可靠性。

MPP与SPP有着不同的病理机制:尽管两者早期均是由于呼吸道支气管上皮受到损伤,出现支气管壁水肿或者单核巨噬细胞的浸润。但MPP的早期病变主要发生在小的气道,出现明显炎症反应时,支气管旁炎性组织会浸润小叶间隔,导致肺间质增厚,肺实质密度增高,影像学表现为支气管壁增厚和袖口征,支气管血管束或轨道型、环形增粗征象等。SPP是侵袭细菌荚膜造成了肺叶的水肿和充血,炎症主要是发生在肺泡腔内。由于肺炎链球菌会导致肺叶出现明显的炎性反应,故磨玻璃影和网状影不太明显,支气管增厚会被大量渗出物覆盖,因此增厚表现不显著。研究表明,两种肺炎在扇形薄片影、肺内实变影、磨玻璃影、网状影、支气管壁增厚、支气管血管束增厚的发生率并不相同。但当炎症进一步进展,肺组织渗出明显,肺泡内气体被挤压减少,影像学表现为致密的片状影,成为实性肺炎,在此情况下,两种不同炎症早期出现上述的各种影像学表现被掩盖,单凭肉眼难以识别,因此CT的诊断和鉴别能力也大大降低。虽然如此,但发明人认为在大量渗出物的背景下,两种疾病导致的病理改变的差异依然存在,因此,本发明将肺部实质病变区和周围的炎性渗出区两者同时作为感兴趣区进行勾画,而结果也证实,由此区域提取能够最大范围的且最高效的提取有效的影像组学特征,更加精准的识别并展现出两种疾病导致的病理改变,同时以此提取的有效特征构建基于影像组学的识别模型,提高了模型的可信度、敏感度和特异度。

在本发明的实施方式中,可采用多种机器学习的方法来建立分类模型。本实施例选取6种分类器模型(KNN、SVM、XGBoost、RF、LR和DT) 对MPP与SPP进行鉴别,选取其中最优的影像组学算法模型,提取了63例小儿肺炎患者的63个ROI,以7:3的比例分层随机抽样建立训练组(n=43) 与测试组(n=20),对手工勾画的ROI进行数据提取和挖掘,利用方差阈值、 SelectBest和最小绝对值收缩选择算子(LASSO)逻辑回归模型进行特征筛选,分析由MPP与SPP引起小儿肺炎在CT图像上的显著性差异。结果发现当以实变区域为ROI时,KNN分类器的AUC值为0.628,其模型其分类效能较低。当勾画的ROI包含周围炎性渗出区域后,所有分类器AUC值都有明显提升,其中XGBoost分类器的AUC值最高,其结果为0.889,而误诊率与漏诊率有所降低,说明实变周围炎性渗出区域对于鉴别两种肺炎是有意义的。通过模型的建立和测试,证实影像组学在支原体与肺炎链球菌导致的小儿肺炎的鉴别中体现出良好的价值。此研究的结果与两者病理结果存在差异是一致的,表明利用影像组学的数据在两者鉴别中的意义和价值存在病理基础,表明放射组学模型可以作为鉴别小儿支原体肺炎与肺炎链球菌肺炎的新的工具,可为临床医生提供额外的诊断信息,促进个性化精准治疗的发展。

综上所述,基于纹理特征建立的模型可以较准确和客观对MPP与SPP 进行鉴别,表明影像组学是鉴别两者的重要的无创的、简便易行的技术方法,实变+周围炎性渗出的区域最合适用来勾画感兴趣区,其中XGBoost算法模型的分类效能最佳。

本发明提供了一种识别实性小儿肺炎支原体肺炎与肺炎链球菌肺炎的系统,其包括:数据获取单元,数据处理单元,以及,

可选地包括结果输出单元;

数据获取单元用于获取病患待识别CT肺窗图像;

数据处理单元用于输入所述待识别CT肺窗图像至肺炎识别模型,所述肺炎识别模型对所述待识别CT肺窗图像进行定性分析操作,获得所述待识别CT肺窗图像的定性分析结果;

结果输出单元用于输出所述待识别CT肺窗图像的定性分析结果。

在一个或多个实施方式中,所述系统中可以包括:医疗影像设备和识别设备;如图7所示;

医疗影像设备,用于拍摄病患肺部CT图像后发送CT肺窗图像;

识别设备,用于接收医疗影像设备发送的CT肺窗图像,输入所述待识别CT肺窗图像至肺炎识别模型,所述肺炎识别模型对所述待识别图像进行识别,获得所述待识别图像的定性分析结果;输出所述待识别图像的定性分析结果;以及,可选地发送定性分析结果。

在一个或多个实施方式中,识别设备中可对接收的CT图像进行预处理操作,比如进行灰度归一化处理,以减少对比度和亮度变化的影响从而获得待识别CT肺窗图像。

在一个或多个实施方式中,所述系统还可以进一步包括医生门诊设备,用于录入病患的临床个性化数据和接收识别设备发送的定性分析结果,如图 8所示。

可以理解的是,医生门诊设备和医疗影像设备的数量为1至多个,可以根据实际情况而定。临床个性化数据、CT图像与患者编号或名称对应,以便使临床个性化数据、CT图像与患者相关联。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号