首页> 中国专利> 肺腺癌HE染色病理图像肿瘤区域多尺度特征提取与预后分析方法、装置

肺腺癌HE染色病理图像肿瘤区域多尺度特征提取与预后分析方法、装置

摘要

本发明公开了一种肺腺癌H&E染色病理图像肿瘤区域多尺度特征提取及预后分析方法、装置,方法包括下述步骤:根据病理图像呈现金字塔架构,采用阈值分割方法通过多层映射提取病理图像的组织区域,将所述病理图像的组织区域划分为若干设定大小的图像块,并将图像块采用预先设立的分类模型进行分类检测,完成肿瘤区域自动分割;基于肿瘤区域自动分割的结果,获取不同放大倍率下的多尺度子图像块,提取多尺度子图像块的多尺度特征;根据提取的多尺度特征,确定每个病例相应的风险评分Score,基于病例的生存状态和生存时间做单因素分析与多因素分析。本发明可实现自动地完成肺腺癌H&E染色病理图像肿瘤区域分割、多尺度特征提取及预后分析。

著录项

  • 公开/公告号CN114841947A

    专利类型发明专利

  • 公开/公告日2022-08-02

    原文格式PDF

  • 申请/专利权人 广东省人民医院;

    申请/专利号CN202210449852.3

  • 申请日2022-04-27

  • 分类号G06T7/00(2017.01);G06T7/11(2017.01);G06T7/136(2017.01);G06T7/187(2017.01);G06T7/194(2017.01);G06T7/41(2017.01);G06T7/45(2017.01);G06V10/764(2022.01);G06K9/62(2022.01);G16H50/30(2018.01);

  • 代理机构广州市华学知识产权代理有限公司 44245;

  • 代理人李斌

  • 地址 510080 广东省广州市越秀区中山二路106号

  • 入库时间 2023-06-19 16:14:25

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-08-19

    实质审查的生效 IPC(主分类):G06T 7/00 专利申请号:2022104498523 申请日:20220427

    实质审查的生效

说明书

技术领域

本发明涉及数字图像处理的技术领域,具体涉及一种肺腺癌H&E染色病理图像肿瘤区域多尺度特征提取与预后分析方法、装置。

背景技术

在对肺腺癌患者进行预后分析时,需要对H&E染色数字病理图像定量化挖掘肿瘤区域内部的特征信息。因此,实现肿瘤区域的自动分割以及多尺度特征的挖掘提取,可以在病理分析方面给医生提供服务,辅助病理医生对H&E染色病理图像进行自动高效地分析,极大地减轻医生的工作负担,具有重要的意义。

发明内容

本发明的主要目的在于根据临床上的迫切需求,克服现有技术的缺点与不足,提供一种肺腺癌H&E染色病理图像肿瘤区域多尺度特征提取与预后分析方法、装置,可实现肺腺癌肿瘤区域的自动分割以及多尺度特征信息的挖掘提取,探索影响肺腺癌患者预后的独立性因素,从而极大地减轻病理医生的工作强度。

为了达到上述目的,本发明采用以下技术方案:

本发明一方面提供了一种肺腺癌H&E染色病理图像肿瘤区域多尺度特征提取及预后分析方法,包括以下步骤:

根据病理图像呈现金字塔架构,采用阈值分割方法通过多层映射提取病理图像的组织区域,将所述病理图像的组织区域划分为若干设定大小的图像块,并将图像块采用预先设立的分类模型进行分类检测,完成肿瘤区域自动分割;

基于肿瘤区域自动分割的结果,获取不同放大倍率下的多尺度子图像块,提取多尺度子图像块的多尺度特征,低倍率下的多尺度特征代表组织层面的信息,高倍率下的多尺度特征代表病理图像细胞层面的信息;所述多尺度特征包括一阶统计量特征、灰度共生矩阵特征和灰度游程矩阵特征;

根据提取的多尺度特征,确定每个病例相应的风险评分Score,基于病例的生存状态和生存时间做单因素分析与多因素分析,判断该风险评分Score是否为独立的预后因素,判定患者的高低风险。

作为优选的技术方案,所述肿瘤区域自动分割具体为:

将原始病理图像从RGB颜色空间转换为HSV颜色空间,在HSV颜色空间中,使用OTSU阈值分割算法计算每个通道中的最佳阈值,通过整合RGB通道以及H和S两个通道中的掩码获取组织区域的组织掩码;

子图像块分类检测,根据提取的病理图像的组织掩码,在最高放大倍率的病理图像组织区域上,无重叠区域地滑动一个固定大小的滑动窗口,将组织区域内的图像提取为若干个图像块,采用训练好的分类模型,对滑动窗口所在的图像块进行分类检测;

获取肿瘤区域掩码,根据训练好的分类模型对肺腺癌H&E染色病理图像进行逐图像块分类,每个图像块对应一个分类概率值;每张病理图像生成一张相应的肿瘤区域概率热图,通过OTSU阈值分割算法将概率热图转换为二值掩码,并保留其中最大的连通区域,作为最终的肿瘤区域掩码。

作为优选的技术方案,所述分类模型的训练过程具体为:

在用于多例肺腺癌患者对应的H&E染色数字病理图像上,病理医生对病理图像标注出肿瘤组织的具体范围,在最高放大倍率下分别切取肿瘤区域与正常区域的若干个图像块,将图像块作为训练样本对预训练的分类模型进行进一步训练;

所述预训练过程,用于确定分类模型的初始参数,首先使用ImageNet自然图像数据集进行预训练,以提高分类模型在图像分类过程的性能,然后将此模型参数迁移到分类模型上,使用具有肿瘤区域标注的公开病理图像数据集再次进行预训练,用来提高分类模型在病理图像数据集上的分类性能,将预训练的模型参数迁移到肺腺癌H&E染色病理图像肿瘤区域与正常组织的分类模型中,以此参数作为模型参数的初始化状态,使用上述病理医生标注好的肺腺癌病理图像数据进行重新训练,进一步提高该分类模型在肺腺癌H&E染色病理图像上的泛化性能。

作为优选的技术方案,所述提取多尺度子图像块的多尺度特征具体为:

切取子图像块,根据肿瘤区域自动分割的结果,获取若干多尺度子图像块,分别是N1倍、N2倍以及N3倍三个放大倍率,且N1<N2<N3;在N1倍放大倍率下,直接获取肿瘤区域内的病理图像,N2倍和N3倍放大倍率下,沿肿瘤区域边缘切取固定大小的若干子图像块,每张子图像块中组织区域的面积占大于等于70%;其中,N3倍放大倍率下,每个病例随机选取若干张子图像块;最后,针对三个尺度的图像块进行统一颜色归一化处理;

特征提取,基于上述切取的多尺度子图像块,提取多尺度特征,每个病例在每个尺度提取多维特征。

作为优选的技术方案,所述多尺度特征包括:一阶统计量特征、灰度共生矩阵的纹理特征和灰度游程矩阵的纹理特征:

一阶统计量特征包括最小值、最大值、全距、四分位距、平均值、中位数、第10个百分位、第90个百分位、方差、标准差、均匀性、熵、能量、偏度、峰度、平均绝对离差、均方根差17个特征值;

灰度共生矩阵P(i,j)的纹理特征具体如下,其中,(i,j)表示图像像素点;

对比度:

非相似性:

互相关性:

同质性:

角二阶矩:

能量:

标准差:

Std=std(P(i,j))

灰度游程矩阵P(i,j|θ)的纹理特征如下,其中,i表示原始图像中的像素值,i的所有取值为原始图像的灰度级数;j表示像素值所游走的长度,也就是在图像中有j个连续的i出现,θ表示计算的方向,θ有0度、45度、90度和135度;

短游程优势:

长游程优势:

灰度不均匀性:

长游程不均匀性:

游程百分比:

其中,N

低灰度级游程优势:

高灰度级游程优势:

短游程低灰度级优势:

短游程高灰度级优势:

长游程低灰度级优势:

长游程高灰度级优势:

作为优选的技术方案,所述预后分析包括以下步骤:

特征选择,根据病例的生存状态和生存时间建立Lasso Cox模型,进行特征筛选,确定最具代表性的n个特征f用于构建最终的风险评分;

生存分析,利用score的中位数作为最佳截断点,将风险评分score二值化处理后得到Score,构建Cox比例风险回归模型h(t,X)=h

作为优选的技术方案,构建最终的风险评分,使用如下公式进行计算:

score=ω

其中,ω

作为优选的技术方案,所述生存分析的具体步骤包括:

确定最佳截断点,通过无监督的方式选取score的中位数确定最佳截断点,将连续变量进行二值化;

单因素分析,利用单一因素建立Cox比例风险回归模型,确定该因素是否具有统计学意义,如果p<0.05,则该因素具有统计学意义,否则,无统计学意义;

多因素分析,利用多个具有统计学意义的因素建立Cox比例风险回归模型,确定因素是否是一个独立的预后因素,如果p<0.05,则该因素是一个独立的预后因素,否则不是独立预后因素。

本发明另一方面提供了一种肺腺癌H&E染色病理图像肿瘤区域多尺度特征提取及预后分析系统,应用于所述的肺腺癌H&E染色病理图像肿瘤区域多尺度特征提取及预后分析方法,包括肿瘤区域分割模块、多尺度特征提取模块和预后分析模块;

所述肿瘤区域自动分割模块,根据病理图像呈现金字塔架构,采用阈值分割方法通过多层映射提取病理图像的组织区域,将所述病理图像的组织区域划分为若干设定大小的图像块,并将图像块采用预先设立的分类模型进行分类检测,完成肿瘤区域自动分割;

所述多尺度特征提取模块,基于肿瘤区域自动分割的结果,获取不同放大倍率下的多尺度子图像块,提取多尺度子图像块的多尺度特征,低倍率下的多尺度特征代表组织层面的信息,高倍率下的多尺度特征代表病理图像细胞层面的信息;所述多尺度特征包括一阶统计量特征、灰度共生矩阵特征和灰度游程矩阵特征;

所述预后分析模块,根据提取的多尺度特征,确定每个病例相应的风险评分Score,基于病例的生存状态和生存时间做单因素分析与多因素分析,判断该风险评分Score是否为独立的预后因素,判定患者的高低风险。

本发明又一方面提供了一种计算机可读存储介质,存储有程序,所述程序被处理器执行时,实现所述的肺腺癌H&E染色病理图像肿瘤区域多尺度特征提取及预后分析方法。

本发明与现有技术相比,具有如下优点和有益效果:

1.本发明通过自动分割肿瘤区域来确定肿瘤区域的具体范围,相比其他研究通过人工勾画病理图像的感兴趣区域,实现肿瘤区域的自动分割可以在很大程度上避免大量人力和时间的耗费。

2.本发明根据病理图像呈现金字塔架构,在肿瘤区域自动分割时,采用OTSU阈值分割方法通过多层映射生成组织掩码,即病理图像的组织区域掩码。与其他研究相比,本发明通过该组织掩码可以去除大部分空白背景区域,极大地降低计算成本。

3.本发明根据病理图像本身的特性,自动提取病理图像的多尺度特征,低倍率下的特征代表组织层面的信息,高倍率下的特征代表病理图像细胞层面的信息,在一定程度上效仿病理医生阅片的基本流程,与其他研究相比,可以更加全面地获取病理图像的信息。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明肺腺癌H&E染色病理图像肿瘤区域多尺度特征提取及预后分析方法的整体流程图;

图2(a)为肿瘤区域图本发明肺腺癌H&E染色病理图像肿瘤区域原始图;

图2(b)为图2(a)中肿瘤区域分割的概率热图,

图2(c)为图2(a)中肿瘤区域分割的二值掩码图;

图3为本发明肺腺癌H&E染色病理图像肿瘤区域多尺度特征提取及预后系统的结构示意图;

图4为本发明实施例中计算机可读存储介质的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本申请所描述的实施例可以与其它实施例相结合。

如图1所示,本发明提供一种肺腺癌H&E染色病理图像肿瘤区域多尺度特征提取及预后分析方法,包括肿瘤区域自动分割、多尺度特征提取和预后分析三个步骤,具体为:

S1、肿瘤区域自动分割,自动分割肺腺癌H&E染色数字病理图像上的肿瘤区域,为肿瘤区域的后续分析打下基础;

进一步的,步骤S1包括下述步骤:

S1.1、提取组织区域,病理图像呈现金字塔架构,采用OTSU阈值分割方法通过多层映射提取病理图像的组织区域,并去除大量空白背景区域。

更进一步的,将原始病理图像从RGB颜色空间转换为HSV颜色空间,在HSV颜色空间中,使用OTSU阈值分割算法计算每个通道中的最佳阈值,通过整合RGB通道以及H和S两个通道中的掩码获取组织区域的组织掩码;所述组织掩码通常为原病理图像大小的十六分之一或六十四分之一。

S1.2、子图像块分类检测,根据提取的病理图像的组织掩码,在最高放大倍率的病理图像组织区域上,无重叠区域地滑动一个224*224大小的滑动窗口,将组织区域内的图像提取为若干个224*224大小的图像块。采用训练好的ResNet50模型,对滑动窗口所在的图像块进行分类检测;

更进一步地,所述分类模型的训练过程具体为:

S1.2.1、在用于多例肺腺癌患者对应的H&E染色数字病理图像上,病理医生对其标注出肿瘤组织的具体范围,在最高放大倍率下分别切取肿瘤区域与正常区域的若干个224*224大小的图像块。将这些图像块作为训练样本对预训练的ResNet50模型进行进一步训练;

S1.2.2、所述预训练过程,用于确定ResNet50模型的初始参数,首先使用ImageNet自然图像数据集进行预训练,以提高分类模型在图像分类过程的性能,然后将此模型参数迁移到ResNet50分类模型上,使用具有肿瘤区域标注的公开病理图像数据集,如Camlyon16数据集,再次进行模型预训练,用来提高分类模型在病理图像数据集上的分类性能,将预训练的模型参数迁移到肺腺癌H&E染色病理图像肿瘤区域与正常组织的分类模型中,以此参数作为模型参数的初始化状态,使用上述病理医生标注好的肺腺癌病理图像数据进行重新训练,从而进一步提高该分类模型在肺腺癌H&E染色病理图像上的泛化性能;

S1.3、获取肿瘤区域掩码,根据训练好的分类模型对肺腺癌H&E染色病理图像进行逐图像块分类,每个图像块对应一个分类概率值,将该图像块归类为概率值高的类别。

可以理解的是,每张病理图像可以生成一张相应的肿瘤区域概率热图;后处理时,通过OTSU阈值分割算法将概率热图转换为二值掩码,并保留其中最大的连通区域,作为最终的肿瘤区域二值掩码,其中,像素值为0表示非肿瘤区域,像素值为255表示肿瘤区域,如图2(a)所示;最终的肺腺癌病理图像肿瘤区域分割效果图如图2(b)、图2(c)所示,其中图2(b)为肿瘤区域的概率热图,图2(c)为肿瘤区域的二值掩码图。

S2、多尺度特征提取,基于上述肿瘤区域自动分割的结果,提取2.5倍、10倍以及40倍三个放大倍率的特征,以全面获取肺腺癌病理图像的特征信息。

可以理解的是,上述放大倍率可根据实际的情况进行调整,并不仅限于上述三个放大倍率,其他可实现本发明的倍率同样适用于本申请。

进一步的,步骤S2具体为:

S2.1、切取子图像块,根据肿瘤区域自动分割的结果,获取若干多尺度子图像块,分别是2.5倍、10倍以及40倍三个放大倍率;在2.5倍放大倍率下,直接获取肿瘤区域内的病理图像;在10倍和40倍放大倍率下,沿肿瘤区域边缘切取大小为1024×1024的若干子图像块,每张子图像块中组织区域的面积占比须大于等于70%。其中,40倍放大倍率下,每个病例随机选取200张子图像块。最后,针对三个尺度的图像块进行统一颜色归一化处理。

S2.2、特征提取,基于上述切取的多尺度子图像块,提取多尺度特征;每个病例在每个尺度提取68维特征,共204维特征;自动提取病理图像的多尺度特征,低倍率下的特征代表组织层面的信息,高倍率下的特征代表病理图像细胞层面的信息,在一定程度上效仿病理医生阅片的基本流程,从而可以更加全面地获取病理图像的信息。

更进一步地,所述多尺度特征包括一阶统计量特征和灰度共生矩阵、灰度游程矩阵等纹理特征;具体如下:

S2.2.1、一阶统计量特征,包括最小值、最大值、全距、四分位距、平均值、中位数、第10个百分位、第90个百分位、方差、标准差、均匀性、熵、能量、偏度、峰度、平均绝对离差、均方根差等17个特征值;

S2.2.2、灰度共生矩阵P(i,j),其中,(i,j)表示图像像素点。本发明使用的7个特征值计算公式如下:

对比度:

非相似性:

互相关性:

同质性:

角二阶矩:

能量:

标准差:

Std=std(P(i,j))

S2.2.3、灰度游程矩阵P(i,j|θ)的纹理特征如下,其中,i表示原始图像中的像素值,i的所有取值为原始图像的灰度级数;j表示像素值所游走的长度,也就是在图像中有j个连续的i出现,θ表示计算的方向,θ一般有0度、45度、90度和135度。

短游程优势:

长游程优势:

灰度不均匀性:

长游程不均匀性:

游程百分比:

其中,N

低灰度级游程优势:

高灰度级游程优势:

短游程低灰度级优势:

短游程高灰度级优势:

长游程低灰度级优势:

长游程高灰度级优势:

S3、预后分析,根据肺腺癌H&E染色病理图像提取的多尺度特征,结合患者临床病理信息,构建比例风险回归模型,用于肺腺癌患者的预后分析。

进一步地,预后分析的步骤具体为:

S3.1、特征选择,根据病例的生存状态和生存时间建立Lasso Cox模型,进行特征筛选,确定最具代表性的n个特征f用于构建最终的风险评分:

score=ω

其中,ω

S3.2、生存分析,利用score的中位数作为最佳截断点,将风险评分score二值化获得Score,构建Cox比例风险回归模型h(t,X)=h

更进一步地,生存分析的步骤具体为:

S3.2.1、确定最佳截断点,通过无监督的方式选取score的中位数确定最佳截断点,可以将连续变量进行二值化;

S3.2.2、单因素分析,利用单一因素建立Cox比例风险回归模型,确定该因素是否具有统计学意义。如果p<0.05,则该因素具有统计学意义,否则,无统计学意义;

S3.2.3、多因素分析,利用多个具有统计学意义的因素建立Cox比例风险回归模型,确定因素是否是一个独立的预后因素。如果p<0.05,则该因素是一个独立的预后因素,否则不是独立预后因素。

需要说明的是,对于前述的各方法实施例,为了简便描述,将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。

基于与上述实施例中的肺腺癌H&E染色病理图像肿瘤区域多尺度特征提取及预后分析方法相同的思想,本发明还提供肺腺癌H&E染色病理图像肿瘤区域多尺度特征提取及预后分析系统,该系统可用于执行上述肺腺癌H&E染色病理图像肿瘤区域多尺度特征提取及预后分析方法。为了便于说明,肺腺癌H&E染色病理图像肿瘤区域多尺度特征提取及预后分析系统实施例的结构示意图中,仅仅示出了与本发明实施例相关的部分,本领域技术人员可以理解,图示结构并不构成对装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图3所示,本发明另一个实施例提供了一种肺腺癌H&E染色病理图像肿瘤区域多尺度特征提取及预后分析系统,包括肿瘤区域分割模块、多尺度特征提取模块和预后分析模块;

所述肿瘤区域自动分割模块,根据病理图像呈现金字塔架构,采用阈值分割方法通过多层映射提取病理图像的组织区域,将所述病理图像的组织区域划分为若干设定大小的图像块,并将图像块采用预先设立的分类模型进行分类检测,完成肿瘤区域自动分割。

进一步地,所述肿瘤区域自动分割模块包括组织区域提取模块、子图像块分类检测模块和肿瘤区域掩码获取模块。

所述组织区域提取模块,根据病理图像呈现金字塔架构,采用OTSU阈值分割方法通过多层映射提取病理图像的组织区域,并去除大量空白背景区域。具体来说,将原始病理图像从RGB颜色空间转换为HSV颜色空间,在HSV颜色空间中,使用OTSU阈值算法计算每个通道中的最佳阈值,通过整合RGB通道以及H和S两个通道中的掩码获取组织区域的组织掩码。该组织掩码通常为原病理图像大小的十六分之一或六十四分之一;

所述子图像块分类检测模块,根据提取的病理图像的组织掩码,在最高放大倍率的病理图像组织区域上,无重叠区域地滑动一个224*224大小的滑动窗口,将组织区域内的图像提取为若干个224*224大小的图像块。采用训练好的ResNet50模型,对滑动窗口所在的图像块进行分类检测;

所述肿瘤区域掩码获取模块,根据训练好的分类模型对肺腺癌H&E染色病理图像进行逐图像块分类,每个图像块对应一个分类概率值,将该图像块归类为概率值高的类别。由此,每张病理图像可以生成一张相应的肿瘤区域概率热图。后处理时,通过OTSU阈值方法将概率热图转换为二值掩码,并保留其中最大的连通区域,作为最终的肿瘤区域二值掩码。其中,像素值为0表示非肿瘤区域,像素值为255表示肿瘤区域。

所述多尺度特征提取模块,基于肿瘤区域自动分割的结果,获取不同放大倍率下的多尺度子图像块,提取多尺度子图像块的多尺度特征,低倍率下的多尺度特征代表组织层面的信息,高倍率下的多尺度特征代表病理图像细胞层面的信息;所述多尺度特征包括一阶统计量特征、灰度共生矩阵特征和灰度游程矩阵特征。

进一步地,所述多尺度特征提取模块包括子图像块切取模块和特征提取模块;

所述子图像块切取模块,根据肿瘤区域自动分割的结果,获取若干多尺度子图像块,分别是N1倍、N2倍以及N3倍三个放大倍率;在N1倍放大倍率下,直接获取肿瘤区域内的病理图像,在N2倍和N3倍放大倍率下,沿肿瘤区域边缘切取设定大小的若干子图像块,每张子图像块中组织区域的面积占比须大于等于70%。其中,N3倍放大倍率下,每个病例随机选取200张子图像块。最后,针对三个尺度的图像块进行统一颜色归一化处理;

所述特征提取模块,基于上述切取的多尺度子图像块,提取多尺度特征。每个病例对应提取每个尺度提取多维多尺度特征。自动提取病理图像的多尺度特征,低倍率下的特征代表组织层面的信息,高倍率下的特征代表病理图像细胞层面的信息,在一定程度上效仿病理医生阅片的基本流程,从而可以更加全面地获取病理图像的信息。

更进一步地,多尺度特征包括一阶统计量特征模块和灰度共生矩阵、灰度游程矩阵等纹理特征模块;

所述一阶统计量特征模块,包括最小值、最大值、全距、四分位距、平均值、中位数、第10个百分位、第90个百分位、方差、标准差、均匀性、熵、能量、偏度、峰度、平均绝对离差、均方根差等17个特征值;

所述纹理特征模块,包括灰度共生矩阵特征和灰度游程矩阵特征。所述灰度共生矩阵特征包括7个特征值为:对比度、非相似性、互相关性、同质性、角二阶矩、能量、标准差。所述灰度游程矩阵特征一般有四个计算方向θ:0度、45度、90度和135度,包括:短游程优势、长游程优势、灰度不均匀性、长游程不均匀性、游程百分比、低灰度级游程优势、高灰度级游程优势、短游程低灰度级优势、短游程高灰度级优势、长游程低灰度级优势、长游程高灰度级优势。

所述预后分析模块,根据提取的多尺度特征,确定每个病例相应的风险评分Score,基于病例的生存状态和生存时间做单因素分析与多因素分析,判断该风险评分Score是否为独立的预后因素,判定患者的高低风险;

进一步地,所述预后分析模块包括特征选择模块和生存分析模块。

所述特征选择模块,根据病例的生存状态和生存时间建立Lasso Cox模型,进行特征筛选,确定最具代表性的n个特征f,与对应权重加权求和,构建最终的风险评分。

所述生存分析模块,利用score的中位数作为最佳截断点,将风险评分score二值化获得Score,构建Cox比例风险回归模型,对风险评分Score以及年龄、性别、吸烟状态、病变部位以及TNM分期等临床信息分别做单因素分析;对于p<0.05的因素做多因素分析;多因素分析中,确定风险评分Score是一个独立的预后因素。

更进一步地,生存分析模块包括最佳截断点确定模块、单因素分析模块和多因素分析模块。

所述最佳截断点确定模块,通过无监督的方式选取score的中位数确定最佳截断点,可以将连续变量进行二值化。

所述单因素分析模块,利用单一因素建立Cox比例风险回归模型,确定该因素是否具有统计学意义。如果p<0.05,则该因素具有统计学意义,否则,无统计学意义。

所述多因素分析模块,利用多个具有统计学意义的因素建立Cox比例风险回归模型,确定因素是否是一个独立的预后因素。如果p<0.05,则该因素是一个独立的预后因素,否则不是独立预后因素。

需要说明的是,本发明的肺腺癌H&E染色病理图像肿瘤区域多尺度特征提取与预后分析系统与本发明的肺腺癌H&E染色病理图像肿瘤区域多尺度特征提取与预后分析方法一一对应,在上述肺腺癌H&E染色病理图像肿瘤区域多尺度特征提取与预后分析方法的实施例阐述的技术特征及其有益效果均适用于肺腺癌H&E染色病理图像肿瘤区域多尺度特征提取与预后分析系统的实施例中,具体内容可参见本发明方法实施例中的叙述,此处不再赘述,特此声明。

此外,上述实施例的肺腺癌H&E染色病理图像肿瘤区域多尺度特征提取与预后分析系统的实施方式中,各程序模块的逻辑划分仅是举例说明,实际应用中可以根据需要,例如出于相应硬件的配置要求或者软件的实现的便利考虑,将上述功能分配由不同的程序模块完成,即将所述肺腺癌H&E染色病理图像肿瘤区域多尺度特征提取与预后分析系统的内部结构划分成不同的程序模块,以完成以上描述的全部或者部分功能。

如图4所示,在一个实施例中,提供了一种计算机可读存储介质,用于存储程序在存储器中,所述程序被处理器执行时,实现所述的肺腺癌H&E染色病理图像肿瘤区域多尺度特征提取与预后分析方法,具体为:

根据病理图像呈现金字塔架构,采用阈值分割方法通过多层映射提取病理图像的组织区域,将所述病理图像的组织区域划分为若干设定大小的图像块,并将图像块采用预先设立的分类模型进行分类检测,完成肿瘤区域自动分割;

基于肿瘤区域自动分割的结果,获取不同放大倍率下的多尺度子图像块,提取多尺度子图像块的多尺度特征,低倍率下的多尺度特征代表组织层面的信息,高倍率下的多尺度特征代表病理图像细胞层面的信息;所述多尺度特征包括一阶统计量特征、灰度共生矩阵特征和灰度游程矩阵特征;

根据提取的多尺度特征,确定每个病例相应的风险评分Score,基于病例的生存状态和生存时间做单因素分析与多因素分析,判断该风险评分Score是否为独立的预后因素,判定患者的高低风险。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序指令相关的硬件来完成,所述的程序可存储于非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号