摘要:阳性错误发现率(FDR)的概念由Benjamini和Hochberg提出,这一概念的提出,有效地解决了高维组学数据多重比较中假阳性错误的控制问题,并且能够显著提高假设检验的效能.目前,FDR的估计方法很多,其中最具代表性的有LBE、qvalue和fdrtool等,这些方法都是在贝叶斯公式的框架下进行的,使用两成分模型构建p值的分布函数,进而求得FDR的估计值.然而,这些方法主要基于单变量分析方法,要求变量间独立或弱相关,如果变量高度相关,将会导致上述方法失效.实际中,高维组学数据结构复杂,噪声变量多且变量间存在复杂相关,无法满足上述FDR估计方法的应用条件;而且单变量分析无法发现变量间的联合作用和交互作用,不能满足研究需要.本文拟提出一种基于随机森林(RF)多变量模型变量筛选结果的FDR估计方法(RF-FDR法),通过模拟实验探讨RF-FDR法的优势,并通过实例分析说明其在实际研究中的意义.