首页> 中文学位 >考虑自变量个数先验分布的贝叶斯变量选择
【6h】

考虑自变量个数先验分布的贝叶斯变量选择

代理获取

目录

文摘

英文文摘

声明

第一章引言

§1.1贝叶斯变量选择

§1.2本文的主要工作

第二章变维抽样策略

§2.1MCMC理论及其重要性质

§2.1.1MCMC中的各类移动

§2.1.2MCMC算法及其性质

§2.2BDMCMC变维抽样策略

第三章正态线性模型的贝叶斯变量选择

§3.1利用Fisher信息矩阵确定先验分布的方法

§3.1.1贝叶斯统计原理

§3.1.3寻求步骤

§3.1.4负二项分布的Jeffreys先验

§3.1.5威布尔分布的无信息先验

§3.1.6小结

§3.2贝叶斯变量分析

§3.3生灭跳跃和Gibbs抽样

§3.3.1生灭跳跃

§3.3.2抽样算法

第四章模拟试验和结果

§4.1算法对模型参数的依赖性

§4.2数据结果的比较

第五章总结

致谢

参考文献

展开▼

摘要

近年来,由Stephens(2000)提出的生灭过程Markov链Monte Carlo抽样方法(BDMCMC)被广泛应用于复杂数据和复杂模型的贝叶斯统计分析.本文的主要目的是在贝叶斯框架下采用变维BDMCMC抽样策略研究线性模型的变量选择问题.这个问题章平在2006年的硕士学位论文中已经有过系统的研究.本文以此为基础对这个问题作进一步的深入研究.
   利用贝叶斯方法解决变量选择问题,首先要做的就是给参数向量设置合适的先验分布.对于β系数、误差方差及β系数的维数(即模型中回归自变量的个数),本文采用最自然的先验设置.这与章平的做法完全相同.不同的是,在章平的工作中,假定β系数的维数服从一个已知的截断Poisson分布,而本文假定这个分布中的参数λ是未知的,我们认为它服从一个伽玛分布.之所以这样做,是因为λ大致等于真实模型中β系数的维数,其数值在变量选择问题中应当视为未知的、可变的、随机的.
   完成了先验设置之后,我们详细推导了所有参数的后验分布以及相应的Monte Carlo抽样算法.贝叶斯框架下的变量选择问题必然涉及变维抽样.因此,我们的抽样算法比较复杂,它是Gibbs抽样器和BDMCMC的组合.算法的每次迭代输出一个候选的模型(所有回归自变量的一个子集);多次(数千次)迭代过程中,每个模型被选出的频率视为该模型的后验概率的一个估计.此值达到最大的模型就是我们选中的模型.
   我们共进行了两组试验:第一组试验考虑了超参数的设置对变量选择的影响.我们发现,β系数的先验均值应当取0;超参数λ的先验分布г(a,a)中的参数a对结果也有影响,并且a=1似乎是最佳值.第二组试验是本文的算法与章平的方法的对比研究.我们考虑了一个回归自变量个数较少的简单模型和一个回归自变量个数较多的复杂模型.结果显示,对同样的数据、同样的模型,本文的算法访问真实模型的频率明显高于章平的算法.这表明我们的方法更好.
   此外,本文还研究了基于Jeffreys提出的Fisher信息矩阵确定先验分布的方法.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号