
贝叶斯分析第2章.docx
5页§2.4 假设检验一、假设检验经典统计中处理假设检验问题的基本步骤:1.提出检验假设又称无效假设,符号是 H0;备择假设的符号是 H1 0:H1:其中 是参数空间中互不相交的两个非空子集10和H0和 H1假设都是对总体特征的检验假设,相互联系且对立H0总是假设样本差别来自抽样误差,零假设H1是来自非抽样误差,有单双侧之分,备择假设预先设定的检验水准为 ;当检验假设为真,但被错误地拒绝的概率,记05.作 ,通常取 或 .12、选定统计方法,由样本观察值按相应的公式计算出统计量的大小,如值、 值等根据资料的类型和特点,可分别选用 Z 检验,T 检验,秩和检xt验和卡方检验等3、根据统计量的大小及其分布确定检验假设成立的可能性 的大小并判断p结果若 ,结论为按 所取水准不显著,不拒绝 ,即认为差别很可能p 0H是由于抽样误差造成的,在统计上不成立;如果 ,结论为按所取 水准显p著,拒绝 H0,接受 H1,则认为此差别不大可能仅由抽样误差所致,很可能是实验因素不同造成的,故在统计上成立 值的大小一般可通过查阅相应的界值表得到大家可以看到用经典统计十分繁琐,而且在抽样分布不确定时我们无法进行统计推断,但在贝叶斯统计中假设检验问题直截了当,在获得后验分布后,即可计算二个假设检验 的后验概率:)(x 10H和1,0)(ixpi然后比较 的大小,当后验概率比 时接受 H0,当后验概率比10, f时接受 H1,当后验概率比 时,不宜做判断,需要进一步抽样1p10或进一步搜集先验信息。
从上面两种方法可以看出,贝叶斯假设检验是简单的,无需选择检验统计量,确定抽样分布,也无需事先给出显著性水平,确定其拒绝域,此外,贝叶斯假设检验也容易推广到多重假设检验场合,当有三个和是三个以上假设时,应接受具有最大后验概率的假设二、贝叶斯因子定义 2.4 设两个假设 与 的先验概率分别为 与 ,后验概率分别0101为 与 ,则称:01 010)( 先 验 机 会 比后 验 机 会 比xB为贝叶斯因子从这个定义可见,贝叶斯因子既依赖于数据 x 又依赖于先验分布 ,对两种机会比相除,很多人认为,这会减弱先验分布的影响,突出数据的影响,从这个角度看,贝叶斯因子 是数据 支持 的程度一下具体讨论几种情xB0况下的贝叶斯因子贝叶斯因子表示数据 x 支持原假设的程度三、简单假设 对简单假设010在这种场合,两种简单假设的后验概率分别为,)()(100xpx)()(1011xx其中 为样本分布,此时后验机会比p)(1010x要拒绝原假设 ,就必须有 ,或 即要求01)(100xp)(01xp两密度函数数值之比大于临界值,这种场合下的贝叶斯因子 ,)(1B它不依赖于先验分布,仅依赖于样本的似然比,这时贝叶斯因子的大小表示了样本 支持 的程度。
x0四、复杂假设 对复杂假设01在这种场合,贝叶斯因子为还依赖于参数空间上的先验分布 ,为探讨)(该关系我们把先验分布 限制在 上,并另)(10, )(00Ig)()(1Ig于是先验分布 101010 ),()()()(后验概率比 dgxp)(|(1100于是贝叶斯因子 )()(1|0)( 100xmdgxpxB可见,此时贝叶斯因子 还依赖于参数空间 上的先验分布 ,x0与 10g和这时贝叶斯虽已不是似然比,但仍可看做 上的加权似然比,它部分的消1与除了先验分布的影响,而强调了样本观察值的作用若 与 分别是 在 上的极大似然估计(MLE) ,那么经典统计中所0110与使用的似然比统计量 )|(sup)ˆ|(10xx是贝叶斯因子 的特殊情况,即认为先验分布 与 的质量全部集B )(0g)(1中在 与 上0ˆ1五、简单假设对复杂的备择假设我们考察如下的检验问题:1100:,:H对原假设 作贝叶斯检验时不能采用连续密度函数作为先验分布,因:为这种先验将给 的先验概率为 0,而后验概率也为 0,所以一个有效的办0法是对 的一个正概率 ,而对 给一个加权密度 即 的鲜艳密1g度为10g其中 为 的示性函数, , 为 上的一个正常密度函00 01-1g0数,这里可把 看作近似的实际假设: 上的先验概率,如000-,,H此的先验分布是由离散和连续两部分组成。
设 为样本分布,利用上述先验分布得到样本 的边缘分布)(xp x10)()()(xmxpdmgxx0)(11从而简单假设与复杂备择假设(记为 )的后验概率分别为01)(/)((1100xmxp后验机会比 )(100从而贝叶斯因子为 )()(100xmpxB这一简单表达式要比后验概率计算容易的多,故实际中常常计算 ,然后)(xB再计算 ,因为由贝叶斯因子的定义和 可推得)(0x 10100])(1[)(xB。












