
浅论贝叶斯公式及应用.docx
17页浅谈贝叶斯公式及其应用摘要贝叶斯公式是概率论中很重要的公式,在概率论的计算中起到很重要的作用本文通 过对贝叶斯公式进行分析研究,同时也探讨贝叶斯公式在医学、市场预测、信号估计、概 率推理以及工厂产品检查等方面的一些实例,阐述了贝叶斯公式在医学、市场、信号估计、 推理以及产品检查中的应用为了解决更多的实际问题,我们对贝叶斯公式进行了推广, 举例说明了推广后的公式在实际应用中所适用的概型比原来的公式更广从而使我们更好 地了解到贝叶斯公式存在于我们生活的各个方面、贝叶斯公式在我们的日常生活中非常重 要关键词:贝叶斯公式 应用 概率 推广第一章 引言贝叶斯公式是概率论中重要的公式,主要用于计算比较复杂事件的概率,它实质上是 加法公式和乘法公式的综合运用贝叶斯公式出现于17世纪,从发现到现在,已经深入到 科学与社会的许多个方面它是在观察到事件B已发生的条件下,寻找导致B发生的每个原 因的概率.贝叶斯公式在实际中生活中有广泛的应用,它可以帮助人们确定某结果(事件 B)发生的最可能原因目前,社会在飞速发展,市场竞争日趋激烈,决策者必须综合考察已往的信息及现状 从而作出综合判断,决策概率分析越来越显示其重要性。
其中贝叶斯公式主要用于处理先 验概率与后验概率,是进行决策的重要工具贝叶斯公式可以用来解决医学、市场预测、信号估计、概率推理以及产品检查等一系 列不确定的问题本文首先分析了贝叶斯公式的概念,再用贝叶斯公式来解决实际中的一 些问题然后将贝叶斯公式推广,举例说明推广后的贝叶斯公式在实际应用中所适用的概 型第二章 叶斯公式的定义及其应用2.1 贝叶斯公式的定义给出了事件B随着两两互斥的事件A , A,…,A中某一个出现而出现的概率如果反1 2 n过来知道事件B已出现,但不知道它由于A , A,…,A中那一个事件出现而与之同时出现, 1 2 n这样,便产生了在事件B已经出现出现的条件下,求事件A (i = 1,2,...n)出现的条件概率的i问题,解决这类问题有如下公式:2・1・1定义 设BB,…,B为Q的一个分割,即BB,…,B互不相容,且/|B =0,如果1 2 n 1 2 n ii=1P( A ) > 0,P(B) = 0 (i = 1,2,..., n),贝UP(B / A)=iiP(B )P(A/B )—— i i 艺 P (B ) P (A / B )jjj=1,i = 1,2,..., n。
证明 由条件概率的定义(所谓条件概率,它是指在某事件 B 发生的条件下,求另一事件A的概率,记为P(A / B))P(B / A)=四i P (A)对上式的分子用乘法公式、分母用全概率公式,P(AB)= P(B )P(A/B)i i iP(A) = £ P(B )P(A / B )ii j=1P(B / A) =iP(B )P(A/B )~~i i—, z乙 P (B ) P (A / B )jjj=1结论的证2.1.2 分析贝叶斯公式的定义贝叶斯公式可以作如下解释:假定有n个两两互斥的“原因” A ,A,…,A可引起同一1 2 n种“现象” B的发生,若该现象已经发生,利用贝叶斯公式可以算出由某一个原因A (j = 1,2,..., n)所引起的可能性有多大,如果能找到某个A,使得 iiP(A / B)=max {p(A / B)} ji1 < i < n则A就是引起“现象” B最大可能的“原因”生活中经常会遇到这样的情况,事 j件A已发生,我们需要判断引起A发生的“原因”这就需要用到贝叶斯公式来判断引起A发 生的“原因”的概率贝叶斯决策就是在不完全情报下,对部分未知的状态用主观概 率估计,然后用贝叶斯公式对发生概率进行修正,最后再利用期望值和修正概率做 出最优决策。
本文首先给出贝叶斯公式的定义以及证明,对条件概率公式和全概率公式进行了回 顾,加深了对贝叶斯公式的理解,为下面对贝叶斯公式自如地运用做铺垫2.2 贝叶斯公式的应用2.2.1 贝叶斯公式在医疗诊断上的应用例1、某地区肝癌的发病率为0.0004,先用甲胎蛋白法进行普查医学研究表明,化验结果是存在错误的已知患有肝癌的人其化验结果99%呈阳性(有病),而没有患肝癌的人其化验结果99.9%呈阴性(无病)现某人的检查结果呈阳性,问他真患肝癌的概率是多少?解 记B事件“被检查者患有肝癌”,A为事件“检查结果为阳性”,有题设知P( B) = 0.0004 P( B)二 0.9996P (A / B) = 0.99 P( A / B) = 0.001我们现在的目的是求P(B/ A),由贝叶斯公式得P (B / A) = A / BP( B) P (A / B) + P( B) PA / B)_ 0.0004 x 0.99—0.0004 x 0.99 + 0.9996 x 0.001 _ 0.284这表明,在检查结果呈阳性的人中,真患肝癌的人不到30%这个结果可能会使人吃 惊,但仔细分析一下就可以理解了因为肝癌发病率很低,在10000人中越有四人,而约 有9996人不患肝癌。
对10000个人中,用甲胎蛋白法进行检查,按其错检的概率可知, 9996 个不患肝癌者中约有约有9996x 0.001二90996个呈阳性另外四个真患肝癌者的检查报告 中约有4x0.99二3.96个呈阳性,仅从13.956个呈阳性者中看出,真患肝癌的3.96人约占 28.4%进一步降低错检的概率是提高检验精度的关键,在实际中由于技术和操作等种种原 因,降低错检的概率有事很困难的所以在实际中,常采用复查的方法来减少错误率或 用另一些简单易行的辅助方法先进行初查,排除了大量明显不是肝癌的人后,再用甲胎蛋 白法对被怀疑的对象进行检查,此时被怀疑的对象群体中,肝癌的发病率已大大提高了, 譬如,对首次检查得的人群再进行复查,此时P( B) =0.284,这时再用贝叶斯公式计算得P(B / A) _ 0.284 x 0.990.284 x 0.99 + 0.716 x 0.001_ 0.997这就大大提高了甲胎蛋白法的准确率了在上面的例子里面,如果我们将事件B (“被检查者患有肝癌”)看作是“原因”,将 事件A (“检查结果呈阳性”)看作是最后“结果”则我们用贝叶斯公式在已知“结果” 的条件下,求出了“原因”的概率P(B/A)。
而求“结果”的(无条件)概率P(A),用全 概率公式在上例中若取P( B) =0.284,则P( A) _ P( B) P( A / B) + P( B) PA / B)_ 0.284 x 0.99 + 0.716 x 0.0010.2819条件概率的三公式中,乘法公式是求事件交的概率,全概率公式是求一个复杂事件的 概率,而贝叶斯是求一个条件概率在贝叶斯公式中,如果P(B)为B的先验概率,称P(B / A)为B的后验概率,则贝叶i i i i斯公式是专门用于计算后验概率的,也就是通过A的发生这个新信息,来对B的概率作出i的修正评注:此例子是现实生活中很常见的一个例子用了两次贝叶斯公式,第一次利用贝 叶斯公式计算出检出是阳性然后患肝癌的概率,第二次利用贝叶斯公式计算出利用甲胎蛋 白检测的准确率通过计算出来的概率,人们采用有效的方法降低错检的概率使人们的 生命财产得到更多的保障2.2.2 贝叶斯公式在市场预测中的应用例2、我们知道,国外的旧车市场很多出国留学或访问的人有时花很少的钱就可以 买一辆相当不错的车,开上几年也没问题但运气不好时,开不了几天就这儿坏那儿坏的, 修车的钱是买车钱的好几倍,经常出毛病带来的烦恼就更别提了。
为了帮助买旧车的人了解各种旧车的质量和性能,国外出版一种专门介绍各品牌旧车 以及各年代不同车型各主要部件质量数据的旧车杂志比如有个买主想买某种型号的旧 车,他从旧车杂志上可发现这种旧车平均有30%的传动装置有质量问题除了从旧车杂志 上寻找有关旧车质量的信息外,在旧车市场上买旧车时还需要有懂车的内行来帮忙比如 可以找会修车的朋友帮助开一开,检查各主要部件的质量因为旧车杂志上给出的是某种 车辆质量的平均信息,就要买的某一辆来讲可能是好的传动装置,也可能会有问题比较 常见的方法是花一点钱请个汽车修理工帮助开几圈,请他帮助判断一下传动装置和其他部 件的质量当然,尽管汽车修理工很有经验,也难免有判断不准的时候假定从过去的记 录知道某个修理工对于传动装置有间题的车,其中 90%他可以判断出有问题,另有 10%他 发现不了其中的问题对于传动装置没问题的车,他的判断也差不多同样出色,其中80% 的车他会判断没问题,另外的20%他会认为有问题,即发生判断的错误根据这些已知信息请你帮助买主计算如下的问题:1、 若买主不雇用修理工,他买到一辆传动装置有问题的车的概率是多少?2、 若买主花钱雇修理工帮他挑选和判断,当修理工说该车“传动装置有问题”时该 车传动装置真有问题的概率是多少?3、 当修理工说该车“传动装置没问题”时而该车传动装置真有问题的概率是多少?解 1、问题是简单的,即有30%的可能性买到一辆有传动装置间题的旧车,我们在 这里只利用旧车杂志的信息。
第2 问和第3 问是贝叶斯估计或者利用贝叶斯公式进行决策的问题2、我们知道,贝叶斯公式是个条件概率的公式,即P(A / B)=iP (A ) P (B / A)i i 丈 P(A )P(B / A ) jj j=1其中P(A /B)称为事件A的后验概率,即在已知事件B发生条件下事件A发生的概i i i率;P(A)是事件A的先验概率;P(B/ A)称为样本信息,即在A发生条件下事件B的概i i i i率对于第 2问,我们不妨令:A = 实际有问题, A = 实际没问题 12B = 修理工判断“有问题”, B = 修理工判断“没问题” 12则可将贝叶斯公式改写成:P(实际有问题/修理工判断“有问题”)= p(实际有问题)p(修理工判断“有问题”/实际有问题) =p(实际有问题)p(修理工判断“有问题”/实际有问题)+P(实际没问题)p(修理工判断“有问题”/实际没问题)P(A)P(B / A)1 1 +P(A )P(B / A ) + P(A )P(B / A )1 1 1 2 1 2根据已知条件,计算式中各项的概率分别为:P( A) = P(实际有问题)=0.31P(A ) = P(实际没问题)=0.72P(B / A) = P(修理工判断“有问题” /实际有问题)=0.911P(B / A )二P(修理工判断“有问题” /实际没问题)=0.212P(B /A)二P(修理工判断“没问题” /实际没问题)=0.121P(B / A )二P(修理工判断“没问题” /实际没问题)=0.822代入上式P(实际有问题/修理工判断“有问题”)P(A)P(B / A)= + + +P(A )P(B / A ) + P(A )P(B / A )1 1 1 2 1 2= 0.3 x 0.9= 0.3 x 0.9+0.7 x 0.2=0.66 这个结果表明,当修理工判断某辆车的传动装置“有问题”时,实际有问题的概率为0.66。
