电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

贝叶斯分类仿真数学统计模型决策实验

7页
  • 卖家[上传人]:小**
  • 文档编号:88217715
  • 上传时间:2019-04-21
  • 文档格式:DOC
  • 文档大小:174.01KB
  • / 7 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、实验一 贝叶斯分类仿真实验1 引言贝叶斯定理用数学家Thoms Bayes命名的,他是18世纪概率论和决策论的早期研究者。贝叶斯决策理论是主观贝叶斯派归纳理论的重要组成部分。 贝叶斯决策就是在不完全情报下,对部分未知的状态用主观概率估计,然后用贝叶斯公式对发生概率进行修正,最后再利用期望值和修正概率做出最优决策。1.1 贝叶斯决策基本思想贝叶斯决策理论方法是统计模型决策中的一个基本方法,其基本思想:已知类条件概率密度参数表达式和先验概率;利用贝叶斯公式转换成后验概率;根据后验概率大小进行决策分类。1.2 贝叶斯公式设H1,H2,H为样本空间S的一个划分,如果以P(Hj)表示事件Hi发生的概率,且P(Hj)0(j=1,2,n)。对于任一事件X,P(X)0,则贝叶斯公式如下:P(Hj|X)=P(X|Hj)P(Hj)/ 2 基于最小错误率贝的叶斯决策2.1 对于贝叶斯公式的深入理解对于引言中贝叶斯的公式,可能大家对P(H|X)与P(X|H)的区别是什么等问题存在疑问,下面我们就来深入理解该公式,X是一个元组,假设其中可以分成M类,M的先验概率是P(H),而P(X|H)则被我们看成是概率密度函

      2、数对于待归类的样品,贝叶斯可以计算出属于M类中各个类的概率大小,看X属于那个类的可能性大,就把他归属为那一类。先验概率针对M个出现的可能性而言的,不考虑任何其他的条件。例如,有统计资料表明出产产品总数为N,其中合格品为N1,不合格品为N2,P(H1)=N1/N,P(H2)=N2/N。我们可以看到,这两者都可以事先计算出来。但是如果我们只有先验概率是不够的,假设我们生产的产品是N1多于N2,那么我们得到的概率就是合格的可能性大于不合格的可能性,故我们只能把所有的产品都判断为合格,因为合格的概率大一些,但这样的结果并没有让我们把不合格的产品分离出来,这就表明我们仅从先验概率来进行分类识别是不够的,我们还需要更多的初始信息。于是我们引进了类条件概率密度。类条件概率密度类条件概率密度P(X|Hj)是指在已知的特征空间中,出现特征值的概率密度,指的是Hj类样品其属性X 是怎么样分布的。后验概率后验概率是指在呈现状态X时, 该样品属于Hj中各个类别的概率,这个概率可以用来判别Hj的归属类别依据。从而实现贝叶斯分类器。关于P(Hj|X)与P(X|Hj)的区别首先,要明确,从我们前面的理论大家可以发现

      3、P(Hj|X)是后验概率,是结论;P(X|Hj)是类条件概率密度函数,是已知的前提。类概率条件密度函数是前人总结的统计的概率分布,我们是直接拿来使用的,用它来补充先演概率的信息不足。我们还是拿前面的例子来说,P(H1|X)与P(H2|X)是指在同一条件X下,比较H1和H2的出现概率,如果P(H1|X)P(H2|X),则事件H1出现的可能性大,反之则是H2出现的可能性大。我们可以发现P(H1|X)与P(H2|X)之和为1,因为对于产品来说,只有合格和不合格两种情况,不可能出现第三种情况。P(X|H1)与P(X|H2)都是指在各自条件下出现X的可能性,两者没有必然的联系。比较两者大小也没有实际意义,两者是在不同条件下讨论问题的,两者之和也没有等于1的结论。2.2 基于最小错误率贝的叶斯决策详解为了大家的理解,我们先看两类问题,对于两类问题,P(H1|X)=P(X|H1)P(H1)/P(X),P(H2|X)=P(X|H2)P(H1)/P(X),其中P(X)=P(X|H1)P(H1)+P(X|H2)P(H2),利用后验概率在作判别。那么推广到多类别问题后,P(Hj|X)=P(X|Hj)P(Hj

      4、)/P(X),由全概率公式P(X)= P(X|Hj)P(Hj),其中M为类别个数。在取得一个特征X之后,在特征X的条件下,看哪个概率最大,就应该把X归于概率最大的那个类。因此对于任一模式X,可以通过比较各个判别函数来确定X的类别。P(Hi)P(X|Hi)= P(Hj)P(X|Hj);XHi, i=1,2,3,M使用什么样的原则可以做到错误概率最小呢? 前提就是要知道一样品分属于不同类别的可能性,表示成P(Hj|X),然后计算后验概率最大的类来分类,这样就是错误最小的方式。3 基于最小风险的贝叶斯决策前面我们讨论了最小错误的贝叶斯决策,但是,是不是在任何情况下都使用基于最小错误的贝叶斯决策才是最佳的呢? 实际情况不是这样的,比如对于药品的检测,对于药品生产商而言,大部分的药品都是合格的,只有少数的不合格。如果我们把正常药品判断成异常药品,样会增加总的错误率,给企业带来一些损失;但如果把异常药品判断成正常药品,虽然会使错误率最小,但病人可能会被使用不合格的药品,对治疗非常不利,甚至会使得病人耽误治疗,乃至于有生命危险。可见这时使用错误率最小是不合适的。我们用下图进一步说,大家会看得更清楚。

      5、从上面我们发现,单纯的考虑后验概率的最小错误率,会带来更多的损失和风险,为了体现这种风险,对贝叶斯公式进行加权修正,表示成Ri(X)=(i ,j)P(Hj|X),其中i代表将X判为Hi类的决策,(i,j)表示观测样品X实际属于Hj,由于采用i决策而被判为Hj时所造成的损失;Ri则表示观测X 被判别为i 类时的损失均值;例如从前面的例子,(1,2)表示X 确实是异常药品,但采取决策1被判定为正常,则会有损失(1,2);(2,1)表示X 确实是正常药品,但采取决策2被判定为异常。为了基于风险考虑我们会把损失函数的(1,2)的值大于(2,1),因为前者的风险更大。基于最小风险也就是要寻找Ri(i|X)的最小值,并以此作为分类的依据。4 用Matlab实现贝叶斯分类4.1 程序代码如下prior=0.7 0.3;data=10+2*randn(100,1);mu,sigma=normfit(data);data1=5+4*randn(100,1);mu1,sigma1=normfit(data1);figure;plot(-3:0.01:18,normpdf(-3:0.01:18,mu,sig

      6、ma),b),hold on ;plot(-5:0.01:18,normpdf(-5:0.01:18,mu1,sigma1),r) x=7;stem(x,normpdf(x,mu,sigma);stem(x,normpdf(x,mu1,sigma1),r) ;xlabel(x);h=legend(class 1 pdf,class 2 pdf,2);title(class condition probability function)hold offpost=normpdf(x,mu,sigma)*prior(1);post1=normpdf(x,mu1,sigma1)*prior(2);figure;plot(-3:0.01:18,normpdf(-3:0.01:18,mu,sigma)*prior(1),b)hold on;plot(-5:0.01:18,normpdf(-5:0.01:18,mu1,sigma1)*prior(2),r)stem(x,normpdf(x,mu,sigma)*prior(1);stem(x,normpdf(x,mu1,sigma1)*prior(2)

      7、,r);xlabel(x);h=legend(class 1,class 2,1);title(sample post probability)hold off4.2 代码运行结果图如下5 用Visual C+实现贝叶斯分类5.1程序代码如下/最小错误率贝叶斯分类如下:void CMyDlg:OnCWL() UpdateData(true);float a,b,p,q;a=m_prior1*m_class1;b=m_prior2*m_class2;p=a/(a+b);q=b/(a+b);if(pq)m_class=class1;elsem_class=class2;UpdateData(false);/最小风险率贝叶斯分类如下:void CMyDlg:OnFXL() UpdateData(true);float a,b,p,q,m,n; a=m_prior1*m_class1;b=m_prior2*m_class2;p=a/(a+b);q=b/(a+b);m=m_L11*p+m_L12*q;n=m_L21*p+m_L22*q;if(mn)m_class=class2;elsem_class=class1;UpdateData(false);5.2 代码运行结果图如下贝叶斯最小错误率分类如下:贝叶斯最小风险率如下:6 实验结论通过上述讨论,正确的制定损失函数的值,是贝叶斯决策决策的一个关键问题。在实际中列出合适的决策表是比较困难的事情,需要根据所研究的具体问题,来分析决策造成损失的严重程度,从本文的讨论,我们知道要提高贝叶斯决策的准确率就需要对损失函数进行仔细的考量。进一步的研究工作可以考虑如何对损失函数进行选择和使用。充分利用贝叶斯定理提高分类的精确程度和实用性。

      《贝叶斯分类仿真数学统计模型决策实验》由会员小**分享,可在线阅读,更多相关《贝叶斯分类仿真数学统计模型决策实验》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    监控施工 信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.