电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本
换一换
首页 金锄头文库 > 资源分类 > DOCX文档下载
分享到微信 分享到微博 分享到QQ空间

[全]数据分析经典模型:朴素贝叶斯

  • 资源ID:159307545       资源大小:130.75KB        全文页数:7页
  • 资源格式: DOCX        下载积分:4.9金贝
快捷下载 游客一键下载
账号登录下载
微信登录下载
三方登录下载: 微信开放平台登录   支付宝登录   QQ登录  
二维码
微信扫一扫登录
下载资源需要4.9金贝
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
如填写123,账号就是123,密码也是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

 
账号:
密码:
验证码:   换一换
  忘记密码?
    
1、金锄头文库是“C2C”交易模式,即卖家上传的文档直接由买家下载,本站只是中间服务平台,本站所有文档下载所得的收益全部归上传人(卖家)所有,作为网络服务商,若您的权利被侵害请及时联系右侧客服;
2、如你看到网页展示的文档有jinchutou.com水印,是因预览和防盗链等技术需要对部份页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有jinchutou.com水印标识,下载后原文更清晰;
3、所有的PPT和DOC文档都被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;下载前须认真查看,确认无误后再购买;
4、文档大部份都是可以预览的,金锄头文库作为内容存储提供商,无法对各卖家所售文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;
5、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据;
6、如果您还有什么不清楚的或需要我们协助,可以点击右侧栏的客服。
下载须知 | 常见问题汇总

[全]数据分析经典模型:朴素贝叶斯

数据分析经典模型:朴素贝叶斯贝叶斯模型在数据分析中一般用来解决先验概率、分类实时预测和推荐系统等问题,为了理解一下贝叶斯的概念,我们先来看一个例子:某零售企业有三家供货商,记为A1、A2、A3,其供应量和不合格率如下图所示,如果随机从该零售企业中抽取一个产品,其不合格的概率有多大呢?如果抽到的某个产品是不合格的,最有可能是来自于哪个供货商呢?如果大家了解过概率论统计学的,应该可以看出来,上面的两个问题分别需要用先验概率和后验概率进行解答。所以,我们先来了解一下先验与后验的概念。先验与后验我们直接举个例子来说明:今天早上我喝了一杯凉水,那么中午我会不会拉肚子?这里可以看出“拉肚子”是一种事实结果,而造成拉肚子的影响因素假设只有喝凉水,那么这个问题实际上是要求出在“喝凉水”条件下“拉肚子”的概率,也就是求:P(拉肚子|喝凉水)先验事件当中的条件概率通俗点说,先验事件就是由因求果,先验概率也就是根据以往经验和分析得到的概率,最典型的代表就是抛硬币,抛一个硬币求其正面的概率,就是已经知道了“硬币正反面概率都是0.5”的条件,求出“硬币是正面”的“结果”的概率。而后验事件则是由果求因,也就是依据得到"结果"信息所计算出的最有可能是哪种事件引起的,用上面这个例子就是:中午我拉了肚子,那么我早上喝了一杯凉水的概率是多大?换言之,“拉肚子”是结果,我在已经知道结果的前提下,求“喝凉水”的原因的概率,也就是:P(喝凉水|拉肚子)后验概率而先验与后验的基础都是条件概率,其公式是:朴素贝叶斯概率很多人可能会疑问,我们求后验概率和先验概率的意义是什么呢?因为传统频率主义是无法解决实际问题的,换言之抛硬币问题只存在于理论中,实际生活中某个事件的发生条件或结果一定是复杂的,不可能是抛个硬币就能解释的。而实际问题一般是由多个条件组成的复杂事件,那么什么是复杂事件呢?比如拉肚子这个事件,可能是由于早上喝凉水造成的,也可能是喝过期酸奶造成的,也可能是昨晚吃火锅造成的等等,这就是复杂事件。而如果我们已经知道了引起拉肚子的所有条件,且这些条件都是相互独立且互斥的,那么想要求出拉肚子的概率,就可以将这个复杂事件拆分成几个条件概率。比如,假设引起拉肚子的条件只可能是喝凉水或者喝酸奶,且这两个条件不可能同时发发生,那么我们就可以利用条件概率计算最终的拉肚子事件概率:P(拉肚子)=P(喝凉水且拉肚子)+P(喝酸奶且拉肚子)=P(喝凉水)*P(拉肚子|喝凉水)+P(喝酸奶)*P(拉肚子|喝酸奶)这就是全概率公式,全概率公式是用来计算复杂事件的概率,用公式表示就是:而如果我们想要计算复杂事件的简单条件概率,就要用到贝叶斯概率,比如中午我拉了肚子,那么我早上喝了一杯凉水的概率是多大?那么根据条件概率和全概率公式可以得到:P(喝凉水|拉肚子)=P(喝凉水且拉肚子)/P(拉肚子)=P(喝凉水)*P(拉肚子|喝凉水)/P(拉肚子)=P(喝凉水)*P(拉肚子|喝凉水)/P(喝凉水)*P(拉肚子|喝凉水)+P(喝酸奶)*P(拉肚子|喝酸奶)用公式表示就是:这就是贝叶斯公式的推导过程,其核心思想是当你不能准确知悉一个事物的本质时,你可以依靠与事物特定本质相关的事件出现的多少去判断其本质属性的概率。如果你看到一个人总是做一些好事,则那个人多半会是一个好人。用数学语言表达就是:支持某项属性的事件发生得愈多,则该属性成立的可能性就愈大。贝叶斯的应用现在我们再去计算开头例子的结果,就可以直接套用全概率公式和贝叶斯公式了:问题1:随机从该零售企业中抽取一个产品,其不合格的概率有多大呢?典型的由因及果,可直接使用全概率公式计算,我们将不合格用B表示:P(B) = P(B|Ai) * P(Ai)=P(B|A1) * P(A1) + P(B|A2) * P(A2) + P(B|A3) * P(A3)=(500/1500*10%)+(400/1500*13%)+(600/1500*11%)= 11.2%因此,随机从该零售企业中抽取一个产品,其不合格的概率是11.2%;问题2:如果抽到的某个产品是不合格的,最有可能是来自于哪个供货商呢?典型的由果及因,可直接使用贝叶斯概率公式计算,我们先求A1供货商的概率:P(A1|B)=P(A1) * P(B|A1) / P(B)=(500/1500*10%)/ 11.2%= 29.8%同理,我们再求出A2、A3供货商的概率是30.9%、39.3%,所以如果抽到的某个产品是不合格的,最有可能是来自于A3供货商。总结在实际的数据分析过程中,我们经常会用到贝叶斯概率的思想,比如我们去分析营销活动的渠道拉新效果,我们不能只针对结果进行分析。按照贝叶斯定律,我们不能忽略导致这个结果的前提条件。这个前提条件的忽略最终可能影响了我们对整件事情的判断,这个前提条件就是:我们的投放渠道,这就是朴素贝叶斯的本质。

注意事项

本文([全]数据分析经典模型:朴素贝叶斯)为本站会员(赵****)主动上传,金锄头文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即阅读金锄头文库的“版权提示”【网址:https://www.jinchutou.com/h-59.html】,按提示上传提交保证函及证明材料,经审查核实后我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.