[全]数据分析经典模型:朴素贝叶斯
7页1、数据分析经典模型:朴素贝叶斯贝叶斯模型在数据分析中一般用来解决先验概率、分类实时预测和推荐系统等问题,为了理解一下贝叶斯的概念,我们先来看一个例子:某零售企业有三家供货商,记为A1、A2、A3,其供应量和不合格率如下图所示,如果随机从该零售企业中抽取一个产品,其不合格的概率有多大呢?如果抽到的某个产品是不合格的,最有可能是来自于哪个供货商呢?如果大家了解过概率论统计学的,应该可以看出来,上面的两个问题分别需要用先验概率和后验概率进行解答。所以,我们先来了解一下先验与后验的概念。先验与后验我们直接举个例子来说明:今天早上我喝了一杯凉水,那么中午我会不会拉肚子?这里可以看出“拉肚子”是一种事实结果,而造成拉肚子的影响因素假设只有喝凉水,那么这个问题实际上是要求出在“喝凉水”条件下“拉肚子”的概率,也就是求:P(拉肚子|喝凉水)先验事件当中的条件概率通俗点说,先验事件就是由因求果,先验概率也就是根据以往经验和分析得到的概率,最典型的代表就是抛硬币,抛一个硬币求其正面的概率,就是已经知道了“硬币正反面概率都是0.5”的条件,求出“硬币是正面”的“结果”的概率。而后验事件则是由果求因,也就是依据
2、得到结果信息所计算出的最有可能是哪种事件引起的,用上面这个例子就是:中午我拉了肚子,那么我早上喝了一杯凉水的概率是多大?换言之,“拉肚子”是结果,我在已经知道结果的前提下,求“喝凉水”的原因的概率,也就是:P(喝凉水|拉肚子)后验概率而先验与后验的基础都是条件概率,其公式是:朴素贝叶斯概率很多人可能会疑问,我们求后验概率和先验概率的意义是什么呢?因为传统频率主义是无法解决实际问题的,换言之抛硬币问题只存在于理论中,实际生活中某个事件的发生条件或结果一定是复杂的,不可能是抛个硬币就能解释的。而实际问题一般是由多个条件组成的复杂事件,那么什么是复杂事件呢?比如拉肚子这个事件,可能是由于早上喝凉水造成的,也可能是喝过期酸奶造成的,也可能是昨晚吃火锅造成的等等,这就是复杂事件。而如果我们已经知道了引起拉肚子的所有条件,且这些条件都是相互独立且互斥的,那么想要求出拉肚子的概率,就可以将这个复杂事件拆分成几个条件概率。比如,假设引起拉肚子的条件只可能是喝凉水或者喝酸奶,且这两个条件不可能同时发发生,那么我们就可以利用条件概率计算最终的拉肚子事件概率:P(拉肚子)=P(喝凉水且拉肚子)+P(喝酸奶且
《[全]数据分析经典模型:朴素贝叶斯》由会员赵****分享,可在线阅读,更多相关《[全]数据分析经典模型:朴素贝叶斯》请在金锄头文库上搜索。
2024二建市政在线考核题库含答案全套
2024年5月河北考面试题及参考答案全套
2024年5月6日下午河北省考面试题及参考答案全套
2024年5月河北邯郸选调生面试题及参考答案全套
2024年5月青海省选调生面试题及参考答案全套
2024年4月山东省青岛市事业单位面试题及参考答案全套
2024年5月海南省考公务员面试题及参考答案全套
2024年建筑升降机考前押题卷含答案全套
数学知识 一次函数4类常见易错题专项训练全套
2024版海南建筑安全生产管理三类人员考试考前押题全套
2024年浙江省工程监理在线测试模拟题库全套
2024年中级注册安全工程师考试之近年真题、参考答案、详细解释全套
2024年陕西三类人员c类题库全套
冲刺2024中级注安师考试之历年真题、真题改编、参考答案全套
高考语文 古诗鉴赏语言风格题型专练全套
2024年中级安全工程师考试之历年真题及真题改编 附参考答案全套
综合布线系统施工方案 含测试 检测及验收全套
工贸企业职业病危害告知书全套
2024 建筑安全员 C 证考试题库答案全套
2024版福建省福州建筑行业安全员B证在线测试电子题库全套
2023-09-25 37页
2023-09-25 10页
2023-09-25 33页
2023-09-25 26页
2023-04-03 8页
2023-04-03 4页
2023-04-03 8页
2023-03-29 10页
2023-03-22 10页
2023-03-20 8页