
spss clementine 贝叶斯分析 第七章.ppt
11页数据挖掘原理与SPSS Clementine应用宝典 元昌安 主编 邓 松 李文敬 刘海涛 编著 电子工业出版社,第七章 贝叶斯分析,本章内容,贝叶斯定理,贝叶斯分类,EM算法,贝叶斯定理,,贝叶斯分类,贝叶斯分类的基本过程 朴素贝叶斯分类 贝叶斯信念网络,贝叶斯分类-基本过程,贝叶斯分类方法基于贝叶斯定理进行分类,一般分为以下两个步骤: (1)建立分类模型,描述预定的数据类集或概念集通过分析有属性描述的数据集中的属性来构造贝叶斯分类模型 (2)使用建立的分类模型对新的数据集进行划分,主要考虑分类规则的准确性、矛盾划分的取舍等一个好的分类规则集合应该是对新的数据集而言具有很高的准确性、尽可能少的矛盾划分和较少的规则集朴素贝叶斯分类-贝叶斯假设,,朴素贝叶斯分类-朴素贝叶斯计算,根据类属性的不同有不同的计算方法: 离散属性的条件概率计算: 连续属性的条件概率计算 朴素贝叶斯分类提供了两种办法用来估计连续属性 的条件概率: (1)将连续属性离散化,使用离散区间来代理连续属性 (2)利用概率分布函数进行计算,朴素贝叶斯分类-贝叶斯信念网络,贝叶斯网络具有如下的特点: 贝叶斯网络通过网络结构图的方法来描述数据间的关系,语意清晰,可理解性强,有助于利用数据间的因果关系进行预测分析。
贝叶斯网络适合处理不完整的数据 贝叶斯信念网络本身没有输入和输出的概念,各个结点的计算是独立的EM算法-基本概念,EM(expectation-maximization)算法是最 常用的从不完整数据条件下统计概率分布的方法 它是“求期望-取最大”的迭代循环过程,“求期 望”步骤计算不完整数据样本中每个事件在当前概 率分布条件下发生的期望充分统计量;“取最大” 步骤按照期望分布统计量把不完整数据转换成完整 数据,找到使似然性最大的概率分布EM算法-基本步骤,。












