第8章广义线性模型课件.ppt
65页•回归分析中假定随机扰动服从这样的一些回归分析中假定随机扰动服从这样的一些正态分布:其方差取常值,而均值则为附正态分布:其方差取常值,而均值则为附属数据的线性函数.属数据的线性函数.•很多精算问题可以利用特殊的广义线性模很多精算问题可以利用特殊的广义线性模型来处理,如方差分析,泊松回归以及型来处理,如方差分析,泊松回归以及Logistic对数(对数(logit )与概率()与概率(Probit ))模型等的几类模型等的几类 精算数据与模型精算数据与模型•实践中采集的数据往往显示方差要大于均实践中采集的数据往往显示方差要大于均值.值.•用于描述索赔额的分布通常具有厚重的右用于描述索赔额的分布通常具有厚重的右尾.尾. •有待建模的现象极少关于附属数据是可加有待建模的现象极少关于附属数据是可加的的,一般往往可用乘法模型.一般往往可用乘法模型. 广义线性模型 •它允许偏离均值的随机误差服从不是正态分布如,随机它允许偏离均值的随机误差服从不是正态分布如,随机误差可服从指数散布族中的任一种分布,包含了泊松分布、误差可服从指数散布族中的任一种分布,包含了泊松分布、(负)二项分布、伽玛分布与逆高斯分布等(负)二项分布、伽玛分布与逆高斯分布等.•并不要求随机变量的均值是解释变量的线性函数。
但进行并不要求随机变量的均值是解释变量的线性函数但进行某些变换后它仍是是线性的.譬如,当对数时,我们可以某些变换后它仍是是线性的.譬如,当对数时,我们可以用乘法模型替代了加法模型.用乘法模型替代了加法模型. 广义线性模型具有以下三个特征:广义线性模型具有以下三个特征:•伽玛随机变量•逆高斯随机变量 上面所列的分布的均值 注8.2.1(典则联结) 注8.2.2 (方差函数) 以下依方差函数中 的幂次的升幂序,分别表述之:§8.3 若干传统的估计方法与广义线若干传统的估计方法与广义线性模型性模型不妨先假定不妨先假定逐项置换法逐项置换法首先可将(首先可将(8.4)中的第一组方程改写为)中的第一组方程改写为因此因此方法方法8.3.8 (边缘总和法)(边缘总和法) 在一个在一个“良好良好”的收费系统内,对于一个拥有众多被的收费系统内,对于一个拥有众多被保险人的组合来说,保费总额相等于观测到的损失总保险人的组合来说,保费总额相等于观测到的损失总额额. 若将下述关系式代入上式:若将下述关系式代入上式: 方法方法8.3.10(最小二乘法=关于正态的极大似然法)(最小二乘法=关于正态的极大似然法) §8.4偏差与比例偏差显然,对全模型而言,借助逐项最大化(显然,对全模型而言,借助逐项最大化(8.20)即)即知,对每一皆有如以表示偏差便得知,对每一皆有如以表示偏差便得这表明,对正态分布而言,最小化偏差(或等价地这表明,对正态分布而言,最小化偏差(或等价地最大化似然函数)是和确定参数的最小二乘法等效最大化似然函数)是和确定参数的最小二乘法等效的.的. 此时,对全模型仍可得 这是因为不难验证,此例中的偏差由下式给出:自然,上式中 必须取正值 指数散布族指数散布族定义定义8 . 6 . 1 (指数散布族)指数散布族密度具有(指数散布族)指数散布族密度具有以下形式以下形式§ 8.6广义线性模型例例8.6.2(指数散布族的若干成员)下述参数族是指(指数散布族的若干成员)下述参数族是指数散布族中最重要的一些成员:数散布族中最重要的一些成员:最后一种参数化称为是自然或典则参数化最后一种参数化称为是自然或典则参数化 .证明:由(8. 33),我们有其中:其中:这恰和通常的泊这恰和通常的泊松分布的密度表松分布的密度表达式是一致的达式是一致的。
推论推论8.6.9 (指数散布族与(指数散布族与Esscher 变换)一个连续变换)一个连续密度密度 的以的以h 为参数的为参数的Esscher 变换是下述密度变换是下述密度显然,它仍是一个具有参数显然,它仍是一个具有参数 和相同和相同 的指数的指数散布族成员的累积量数.散布族成员的累积量数. 注注8.6.10(指数散布族中特定子类的生成)不难验证,(指数散布族中特定子类的生成)不难验证,以以h 任况为参数的任况为参数的Esscher 变换完成下述分布间的转换:变换完成下述分布间的转换:。





