
李贤平概率论基础Chap4.ppt
120页第四章第四章 数字特征与特征函数数字特征与特征函数 第一节第一节 数学期望数学期望第二节第二节 方差、相关系数、矩方差、相关系数、矩第三节第三节 母函数母函数( (略)略)第四节第四节 特征函数特征函数第五节第五节 多元正态分布多元正态分布( (略)略)一、数学期望的概念一、数学期望的概念数字特征是由随机变量决定的一些常数,期望与方差数字特征是由随机变量决定的一些常数,期望与方差是其中最重要的两个特征,它们只能刻化随机变量的部分是其中最重要的两个特征,它们只能刻化随机变量的部分性质 数学期望数学期望(Mathematical Expectation)是一个随机变量是一个随机变量的平均取值,是它所有可能取值的加权平均,权是这些可的平均取值,是它所有可能取值的加权平均,权是这些可能值相应的概率能值相应的概率§4.1 数学期望数学期望 例例4.1.1 一位射击教练将从两个候选人中挑选一人作为一位射击教练将从两个候选人中挑选一人作为他的队员,甲还是乙的成绩更好?他的队员,甲还是乙的成绩更好?成绩成绩(环数环数)甲的概率甲的概率乙的概率乙的概率80.10.290.30.5100.60.3解解. 以以 ξ、、η 分别表示甲、乙射击一分别表示甲、乙射击一次的结果,次的结果,ξ 的数学期望的数学期望(甲射击一次的平均成绩甲射击一次的平均成绩)是是Eξ = 8×0.1 + 9×0.3 + 10×0.6 = 9.5 (环环),, 同理,乙射击一次的平均成绩是同理,乙射击一次的平均成绩是Eη = 8×0.2 + 9×0.5 + 10×0.3 = 9.1 (环环)。
□二二. . 离散随机变量的数学期望离散随机变量的数学期望如果如果ξ 的分布律为的分布律为级数绝对收敛的条件是为了保证期望不受求和顺序的影响级数绝对收敛的条件是为了保证期望不受求和顺序的影响 数学期望反映了随机变量取值的中心趋势数学期望反映了随机变量取值的中心趋势几种重要的离散型分布的期望:几种重要的离散型分布的期望:(1) ((0—1)分布:)分布:(2) 二项分布:二项分布:(3) 泊松分布:泊松分布:(4) 几何分布:几何分布:例例 随机变量随机变量 取值取值 ,对应的概率,对应的概率为为 ,, 则由于则由于 ,因此它是概率分布,,因此它是概率分布,而且而且但是但是因此,因此, 的数学期望不存在的数学期望不存在 从上面的例子可以看出,其中从上面的例子可以看出,其中重要的离散型分布的参数重要的离散型分布的参数都可由数学期望算得都可由数学期望算得,因此它是一个重要的概念因此它是一个重要的概念。
例例4.1.3 某人有某人有 10 万元,如果投资于一项目将有万元,如果投资于一项目将有 30%的的可能获利可能获利 5 万,万,60% 的可能不赔不赚,但有的可能不赔不赚,但有10%的可能的可能损失全部损失全部 10 万元;同期银行的利率为万元;同期银行的利率为 2% ,问他应该如,问他应该如何决策?何决策?解解. 以以 ξ 记这个项目记这个项目 的投资利润的投资利润 利润利润 5 0 - 10概率概率 0.3 0.6 0.1平均利润为:平均利润为:Eξ = 5×0.3 + 0×0.6 + (- 10)×0.1 = 0.5,,而同期银行的利息是而同期银行的利息是 10×0.02 = 0.2 ,,因此从期望收益的角度应该投资这个项目因此从期望收益的角度应该投资这个项目例例4.1.4 假定某人设计了如下一个赌局假定某人设计了如下一个赌局:每个人从有每个人从有 3 张张假币的假币的 10 张张 100 元纸币中随机地抽出元纸币中随机地抽出 4 张如果全是真张如果全是真的,则赢得这的,则赢得这 400元;如果这元;如果这 4 张中至少有一张假币,只张中至少有一张假币,只输输 100 元。
问这种规则是否公平,或者说你是否愿意参元问这种规则是否公平,或者说你是否愿意参加?加?解解. 一个公平合理的赌博或博弈规则必须是双方的平均获一个公平合理的赌博或博弈规则必须是双方的平均获利都等于利都等于 0以以ξ 记每局赌博中庄家的获利记每局赌博中庄家的获利 (可以为负可以为负) ,则,则ξ 所有可所有可能的取值是能的取值是 - 400 与与 100 15400 500 50□在古典概率模型中已经得到在古典概率模型中已经得到ξ 的分布律的分布律xkpk- 40061006ξ 的数学期望,即庄家在每局赌博中的数学期望,即庄家在每局赌博中的平均获利为的平均获利为:Eξ = (- ) + = 6 6 3这种赌博对庄家有利,平均每一局这种赌博对庄家有利,平均每一局他将净赚他将净赚 16.67 元三三. . 连续随机变量的数学期望连续随机变量的数学期望如果如果ξ 的密度函数的密度函数 p(x) 满足满足则连续随机变量则连续随机变量ξ 的数学期望是积分:的数学期望是积分:否则称为这个随机变量的期望不存在否则称为这个随机变量的期望不存在几种常用连续型分布的期望:几种常用连续型分布的期望:(1) (1) 均匀分布均匀分布(2)(2)指数分布指数分布(3)(3)柯西分布柯西分布( (期望不存在期望不存在) )由于由于故数学期望不存在。
故数学期望不存在(4)(4)正态分布正态分布(5) Gamma分布分布四四. .一般场合:一般场合:适合一切随机变量的数学期望的定义适合一切随机变量的数学期望的定义 若随机变量若随机变量 的分布函数为的分布函数为F(x),类似于连续型的场合,,类似于连续型的场合,作很密的分割作很密的分割 ,则,则 落在落在 中的概中的概率等于率等于 ,因此,因此 与以概率与以概率 取值取值 的离散型随机变量近似,的离散型随机变量近似,而后者的数学期望为而后者的数学期望为 注意到上式是注意到上式是Stieltjes积分积分 的渐近和式的渐近和式数学期望的一般定义:数学期望的一般定义:如果如果ξ 的分布函数的分布函数 F(x) 满足满足则则ξ 的数学期望定义成的数学期望定义成Stieltjes 积分:积分:否则称这个随机变量的期望不存在否则称这个随机变量的期望不存在. .Riemann积分的推广积分的推广: Stieltjes积分积分(1) F(x)在在xk 处具有跳跃度处具有跳跃度pk 时时,化为级数化为级数(2) F(x)存在导数存在导数p(x) 时时,化为化为Riemann 积分积分设随机变量设随机变量ξ ,,g(x) 为一元为一元Borel 函数,定义随机变量函数,定义随机变量 η =g(ξ),则,则不必计算新的随机变量的分布。
不必计算新的随机变量的分布这个结果的证明要用到测度论,超出了本课程的范围这个结果的证明要用到测度论,超出了本课程的范围1. 单个变量函数的期望单个变量函数的期望五、随机变量函数的期望五、随机变量函数的期望离散型场合离散型场合,上述公式化为,上述公式化为则则η =g(ξ) 的分布列可由下得到的分布列可由下得到这是因为:这是因为: 的分布列为的分布列为连续型场合连续型场合,若,若 具有密度函数具有密度函数 p(x),则,则事实上,不妨只考虑事实上,不妨只考虑g严格单调增加且可导情形,此严格单调增加且可导情形,此时时η =g(ξ) 的密度为的密度为例例 ((报童问题报童问题)) 设某报童每日的潜在卖报数设某报童每日的潜在卖报数 服从服从参数为参数为 的泊松分布如果每卖出一份报可得报酬的泊松分布如果每卖出一份报可得报酬 a,,卖不掉而退回则每份赔偿卖不掉而退回则每份赔偿 b 若某日该报童买进若某日该报童买进 n 份份报,试求其期望所得,进一步求最佳的买进份数报,试求其期望所得,进一步求最佳的买进份数 n 解:解:若记其真正卖报数为若记其真正卖报数为 , 则则 与与 的关系为的关系为这里这里 服从服从截尾泊松分布截尾泊松分布,即,即记所得为记所得为 ,则,则因而,期望所得为因而,期望所得为求求 n 使使E(g( ))达到极大达到极大, 这是一个典型的最优化问题这是一个典型的最优化问题. 一般计算泊松分布的部分和可用下列公式:一般计算泊松分布的部分和可用下列公式:例例4.1.7 假定某公司开发了一种新产品,他们假定某公司开发了一种新产品,他们每卖出一件可获利每卖出一件可获利500元,而积压一件将损失元,而积压一件将损失2000元,预计这种产品的销售量元,预计这种产品的销售量ξ 服从参数服从参数0.00001 的指数分布,的指数分布,p1(x) = 0.00001 e - 0.00001 x ,, x > 0.问应该生产多少才能使得平均获利最大?问应该生产多少才能使得平均获利最大?平均获利即平均获利即η 的数学期望为的数学期望为即平均获利为:即平均获利为: Q(c)= 2500×10000(1-e-0.00001c) - 2000c关于关于c的二阶导数的二阶导数 -0.25e-0.00001c <<0,因此,因此Q(c)具有极大值,令具有极大值,令解出解出 c = - 10000×ln(2000/2500) =2231.4,,即要使平均获利最大,即要使平均获利最大,应该生产应该生产2231件产品。
件产品□2. 随机向量函数的期望随机向量函数的期望 设随机向量设随机向量(ξ1,ξ2,…,ξn) 的联合分布函数为的联合分布函数为F(x1,x2,…,xn),,g(x1,x2,…,xn)为为n元元Borel函数,定函数,定义随机变量义随机变量 η =g(ξ1,ξ2,…,ξn),则,则特别地,特别地,六、数学期望的基本性质六、数学期望的基本性质 性质性质1 1 若若 a≤ ≤b,则,则a≤E( )≤b .特别地特别地, E(C) = C, 这里这里C是常数是常数. 性质性质2(2(单调性单调性) ) 若几乎处处地有若几乎处处地有 ≤ ,则,则 E( )≤E( ). 性质性质3(3(线性性质)线性性质)对任意常数对任意常数 及及b ,有,有4. 4. 和的期望等于期望的和和的期望等于期望的和对任意对任意n个随机变量个随机变量ξ1、、…、、ξn,都有:,都有:E(ξ1+ξ2+…+ξn) = Eξ1 + Eξ2 + … + Eξn5. 5. 独立乘积的期望等于期望的乘积独立乘积的期望等于期望的乘积如果如果ξ1、、…、、ξn相互独立,则有:相互独立,则有:E(ξ1 ×ξ2×...×ξn) = Eξ1 × Eξ2 × … × Eξn注意注意: :该性质不是充要条件。
该性质不是充要条件例例4.1.8 计算正态分布计算正态分布N( ,σ2)的期望的期望.解解. 因为正态分布因为正态分布ξ 可转化为可转化为ξ = +σξ0,其中,其中ξ0 ~ N(0,1)显然有,显然有,因此,因此,E ξ = +σE(ξ0)= ,即正态分布即正态分布 N( ,σ2) 的期望就是参数的期望就是参数 □u 利用利用性质求期望性质求期望例例4.1.9 计算二项分布及超几何分布的期望计算二项分布及超几何分布的期望解解. 定义定义n 个随机变量个随机变量ξ1、、…、、ξn,,每个每个ξi 同分布于参数同分布于参数M/N的的Bernoulli分布分布1, 第第i 次取到的是次品,次取到的是次品,0, 第第i 次取到的是合格品次取到的是合格品有放回抽样时它们相互独立,即有放回抽样时它们相互独立,即ξ = ξ1+ξ2+…+ξn 服从二项分布服从二项分布;无放回抽样时它们不独立,而无放回抽样时它们不独立,而η = ξ1+ξ2+…+ξn 服从超几何分布服从超几何分布;注意到注意到, 每个每个ξi 的期望都是的期望都是 M/N,因此,因此((1)二项分布)二项分布B(n,p)的期望为的期望为 np=nM/N;;((2)超几何分布)超几何分布HG(n,N,M)的期望为的期望为 nM/N 。
□§4.2 方差,相关系数,矩方差,相关系数,矩 一一 、方差、方差二、二、 切比雪夫不等式切比雪夫不等式三、三、 相关系数相关系数 四、四、 矩矩五、五、 条件数学期望条件数学期望哪门炮射击效果好一些呢?甲炮射击结果甲炮射击结果乙炮射击结果乙炮射击结果例如例如: : 炮落点距目标的位置如图,哪门炮效果好一点些?炮落点距目标的位置如图,哪门炮效果好一点些?又如又如: : 甲、乙两个合唱队都由甲、乙两个合唱队都由5 5名成员组成,身高如下:名成员组成,身高如下:甲:1.60、1.62、1.59、1.60、1.59乙:1.80、1.60、1.50、1.50、1.60哪个合唱队演出效果好?哪个合唱队演出效果好?一、方差一、方差定义定义 设设X 是一个随机变量,若是一个随机变量,若 存在,存在,则称则称 为为X 的的方差方差. 记为记为D(X)D(X)或或Var(X)Var(X). 方差的算术平方根方差的算术平方根 称为称为均方差均方差或或标准差标准差。
记为记为注:注:方差实际上就是方差实际上就是X的函数的函数 g(X)=[X-E(X)]2 的期望的期望.方差反映了随机变量的取值与平均值的方差反映了随机变量的取值与平均值的偏离偏离程度程度.证明:证明: 推论:推论:常用计算公式常用计算公式::例例4.2.2 射击教练将从他的两名队员中选择射击教练将从他的两名队员中选择一人参加一人参加比赛,应该是甲还是丙更合适?比赛,应该是甲还是丙更合适?成绩成绩(环数环数)甲的概率甲的概率丙的概率丙的概率80.10.290.30.1100.60.7解解. 这里甲、丙两人的平均成绩都是这里甲、丙两人的平均成绩都是Eξ = Eη = 9.5需要比较方差,简单计算后可以得到:需要比较方差,简单计算后可以得到:Dξ = 0.45,,Dη = 0.65因此因此, 应该选择甲队员去参加比赛应该选择甲队员去参加比赛ξp续例续例4.1.1 , 甲乙射击技术如下:甲乙射击技术如下:8 9 10p 0.1 0.3 0.6η8 9 100.2 0.5 0.3已经知道平均来说甲的成绩比乙好,计算方差能已经知道平均来说甲的成绩比乙好,计算方差能发现甲的成绩也比乙稳定发现甲的成绩也比乙稳定(Dξ = 0.45, Dη = 0.49).如果只射击一次,谁的成绩可能更好一些如果只射击一次,谁的成绩可能更好一些 ??需要利用分布律计算并比较两个概率需要利用分布律计算并比较两个概率P(ξ >>η),以及,以及 P(ξ <<η)几种常见分布的方差几种常见分布的方差: :(1) ((0—1)分布:)分布:(2) 二项分布:二项分布:(3) 泊松分布:泊松分布:(4) (4) 均匀分布均匀分布: :(5)(5)指数分布:指数分布:特别,当特别,当(6)(6)正态分布:正态分布:常见分布的数学期望与方差列表:常见分布的数学期望与方差列表:u 方差方差的基本性质的基本性质2. 随机变量线性变换的方差公式随机变量线性变换的方差公式: 设设 a、、b 是两个常数,则有是两个常数,则有D(a+bξ) = b2Dξ .注注:与数学期望的性质比较::与数学期望的性质比较:E(a+bξ) = a+ b Eξ平移改变随机变量期望,但不会改变方差平移改变随机变量期望,但不会改变方差.1. 设设C是常数是常数,则则 D(C) =0 ; 4.独立和的方差等于方差的和:独立和的方差等于方差的和: 若若X与与Y 独立,则独立,则注:注:这条性质同样不是一个充要条件。
这条性质同样不是一个充要条件推广:推广:若若X1 1, ,X2, ,…, ,Xn 相互相互独立独立, ,则则证明:见证明:见后面后面““ChebyshevChebyshev不等式不等式””部分3、、D(X)=01. 如果如果ξ1、…、ξn 相互相互独立独立,则有:,则有: D(ξ1 ±ξ2±…±ξn) = Dξ1 + Dξ2 +…+ Dξn2. 任意任意随机变量和的期望等于期望的和随机变量和的期望等于期望的和 :: E(ξ1 ±ξ2±…±ξn) = Eξ1 ± Eξ2 ±…± Eξn比较:比较:3. 独立独立随机变量乘积的期望等于期望的乘积:随机变量乘积的期望等于期望的乘积: E(ξ1 ξ2 … ξn) = Eξ1 Eξ2 … Eξn5. 若若 ,则,则 证明证明:因为:因为注:注:这个性质表明数学期望具有一个重要的极值性质:这个性质表明数学期望具有一个重要的极值性质:在在 中中, ,当当 时达到极小时达到极小;这也说明在这也说明在 的定义中取的定义中取 的合理性。
的合理性例例2、、已知已知X ~ b(n,p),求,求D(X)注:注:利用方差和的性质时要注意利用方差和的性质时要注意相互独立相互独立的条件““标准化标准化” ” 的目的是通过线性变换把一个随机的目的是通过线性变换把一个随机变量的期望转化为变量的期望转化为 0 0,方差转化为,方差转化为 1. 1. u 随机变量的标准化:随机变量的标准化: 假设随机变量假设随机变量ξ的期望的期望Eξ及方差及方差Dξ都存在都存在, 且且Dξ >0,则称,则称为为ξ 的的标准化随机变量标准化随机变量二二. . Chebyshev不等式不等式对于任何具有有限期望与方差的随机变量对于任何具有有限期望与方差的随机变量ξ,都有,都有其中其中ε 是任一正数是任一正数证明证明: : 若若 F(x)是是ξ的分布函数,则显然有的分布函数,则显然有Chebyshev不等式还常写成下面的形式不等式还常写成下面的形式:或或 Chebyshev不等式的意义不等式的意义:利用随机变量:利用随机变量ξ 的数学期望的数学期望及方差对及方差对 ξ的概率分布进行估计它断言不管的概率分布进行估计它断言不管ξ 的分布的分布是什么,是什么,ξ 落在落在 中的概率均不小中的概率均不小于于 从从ChebyshevChebyshev不等式还可以看出不等式还可以看出, ,当方差愈小时当方差愈小时, ,事件事件的概率也愈小,从这里可以看出的概率也愈小,从这里可以看出方差是描述随机变量与方差是描述随机变量与其期望值离散程度的一个量其期望值离散程度的一个量。
特别地特别地, ,若若 , ,则对于任意的则对于任意的 ,恒有,恒有 即即所以所以方差为零的随机变量是常数方差为零的随机变量是常数因此因此, ,在不等式中分别取在不等式中分别取 ε =σ,,2σ,,3σP{|ξ - |≤σ }≥ 0P{|ξ - |≤2σ }≥ 0.75P{|ξ - |≤3σ }≥ 0.8889比较正态分布的结果:比较正态分布的结果:P{|ξ - |≤σ } = 0.6826 ,P{|ξ - |≤2σ } = 0.9544 ,P{|ξ - |≤3σ } = 0.9974 定义定义 设设(X,Y)为为二维随机变量二维随机变量, 若若存在,则称它为存在,则称它为X X与与Y Y的的协方差协方差,cov(X,Y). cov(X,Y). 三、相关系数三、相关系数 对于随机向量对于随机向量, ,我们除了关心它的各个分量的情况我们除了关心它的各个分量的情况外外, ,还希望知道各个分量之间的联系还希望知道各个分量之间的联系, ,于是引进了于是引进了协方差协方差和和相关系数相关系数的概念。
的概念u 常用常用计算计算公式:公式:u 协方差协方差的概率的概率意义意义:协方差实际上是两个随机变量中心化以后协方差实际上是两个随机变量中心化以后乘积的乘积的数学期望,是它们关系的一种度量数学期望,是它们关系的一种度量协方差为协方差为正正说明说明ξ、、η 具有相同变化趋势,即平均具有相同变化趋势,即平均来说来说 ξ 相对于相对于 Eξ 变大变大(或变小时或变小时) η 也相对于也相对于Eη 增加增加(或减少或减少); 反之协方差为反之协方差为负负则说明则说明ξ 、、η 具有相反的变具有相反的变化趋势a,b为常数为常数u协方差的性质协方差的性质u 和的方差公式:和的方差公式:设设 为为n维随机向量,记维随机向量,记u协方差矩阵:协方差矩阵:简记作简记作DX. 事实上事实上, , 对任何实数对任何实数 有有因而因而, , 对于协方差矩阵对于协方差矩阵 有有: :Remark::3 3、协方差矩阵是一个、协方差矩阵是一个非负定矩阵非负定矩阵定义定义. 称称为为X与与Y的的相关系数相关系数。
更常用的是如下更常用的是如下““标准化标准化””了的协方差了的协方差. .相关系数就是标准化的随机变量相关系数就是标准化的随机变量 与与 的协方差的协方差这里当然要求这里当然要求DX, DY为正以后补充定义为正以后补充定义常数与任何常数与任何随机变量的相关系数为零随机变量的相关系数为零u 相关系数:相关系数:例例3 3 求服从多项分布的随机向量的各个分量之间的协方差求服从多项分布的随机向量的各个分量之间的协方差和相关系数和相关系数 解解: : 显然显然因此因此注意到注意到, ,因此因此, ,这里整数这里整数 , ,且且因而有因而有从而,相关系数为从而,相关系数为由于由于可写出协方差阵与相关系数阵可写出协方差阵与相关系数阵下面研究相关系数的性质下面研究相关系数的性质, ,先证明一条常用的不等式先证明一条常用的不等式定理定理(Cauchy-Schwarz不等式不等式)等式成立当且仅当等式成立当且仅当这里这里 是某一个常数。
是某一个常数对任意的对任意的随机变量随机变量ξ 与与η , , 如果如果 则有则有证明证明: :对任意的实数对任意的实数t, t, 定义定义 显然对一切显然对一切 ,因此二次方程,因此二次方程 或者没有或者没有实根或者有一个重根所以实根或者有一个重根所以此外此外, ,方程方程 有一个重根有一个重根 存在的充要条件是存在的充要条件是这时,这时, ,因此,因此 把柯西把柯西- -施瓦兹不等式应用到施瓦兹不等式应用到 及及 ,,可以得到相关系数的如下重要性质可以得到相关系数的如下重要性质。
性质性质1 对于对于ξ与与η 的相关系数的相关系数ρ ,,而而 ρ = -1, 当且仅当当且仅当性质性质1表明表明, 当当 时时, ξ与与η 存在着线性关系存在着线性关系. 有线有线性关系是一个极端,性关系是一个极端, ρ = 0又是一个极端又是一个极端而而 ρ = 1, 当且仅当当且仅当定义定义 若随机变量若随机变量 与与 的相关系数的相关系数ρρ= 0= 0,则我们称,则我们称 与与 ( (线性线性) )不相关不相关性质性质2 2 对随机变量对随机变量 与与 , ,下面的事实等价:下面的事实等价:不相关;不相关; 独立性和不相关性都是随机变量间联系独立性和不相关性都是随机变量间联系“薄弱薄弱”的的一种反映,自然希望知道这两个概念之间的联系一种反映,自然希望知道这两个概念之间的联系性质性质3 3 若若 与与 独立,则独立,则 与与 不相关其逆不成立其逆不成立,请看下面的例子请看下面的例子例例4 4 设设 服从服从 中的均匀分布,中的均匀分布, 这里这里a是定数。
试判断是定数试判断 与与 的独立性与相关性的独立性与相关性解:解:因而,因而, 与与 的相关系数为的相关系数为当当 ,,X与与Y的线性关系越显著;的线性关系越显著;当当 , , X与与Y 的线性关系越不显著;的线性关系越不显著;相关系数相关系数之间之间线性关系线性关系的一种度量的一种度量. .是是X与与Y于是,于是,当当 时,时,当当 时,时,存性关系存性关系但是但是, 当当 或或 时,时, ,这时,这时 与与 不相关不相关但是这时却有但是这时却有 ,因此,因此 与与 不独立不独立两个随机变量不相关,它们之间可能存在其它关系两个随机变量不相关,它们之间可能存在其它关系即使即使Remark:: 不相关性不相关性是就是就线性关系线性关系而言的,而而言的,而独立性独立性是就是就一般关一般关系系而言的但是如果它们服从二元正态分布,那么它们而言的但是如果它们服从二元正态分布,那么它们之间的独立性和不相关性是等价的。
之间的独立性和不相关性是等价的性质性质4 4 对于对于二元正态分布二元正态分布,不相关性与独立性等价,不相关性与独立性等价. .这个结果可推广到多元场合这个结果可推广到多元场合性质性质5 5 若若ξ与与η 都是取都是取二值二值随机变量随机变量,则不相关性与独,则不相关性与独立性等价立性等价. .u 在在抽样调查中的应用抽样调查中的应用 抽样调查是社会经济中用的最多的统计方法为对总体抽样调查是社会经济中用的最多的统计方法为对总体的某个指标(主要是总值、平均值、比率和百分比)进行的某个指标(主要是总值、平均值、比率和百分比)进行估算特设计某种抽样方案估算特设计某种抽样方案 最简单的抽样方式是最简单的抽样方式是简单随机抽样简单随机抽样例例6 6 袋中有袋中有 张卡片,各记以数字张卡片,各记以数字 ,不放,不放回地从中抽出回地从中抽出 张,求其和的数学期望和方差张,求其和的数学期望和方差解解: : 取一张时,其数字取一张时,其数字 的分布的分布均值及方差分别为均值及方差分别为: : 若以若以 记记n张卡片的数字之和张卡片的数字之和, 以以 记第记第i次次 抽得的卡片上的数字,则抽得的卡片上的数字,则由于抽签与顺序无关,因此由于抽签与顺序无关,因此故故所以所以这里,我们又一次用到这里,我们又一次用到抽签与顺序无关抽签与顺序无关。
在在 中令中令 ,这时,这时 是一个常数,是一个常数,因此因此 , , 于是于是因而因而, ,最后得到最后得到: : 与有放回抽取的方差与有放回抽取的方差 相比相比, ,多出了一个因子多出了一个因子 ,称为称为有限总体修正因子有限总体修正因子 当当 时,它等于时,它等于1;而当;而当 时,时, 它取值为它取值为0这与直观符合 特别地,若取特别地,若取 则可以得则可以得到到超几何分布的均值和方差超几何分布的均值和方差的表达式的表达式u 现代现代证券组合理论证券组合理论 Markovitz Markovitz在在5050年代引进的均值年代引进的均值----方差模型成了现代证券方差模型成了现代证券组合理论的基石组合理论的基石 一个相当自然的假定是:一个相当自然的假定是:投资者都追求高收益而规避风投资者都追求高收益而规避风险,也即希望有高的均值而不愿有大的方差险,也即希望有高的均值而不愿有大的方差。
但是,证券市场的历史记录表明,高收益常伴随着高风险但是,证券市场的历史记录表明,高收益常伴随着高风险根本的出路在于采用证券组合,即把全部资金分散投资于各根本的出路在于采用证券组合,即把全部资金分散投资于各种证券 假定投资于上述假定投资于上述 种证券的资金的比例分别为种证券的资金的比例分别为 假定有假定有 种证券可以投资种证券可以投资, ,并把它们的收益率看作是随机变并把它们的收益率看作是随机变量量, , 通常记为通常记为 , , 相应的均值和方差分别记为相应的均值和方差分别记为 和和 并以并以 记记 与与 的相关系数的相关系数则总的收益率为则总的收益率为显然其平均收益率为显然其平均收益率为而方差则为而方差则为因此寻找最优证券组合的问题化为:因此寻找最优证券组合的问题化为: 求投资比例求投资比例 ,使,使 等于某个目标值而等于某个目标值而 达到最小,达到最小,或者或者 控制在一个可以接受的水平而使控制在一个可以接受的水平而使 达到最大。
达到最大 Markovitz模型兼顾了金融市场中收益和风险两大要素,而且模型兼顾了金融市场中收益和风险两大要素,而且形式简便,为金融学的发展开创了新局面,他也因此获得了形式简便,为金融学的发展开创了新局面,他也因此获得了1990年度的诺贝尔经济学奖年度的诺贝尔经济学奖四、四、 矩矩 数学期望数学期望, ,方差方差, ,协方差是随机变量常用的数字特征,协方差是随机变量常用的数字特征, 它们都是某种矩它们都是某种矩 矩是最广泛使用的一种数字特征,在概率论和数理统计矩是最广泛使用的一种数字特征,在概率论和数理统计种占有重要地位常用的矩有两种:种占有重要地位常用的矩有两种:原点矩和中心矩原点矩和中心矩定义定义. 对正整数对正整数 ,称,称 为为 阶原点矩阶原点矩.数学期望是一阶原点矩数学期望是一阶原点矩定义定义. 对正整数对正整数 ,,称称 为为 阶中心矩阶中心矩. .方差是二阶中心矩方差是二阶中心矩定理定理. 中心矩和原点矩可相互表达中心矩和原点矩可相互表达。
证明:事实上,证明:事实上, 此外对正数此外对正数 k ,还可以定义,还可以定义 k 阶原点绝对矩阶原点绝对矩 及及k k 阶中心绝对矩阶中心绝对矩 ,它们较少使用它们较少使用 对于多维随机变量,可以定义各种混合矩,例如对于多维随机变量,可以定义各种混合矩,例如称为称为k+l 阶阶混合中心矩混合中心矩协方差是二阶混合中心矩协方差是二阶混合中心矩,是其中,是其中最重要的一种最重要的一种证毕证毕. .解:解:密度函数为密度函数为故原点矩和中心矩相同故原点矩和中心矩相同显然显然, , 当当k k为奇数时,为奇数时, ;当;当k k为偶数时,为偶数时, 例例7 设设 为服从正态分布为服从正态分布 ,求其,求其 k k 阶原点矩阶原点矩和和 k k 阶中心矩阶中心矩n推广推广::若若 为服从正态分布为服从正态分布N( , 2),,其其 k 阶中心矩阶中心矩:k 阶原点矩阶原点矩:当当k k为奇数时,为奇数时, 当当k k为偶数时,为偶数时, 五、条件数学期望五、条件数学期望1.1.离散随机变量的条件期望离散随机变量的条件期望Y 关于随机事件关于随机事件(X = x )的条件期望:的条件期望:Remark::Y 关于关于X 的条件期望的条件期望E(Y|X)是一个随机变量,它取是一个随机变量,它取值为值为E(Y|X=x)的概率是的概率是 P(X =x )。
其反映了随机变量其反映了随机变量Y的平均值对随机变量的平均值对随机变量X的依赖2.2.连续随机变量的条件期望连续随机变量的条件期望在在 的条件下,的条件下, 的的条件数学期望条件数学期望定义为定义为Remark: 为随机变量为随机变量:它取值它取值 ,对应,对应密度为密度为p (x).注意:注意:条件数学期望具有数学期望的所有性质条件数学期望具有数学期望的所有性质.所以所以它服从正态分布它服从正态分布例例 考虑二维正态分布,考虑二维正态分布,(ξ,η) ~从第三章已经知道从第三章已经知道η关于随机事件关于随机事件(ξ=x)的条件分布为的条件分布为因此因此η 关于随机事件关于随机事件(ξ=x) 的条件期望就是的条件期望就是设设(X,Y)(X,Y)为二维随机向量,且为二维随机向量,且E(X)E(X)存在,则有存在,则有证明证明:只对连续性情况证明:只对连续性情况证明.设设的概率密度为的概率密度为 , 则有则有 定理定理( (全期望公式全期望公式) ) l 全全期望公式的期望公式的应用应用: 这公式提供了一个在大范围求平均的一种思想方法,这公式提供了一个在大范围求平均的一种思想方法,即所谓的即所谓的两次平均法两次平均法.例例8 一名矿工被困在矿井有三个门的位置,第一个门一名矿工被困在矿井有三个门的位置,第一个门与一个经与一个经3小时路程可到达安全区的坑道连接;第二个门小时路程可到达安全区的坑道连接;第二个门与一个经与一个经5小时路程可回到原处的坑道连接;第三个门与小时路程可回到原处的坑道连接;第三个门与一个经一个经7小时路程可回到原处的坑道连接。
假定该矿工等小时路程可回到原处的坑道连接假定该矿工等可能在三个门种选择,求他平均需要多少时间才能到达安可能在三个门种选择,求他平均需要多少时间才能到达安全区解解:设该矿工需要小时到达安全区,则 的可能取值显然有由题设知记矿工平均需要时间为由全期望计算式:解得§4.5 特征函数特征函数一一 、特征函数的定义、特征函数的定义二、二、 特征函数的性质特征函数的性质三、三、 逆转公式与唯一性定理逆转公式与唯一性定理 四、四、 分布函数的再生性分布函数的再生性五、五、 多元特征函数多元特征函数 一、特征函数的定义一、特征函数的定义 分布函数及其密度无疑是描述随机变量概率规律的分布函数及其密度无疑是描述随机变量概率规律的有力工具,可方便地解决许多与随机变量有关的概率问有力工具,可方便地解决许多与随机变量有关的概率问题但是,在今后的某些问题中,分布函数又表现出某题但是,在今后的某些问题中,分布函数又表现出某些不足例如:些不足例如:((1 1)分布函数本身的分析性质不太好,它只是一个单边连)分布函数本身的分析性质不太好,它只是一个单边连续的有界非降函数续的有界非降函数。
2 2)独立随机变量和的分布函数等于各分布函数的卷积)独立随机变量和的分布函数等于各分布函数的卷积, ,这在计算上带来不少麻烦这在计算上带来不少麻烦 另一方面另一方面, ,数字特征也只反映了概率分布的某些侧面数字特征也只反映了概率分布的某些侧面一般并不能通过它来确定分布函数下面介绍的一般并不能通过它来确定分布函数下面介绍的特征函数特征函数, ,即能完全决定分布函数,又具有良好的分析性质即能完全决定分布函数,又具有良好的分析性质定义定义 如果如果 与与 都是概率空间都是概率空间 上的实值随机上的实值随机变量,则称变量,则称 为为复随机变量复随机变量. .对复随机变量的研究本质上是对二维随机变量的研究对复随机变量的研究本质上是对二维随机变量的研究. . 如果二维随机变量如果二维随机变量 与与 相互独立,则称相互独立,则称复随机变量复随机变量 与与 相互独立。
相互独立 定义复随机变量定义复随机变量 的数学期望为的数学期望为 对于复随机变量,可平行的定义或建立一系列结果对于复随机变量,可平行的定义或建立一系列结果例如例如: :若若 是相互独立的,则是相互独立的,则又如又如, , 若若 是一个博雷尔可测函数,是一个博雷尔可测函数, 则则这里这里, ,定义定义 若随机变量若随机变量 的分布函数为的分布函数为 ,则称,则称 为为 的的特征函数特征函数 特征函数是一个实变量的复值函数,由于特征函数是一个实变量的复值函数,由于 ,,所以它对一切实数所以它对一切实数t t都有意义都有意义 显然特征函数只与分布函数有关,因此又称显然特征函数只与分布函数有关,因此又称某一分布函某一分布函数的特征函数数的特征函数这时,特征函数是密度函数这时,特征函数是密度函数 p(x)的的Fourier变换对于对于离散型随机变量离散型随机变量,若其分布列为:,若其分布列为:则其特征函数为:则其特征函数为: 对于对于连续型随机变量连续型随机变量,若其分布密度为,若其分布密度为p(x),则其特征,则其特征函数为:函数为:u 一些一些重要分布的特征函数重要分布的特征函数例例1 退化分布退化分布 的特征函数的特征函数例例2 二项分布二项分布 的特征函数的特征函数例例3 泊松分布泊松分布 的特征函数为的特征函数为例例4 分布分布 的特征函数:的特征函数:特别地,指数分布特别地,指数分布Exp(λ)::卡方分布卡方分布 ::二二 、特征函数的性质、特征函数的性质 性质性质1 特征函数特征函数 有如下性质:有如下性质:证明:证明:性质性质2 特征函数在特征函数在 上一致连续。
上一致连续证明:证明:注意上式右边已与注意上式右边已与 t 无关而而因此,因此, 可选足够大的可选足够大的 使右边的第一项任意小,然后选充分小使右边的第一项任意小,然后选充分小的的 可使第二个积分也任意小,从而证明了定理的结论可使第二个积分也任意小,从而证明了定理的结论 性质性质3 对于任意的正整数对于任意的正整数 及任意的实数及任意的实数 及复及复数数 ,成立,成立证明:证明: 这个性质称这个性质称为为非负定性非负定性,是是特征函数的最本特征函数的最本质的性质之一质的性质之一性质性质4 两个相互独立的随机变量之和的特征函数等于它两个相互独立的随机变量之和的特征函数等于它们各自特征函数之积们各自特征函数之积证明:证明:设设 与与 是两个相互独立的随机变量,是两个相互独立的随机变量,由由 与与 的独立性不难推得复随机变量的独立性不难推得复随机变量 与与 也是也是独立的,则独立的,则性质性质4可以推广到可以推广到 n 个独立随机变量之和的场合个独立随机变量之和的场合.正是由于性质正是由于性质4 4,才使特征函数在概率论中占有重要地位,才使特征函数在概率论中占有重要地位. .性质性质5 设随机变量设随机变量 的的n阶矩存在,则它的特征函数可微阶矩存在,则它的特征函数可微分分 n 次,且当次,且当 时:时:证明证明: : 由于由于 的的 阶矩存在,故阶矩存在,故 ,因而可作,因而可作下列积分号下的微分下列积分号下的微分取取 ,即得结论成立。
即得结论成立利用性质利用性质5 5,我们,我们可以方便地求随机可以方便地求随机变量的各阶矩变量的各阶矩推论推论. 设随机变量设随机变量 的的 n 阶矩存在,则它的特征函数可作阶矩存在,则它的特征函数可作如下展开:如下展开:性质性质5 设设 ,这里,这里a, b 为常数,则为常数,则证明证明: :例例5 5 求正态分布求正态分布 的特征函数的特征函数. .解解: :先讨论先讨论 的场合:的场合:由于正态分布的由于正态分布的一阶矩一阶矩存在,可对上式存在,可对上式求导求导,得,得因此因此, ,由于由于 f (0)=1 ,所以,所以 c = 0 , 从而从而对于对于 的场合,利用性质的场合,利用性质6 6可得:可得:例例. .三、逆转公式与唯一性定理三、逆转公式与唯一性定理 特征函数和分布函数是相互唯一确定的,由分布函数决特征函数和分布函数是相互唯一确定的,由分布函数决定特征函数是显然的,剩下来的是证明可定特征函数是显然的,剩下来的是证明可由特征函数唯一决由特征函数唯一决定分布函数。
定分布函数 则则引理引理 设设 证明证明::从数学分析中知道狄利克雷积分从数学分析中知道狄利克雷积分而而定理(逆转公式)定理(逆转公式) 设分布函数设分布函数 的特征函数为的特征函数为 ,又,又 是是 的的连续点,则连续点,则证明证明:不妨设:不妨设 ,记,记交换交换 中两积分的积分顺序得到:中两积分的积分顺序得到:因为对因为对 ,有,有因此,因此,对对 ,取共轭即知,取共轭即知上式也成立上式也成立由前面的引理知:由前面的引理知: 有界,因此由有界,因此由勒贝格控制收勒贝格控制收敛定理敛定理并利用引理的结果可知:并利用引理的结果可知:若若 是是 的连续点,则的连续点,则定理定理 ( (唯一性定理唯一性定理) ) 分布函数由其特征函数唯一确定分布函数由其特征函数唯一确定. .而分布函数由其连续点上的值唯一决定而分布函数由其连续点上的值唯一决定由唯一性定理知特征函数可完整地描述随机变量。
由唯一性定理知特征函数可完整地描述随机变量特别当特别当 是是绝对可积绝对可积函数时,有下列更强的结果函数时,有下列更强的结果证明证明: : 应用逆转公式,在应用逆转公式,在 的每一连续点的每一连续点 上,当上,当 沿沿 的连续点趋向于的连续点趋向于 时,有时,有定理定理 若若特征函数特征函数 f (t) 绝对可积,则相应的分布函数绝对可积,则相应的分布函数 F (x) 的导数存在并连续,并且的导数存在并连续,并且证明证明: : 由逆转公式,若由逆转公式,若 及及 是是 的连续点,则的连续点,则利用利用 ,可得:,可得:由假设,由假设, 绝对可积,因此有绝对可积,因此有利用勒贝格控制收敛定理利用勒贝格控制收敛定理因此因此, , 存在而且有界存在而且有界 因此,在因此,在 绝对可积的条件下,绝对可积的条件下,分布密度分布密度 与特征与特征函数函数 通过傅立叶变换来联系。
通过傅立叶变换来联系四、分布函数的再生性四、分布函数的再生性 在研究独立随机变量和的分布时,我们发现有的分布具有在研究独立随机变量和的分布时,我们发现有的分布具有这样的性质:这样的性质:两个具有同一类型分布的独立随机变量之和的两个具有同一类型分布的独立随机变量之和的分布仍是这种类型的分布,且对应的参数等于两个随机变量分布仍是这种类型的分布,且对应的参数等于两个随机变量相应参数之和相应参数之和这就称为这就称为再生性再生性例例6 6因为因为例例7 7因为因为例例8 8因为因为例例9 9因为因为u 分布函数分布函数的分解问题的分解问题 若两个独立随机变量之和服从某一分布,问是否能断定若两个独立随机变量之和服从某一分布,问是否能断定这两个随机变量也分别服从这个分布?这两个随机变量也分别服从这个分布? 这实际上是分布函数再生性问题的逆问题这实际上是分布函数再生性问题的逆问题已经证明:对于已经证明:对于正态分布正态分布和和泊松分布泊松分布,,分解问题分解问题成立成立. .五、多元特征函数五、多元特征函数 若随机向量若随机向量 的分布函数为的分布函数为 , , 与随与随机变量相仿,我们可以定义它的机变量相仿,我们可以定义它的特征函数特征函数. . 可以类似于一元的场合可以类似于一元的场合, , 建立起建立起n元特征函数的理论元特征函数的理论, , 由由于方法完全相同于方法完全相同, , 我们只叙述相关结论我们只叙述相关结论, ,证明一概从略。
证明一概从略性质性质1 在在 中一致连续,并且中一致连续,并且性质性质2 2 如果如果 是是 的特征函数,则的特征函数,则的特征函数为的特征函数为性质性质3 3 如果如果 存在,则存在,则性质性质4 4 若若 的特征函数为的特征函数为 , ,则则 维随机向量的特征函数为维随机向量的特征函数为逆转公式逆转公式 如果如果 是随机向量是随机向量 的特征函的特征函数,而数,而 是它的分布函数,则是它的分布函数,则其中其中 和和 都是任意实数,但满足都是任意实数,但满足唯一的要求唯一的要求::落在平行体落在平行体的面上的概率为零的面上的概率为零唯一性定理唯一性定理 分布函数分布函数 由其特征函数唯一决由其特征函数唯一决定定。
有了唯一性定理有了唯一性定理, ,可以进一步证明特征函数的如下两个可以进一步证明特征函数的如下两个性质,它们表征了性质,它们表征了独立性独立性性质性质5 5 若若 的特征函数为的特征函数为 , , 而而 的特的特征函数为征函数为 ,则随机变量,则随机变量 相互独相互独立的充要条件为立的充要条件为对一切实数对一切实数 及及 成立成立性质性质6 6 若以若以 及及分别记随机向量分别记随机向量 及及的特征函数的特征函数, ,则则 与与 独立的充要条件是独立的充要条件是: :习题四习题四第十一周:第第十一周:第 3、、8、、9、、16、、24 题题第十二周:第第十二周:第 14、、30、、31、、32题题第十三周:第第十三周:第 26、、48、、50、、51,,52题题注注:第:第 50、、51题要利用第题要利用第49的结果的结果. 。
