您所在位置：网站首页 > 办公文档 > 工作计划 > 概率论基础第二版第四章数字特征与特征函数

概率论基础第二版第四章数字特征与特征函数.ppt

130页

卖家[上传人]：大米

文档编号：573946480

上传时间：2024-08-15

文档格式：PPT

文档大小：3.43MB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

20金贝

下载

/ 130 举报版权申诉马上下载

文本预览

下载提示

常见问题

概率论概率论 Probability Theory中央民族大学理学院中央民族大学理学院xuciwen@徐赐文徐赐文第四章第四章数字特征与特征函数数字特征与特征函数内容提要p数学期望p方差、协方差、相关系数p随机变量的不相关p中心矩、原点矩p特征函数典型问题Ø掌握数学期望的定义、性质、求法及应用Ø掌握方差、相关系数的定义、性质、求法Ø了解特征函数的定义、性质、求法及应用我们知道,随机变量的分布列或概率密度,全面地描述了随机变量的统计规律.但在许多实际问题中,这样的全面描述并不使人感到方便,许多情况下也不必要.§1 数学期望数学期望一、离散型随机变量的数学期望一、离散型随机变量的数学期望 [例例0] 有A，B两射手，他们的射击技术如表所示，试问哪一个射手本领较好？0.30.50.20.60.10.3概率10981098击中环数BA射手名称5416212817103只数Nk3210-1-2日走时误差xk则抽查到的100只手表的平均日走时误差为即[例例00] 某手表厂在出厂产品中,抽查了N=100只手表的日走时误差,其数据如表:频率频率[定义定义4.4.1] 设离散型随机变量x 的概率分布为如若则称为随机变量x 的数学期望数学期望,记为Ex .如果则称随机变量x 的数学期望不存在数学期望不存在.即此时 Ex=[注] 随机变量x 的数学期望由数学期望由x的概率分布惟一确定概率分布惟一确定.所以A的射击技术较B的好.0.30.50.20.60.10.3概率10981098击中环数BA射手名称[例例0] 有A，B两射手，他们的射击技术如表所示，试问哪一个射手本领较好？解解 A射击平均击中环数为B射击平均击中环数为解解 ① 分布律为： X0123P0.30.40.20.1② 平均废品数为： [例例2(p173例例5)] 设随机变量x具有如下的分布，求Ex.解解虽然有收敛,但发散,因此Ex不存在.（（1）） 0-1分布数学期望分布数学期望设x 的分布列为： x x01Pqp则其中[注] 在伯努利试验中,这里的（（2））二项分布数学期望二项分布数学期望设随机变量x服从二项分布,即则随机变量x的数学期望Ex=n p.证明证明（（3）泊松分布数学期望）泊松分布数学期望证明设随机变量x服从泊松分布,即则随机变量x的数学期望Ex=λ .（（4））超几何分布的数学期望超几何分布的数学期望设（（5）几何分布的数学期望）几何分布的数学期望设随机变量x服从几何分布,即证明证明其中0

赌客把钱押在赌台上的这12个字上押定开盒，凡押中者(字和颜色都对)以一比十的得到奖金不中者押金归庄家(假设每次押1元)看看你得钱x的分布列：因此其数学期望为Ex=11/12支出（1元）和期望收入（11/12）明显“吃亏”二、离散型随机变量的数学期望的应用二、离散型随机变量的数学期望的应用 [例例4(p174例例7)] (彩票彩票) 彩票的发行彩票的发行,每张面值每张面值1元元,设设x=x=“每一张彩每一张彩票可能的获奖数票可能的获奖数(元元)”,其概率分布如下其概率分布如下,求求Ex x[解解]=0.5 (元元)即平均每张彩票获奖即平均每张彩票获奖0.5 (元元)[例例5(p175例例8)] (保险保险) 这里主要问题是如何这里主要问题是如何确定保险费确定保险费.在保险在保险学中学中,收取保险费的原则是收取保险费的原则是:被保险人交的被保险人交的“纯保险费纯保险费”与他们所能与他们所能得到的赔偿金的期望值相等得到的赔偿金的期望值相等[分析分析] 设设N个人参加保险，每人交的纯保险费，个人参加保险，每人交的纯保险费，a 元，出事的元，出事的概率为概率为p，出事赔偿金为，出事赔偿金为b元，则元，则a与与b有如下关系有如下关系：：设设x=x=“N个人中出事的人数个人中出事的人数”，，则则x ~ x ~ B(N, p) ，且有：，且有：由收取保险费的原则可知：由收取保险费的原则可知：Na = bEx x= = bNp即：即：a = b p确定确定保费保费[例例6(p175例例9)] (投资之决策投资之决策) 投资总具有一定的风险，通过计算投资总具有一定的风险，通过计算期望收益来期望收益来确定投资方向。

确定投资方向某人有某人有10万元现金，想投资于某项目，预估成功的机会为万元现金，想投资于某项目，预估成功的机会为30%，可得利润，可得利润8万元，失败的机会为万元，失败的机会为70%，将损失，将损失2万元，若万元，若存入银行，同期间的利率为存入银行，同期间的利率为5%，问是否应作此项投资？，问是否应作此项投资？[分析分析] 设设x x为投资利润，则为投资利润，则x x 的概率分布为：的概率分布为：因而投资期望收益为：因而投资期望收益为：而同期存入银行的收收益为而同期存入银行的收收益为=10*5%=0.5(万元万元)值得冒险投资！[例例7(p176例例10)] (一种验血新技术一种验血新技术) 在一个人数很多的单位中普在一个人数很多的单位中普查某疾病查某疾病,N个人去验血个人去验血.对这些人的血的化验可以用两种办法进对这些人的血的化验可以用两种办法进行行.(1) 每个人的血分别化验每个人的血分别化验,这时需化验这时需化验N次次;(2) 把把k个人的血混个人的血混在一起进行化验在一起进行化验.如如结果是阴性结果是阴性的的,那么对这那么对这k个人只作个人只作一次一次检验检验就够了就够了;如如结果是阳性结果是阳性,必须对这必须对这k个人再逐个分别化验，此时共个人再逐个分别化验，此时共需需k+1次次化验化验.假定每个人化验呈阳性反应的概率为假定每个人化验呈阳性反应的概率为p,且每个人反且每个人反应是独立的应是独立的,则当则当p相当小时采用办法相当小时采用办法(2)能减少化验次数。

能减少化验次数[分析分析] 设设x x为每个人的血化验次数为每个人的血化验次数(k个人一组个人一组),q=1- p,则则x x 的概率的概率分布为分布为: :因此因此所以，当所以，当化验次数减少化验次数减少三、连续型随机变量的数学期望三、连续型随机变量的数学期望 p我们已知离散型随机变量x的数学期望为Ex=p自然要问连续型随机变量的数学期望是什么?p设p(x) 是连续型随机变量x的密度函数,取分点x00,常数),求W的数学期望.解解因为随机变量V的密度函数为所以[例例12(p181例子例子4)] （（报童问题报童问题））设某报童每日的潜在卖报数z服从参数为l的泊松公布。

如果每卖出一份报可得报酬a，卖不掉而退回则每份赔偿b.若某日该报童买进n份报，试求其期望所得，进一步，还要求最佳的卖出份数n.解解设实卖报数为设实卖报数为x x，则实卖报数与潜在卖报数的关系：，则实卖报数与潜在卖报数的关系：由已知条件可得：由已知条件可得：解（续）解（续）设所得为设所得为h h，则所得与实卖报数的关系为：，则所得与实卖报数的关系为：所以期望所得为：所以期望所得为：[例例13（（p182例例15））] 假定在国际市场上每年对我国某种出口商品的需求量需求量是随机变量x(吨),且x ~U[2000,4000].设每售出这种商品1吨，可为国家挣得外汇3 3万元万元，但假如销售不出而屯积于仓库，则每吨需浪费保养费1 1万元万元，问题是要确定应组织多少货源，才能获利最大?解解以y(吨)表示进货数,则所得收益为（万元）：x 的概率密度为由得：当得：当y=3500(吨吨)时，期望利益达最大时，期望利益达最大于是[定义定义4.1.4] 随机向量的数学期望为 ,其中六、多维随机变量的数学期望六、多维随机变量的数学期望这里，为的联合分布函数，为[注注] 若若则则七、数学期望的基本性质七、数学期望的基本性质[性质性质1] 若若a≤≤x x ≤≤b,b,则则a≤≤E Ex x ≤≤b b ；；特别地，特别地，E E (c) = c, c为常数。

为常数[性质性质2（线性性）（线性性）] 对任意常数对任意常数重新计算重新计算超几何分布的数学期望超几何分布的数学期望设[背景背景] 在一袋中有在一袋中有N件产品件产品,其中次品其中次品M件件,现进行现进行不放回地取不放回地取n件产品，求次品数为件产品，求次品数为x x的数学期望易的数学期望易知知令令则则且且本节书面作业本节书面作业习题四（习题四（P245））第第 1-11-1、、2 2、、3 3、、5-15-1、、7-17-18 8、、9 9、、1010、、11-111-1题题§2 方差、相关系数、矩方差、相关系数、矩 [例例0] A，B两种手表的日走时误差分别具有如下的分布律：易知E(XA)=E(XB)=0.由数学期望无法判别两种手表的优劣.但直觉告诉我们A优于B,怎么样用数学的方法把这种直觉表达出来呢?一、方差一、方差 [分析分析]Ø A手表之所以优于B手表,是因为A手表的日走时较B手表稳定.其日走时与其日平均误差的偏离程度小.Ø 研究随机变量与其均值的偏离程度是有必要的.Ø 怎么样去度量这个偏离程度呢怎么样去度量这个偏离程度呢?Ø (1) xk-E(X)表示 xk与 E(X)之间的偏差;Ø (2) E[X-E(X)]不能反映X与E(X)之间的整体偏差;Ø (3) E{|X-E(X)|}可以度量X与E(X)之间的整体偏差,但运算不方便;Ø (4)E{[X-E(X)]2}可以度量X与E(X)之间的整体偏差,且运算也较方便.[定义定义4.2.1] 设x是一个随机变量,若E[x-Ex]2存在,则称它为x 的方差方差(variance).记为Dx或Var(x),即Dx= Var(x)= E[x-Ex]2称为x的标准差标准差或均方差或根方差均方差或根方差.[定理定理]证明证明 Dx=E[x-Ex]2 =E{x2 -2xEx+ [Ex]2} = Ex2-2ExEx+ [Ex]2 = Ex2- [Ex]2 方差实际上是随机变量x的函数f(x x)=[x x-Ex x]2的数学期望.于是Ø对于离散型随机变量x,若P{ x = xk}= pk, k=1,2,…则Ø 对于连续型随机变量x,若其概率密度为p(x),则[例例0] A，B两种手表的日走时误差分别具有如下表的分布律.问哪种手表质量好些?解解易知E(XA)=E(XB)=0.所以由于D(XA)0}=0,从而P{|x－Ex|=0}=1,即P{x=C}=1.为什么四、四、随机变量的协方差随机变量的协方差Ø E(x x, , h h)=()=(Ex x, Eh h) ) 只反映了只反映了x x与与h h各自的平均值各自的平均值Ø 但二维概率密度但二维概率密度p(x,y)或分布列或分布列pij全面地描述了全面地描述了(x x, h h) 的统计规律的统计规律,也包含有也包含有x x与与h h之间关系之间关系的信息的信息. Ø (x x, , h h) )的方差的方差( (Dx x, Dh h) ) 只反映了只反映了x x与与h h各自离开均值的各自离开均值的偏离程度偏离程度,它们对它们对x x与与h h之间相互关系不提供任何信息之间相互关系不提供任何信息.Ø 由于由于若若相互独立相互独立,则有则有所以所以特别特别,若若x x 与与h h 独立独立, ,有有即即[定义定义4.4.2-1] 任意两个随机变量任意两个随机变量x x 和和h h 的的协方差协方差,记为记为Cov(x x, h h), 定义为定义为 ⑶⑶ Cov(x x＋＋h h,z z)= Cov(x x,z z) + Cov(h h, z z) ⑴⑴ Cov(x x,h h) = Cov(h h,x x)[简单性质简单性质]⑵⑵ Cov(ax x,bh h) = ab Cov(x x,h h) a,b是常数是常数Cov(x x, h h)=E[ x x －－Ex x][h h －－Eh h ] 证明证明 (1) Cov(x,h)= E[(x －Ex) (h － Eh)] = E [(h －Eh) (x －Ex)] = Cov(h, x) 证明证明 (2) Cov(ax,bh)=E[(ax－E(ax))(bh－E(bh))] =E[a(x－Ex))] [b(h－Eh)] =abE[x－Ex][h－Eh] =abCov(x,h)证明证明 (3) Cov(x＋h,z) =E[(x＋h)-E(x＋h)][z－Ez] = E[(x－Ex) ＋(h－Eh)][z－Ez] = E[x-Ex][z－Ez] +[h－Eh][z－Ez] =E[x－Ex][z－Ez] +E[h－Eh][z－Ez] =Cov(x,z)+Cov(h,z) Cov(x x,h h)=Exhxh –Ex x Eh h 可见，若可见，若x x与与h h独立，独立， Cov(x x,h h)= 0 .[计算协方差的一个简单公式计算协方差的一个简单公式]由协方差的定义及期望的性质，可得由协方差的定义及期望的性质，可得Cov(x x,h h)=E[x x－－Ex x][h h－－Eh h ]=Exhxh－－Ex xEh h－－Eh hEx x＋＋Ex xEh h =Exhxh－－Ex xEh h即即若若x x1, x x2 , … , x xn两两独立两两独立,，有，有D(x x+h h)= Dx x +Dh h+ 2Cov( (x,hx,h)随机变量随机变量和的方差与协方差的关系和的方差与协方差的关系特别特别n维随机变量维随机变量的的协方差协方差矩阵矩阵令令此时此时此时下列矩阵称为此时下列矩阵称为的的协方差矩阵协方差矩阵: 简记为简记为:可证明可证明B是是一个一个非负定矩阵非负定矩阵Ø 协方差的数值在一定程度上反映了x与h相互间的联系,但它受x与h本身数值大小的影响.如令x * = k x , h *= kh,这时x *与h *间的相互联系和x与h的相互联系应该是一样的,但是Cov(x *,h *)=k2Cov(x,h)Ø 为了克服这一缺点,在计算x与h的协方差之前,先对x 与h 进行标准化:Ø 再来计算x *和h *的协方差，这样就引进了相关系数的概念.五、随机变量的相关系数五、随机变量的相关系数[定义定义4.2.3] 设二维随机变量(x,h)的方差Dx>0,Dh>0,协方差Cov(x,h)均存在,则称为随机变量x与h的相关系数相关系数(correlation coefficient).[注意] 当x=C 时，认为x与任意随机变量h的相关系数为0。

[定理定理4.2.1(柯西柯西-施瓦兹不等式施瓦兹不等式)] 对于二维随机向量(x,h),若Ex2,Eh2存在,则有|Exh|2≤Ex2Eh2证明证明考虑实变量t的二次函数h(t)=E[(tx－h)2]=t2 Ex2－2tExh+Eh2因为对一切t,有(tx－h)2≥0,所以h(t)≥0. 从而二次方程h(t)=0或者没有实根,或者只有重根,因而，由二次方程根的判别式知识得|Exh|2≤Ex2Eh2相关系数的性质相关系数的性质性质性质1 随机变量x和h的相关系数满足|rxh|≤1.性质性质2 |rxh|=1 的充要条件是,存在常数a,b使得 P{h =a+bx}=1.性质性质3 若x与h相互独立,则rxh=0.性质性质1 随机变量x和h的相关系数满足|rxh|≤1.证明证明令令则从而|rxh|≤1.性质2 |rxh|=1 的充要条件是,存在常数a,b使得 P{h=ax+b}=1证明证明令由rxh2=[E(x*h*)]2≤E(x*2)E(h*2)=1 知|rxh|=1等价于[E(x*h*)]2－E(x*2)E(h*2)=0 它又等价于h(t)=E[(tx*－h*)2]=0有重根t0.又因为E(t0x*－h*)=t0E(x*) －E(h*)=0所以D(t0x*－h*) = 0,由方差的性质知它等价于 P{t0x*－h* =0}=1,即P{h =ax＋b}=1其中a=t0σ(h)/σ(x),b=E(h) － t0 E(x) σ(h)/σ(x).性质性质3 若x与h相互独立,则rxh=0.证明证明若x与h 相互独立,则E(xh)=ExEh,又 Cov(x,h)= E(xh) －ExEh,所以相关系数的含义相关系数的含义Ø考虑以x 的线性函数a＋bx 来近似表示h.以均方误差 e=E[h － (a＋bx)]2 =Eh2＋b2Ex2＋a2－2bExh＋2abEx－2aEh 来衡量以a＋bx近似表达h的好坏程度.e的值越小表示a＋bx与h 的近似程度越好.为此令从而得解得Ø相关系数只是随机变量间线性关系强弱的一个度量.当|rxh|=1 时,说明x与h间存在着线性关系(除去一个零概率事件以外).当|rxh|<1 时,这种线性相关程度随着rxh的减小而减弱.[定义定义4.2.4] (1) 当rxh=1 时,称x与h 正线性相关; (2) 当rxh=－1 时,称x 与h 负线性相关; (3) 当rxh = 0时,称x与h 不相关.[注注] (1) x与h 不相关,只是意味着x与h 不线性相关,但可能存在着别的函数关系; (2)若rxh 存在,则当x与h 独立时, x与h 一定不相关;但x与h不相关时, x与h 不一定独立.[定理定理4.2.2] 对随机变量对随机变量x与h，下面各项等价： (1) Cov(x, h)=0; (2) x与h 不相关; (3) Exh= ExEh ; (4) D(x+h)= Dx＋Dh .[定理定理4.2.3] 若随机变量若随机变量x与h独立，则x与h不相关。

oxhoooxxxhhh0

的数学期望与方差［抽样调查［抽样调查(sample survey)］］以随机的方式抽取若干个体作调以随机的方式抽取若干个体作调查，利用所得数据算出估计值，并给出估计值的精度查，利用所得数据算出估计值，并给出估计值的精度［简单随机抽样］［简单随机抽样］总体由有限个个体组成且满足总体由有限个个体组成且满足:(1) 每一每一个个体被抽到的机会相同个个体被抽到的机会相同;(2) 每一个个体与总体的分布相每一个个体与总体的分布相同解解取一张时，其数字x 的均值及方差分别为及若以记n张卡片的数字之和，以记第i次抽得的卡片上的数字，则解（续）解（续）因此所以下面求得上式最后的协方差即可：当n=N时，因此故最后有有限修正因子[例例9（（p196)](现代证券组合理论现代证券组合理论—Markowitz—均值均值—方差理方差理论论）（）（学生自看学生自看））[定义4.2.5] 设设x x 和和hh是随机变量是随机变量,(1) 若Ex k ,(k = 1,2,…)存在,则称它为x的k阶原点矩,简称k阶矩.(2)若E[xx -Exx]k, (k=1,2,…)存在,则称它为xx 的k阶中心矩.(3)若E(xx k hh l) (k,l=1,2,…)存在,则称它为xx 和hh的k+l阶混合矩.(4)若E[xx -Exx]k[hh -Ehh]l (k,l=1,2,…)存在,则称它为xx和hh的k+l阶混合中心矩.六、矩六、矩(moment)设n维随机变量(x1,x2,…,xn),其协方差矩阵C和向量X与μ分别为若(x1,x2,…,xn)的密度函数为则称(x1,x2,…,xn)是n维正态的随机向量维正态的随机向量,或服从n维正态分布,记为N(μ,C).n维正态分布的性质维正态分布的性质(1) n维随机变量(x1, x2,…,xn)服从n维正态分布的充要条件是x1,x2,…,xn的任意线性组合k1x1+k2x2+…+knxn服从一维正态分布. (2) 若(x1,x2,…,xn)服从n维正态分布,设h1,h2,…,hm是xj (j=1,2,…,n)的线性函数,则(h1,h2,…,hm)服从m维正态分布. (3) 若(x1,x2,…,xn)服从n维正态分布,则“x1,x2,…,xn相互独立”与“ x1,x2,…,xn两两不相关”是等价的.[定义定义1] 如果离散型随机变量x在h =yj的条件下的条件分布列为P{x=xi|h =yj},又若则称为x在h =yj的条件下的条件数学期望条件数学期望,简称为条件期望,并记作E{x|h =yj}. 类似地有E{h | x =xi}的定义.七、条件数学期望七、条件数学期望[定义定义2] 如果连续型随机变量x在条件h =y下的条件概率密度为px|h (x|y),若则称为x在条件h =y下的条件数学期望,或简称为条件期望. 类似地有E{h |x=x}的定义.[例例] 设(x,h)~N(m1, s12 ;m2,s22;r),如果已知h =y,试求 E{x |h =y}.解解由第三章同理由第三章同理可求得：这是N(m1+rs1(y－m2)/s2, s12 (1－r2))分布的密度函数,因而均值为E{x|h =y}= m1+rs1(y－m2)/s2条件数学期望的应用设(x,h)是二维随机向量,如果已知其中某个随机变量的取值h = y,要据此去估计或预测另一个随机变量x的取值.条件数学期望E{x|h =y}是在已知h = y发生的条件下,对x 的一个“合理”的预测. 一般情形下,由(E{x|h = y},y)或(x,E{h |x=x})可以得到平面上的两条曲线, 称它们为回归曲线回归曲线或简称为回归回归(第一类回归第一类回归).把条件数学期望E{x |h =y}作为在已知h =y发生的条件下,对x的一个预测是“合理”.下面讨论其合理性. 已知E{x |h}是h 的函数,现在不妨设还有h 的函数 f (h)可以作为对对x x 的估计的估计.这时要求 E[x－f (h)]2=min. 如果(x,h)的密度函数为p(x,y),就有由方差的性质(C≠Ex 时,有E[x－Ex] 2

[注注] （1）EzEz= = Ex Ex + +i iE Eh h[注注] （2）欧拉公式[定义定义2] 设设随机变量随机变量x x 的分布函数为的分布函数为则则称称为为x x的的特征函数特征函数（characteristic function）.[注注]（2）特征函数的定义域为实数空间，且由分布函数惟一确定二、二、特征函数的计算特征函数的计算常用分布的常用分布的特征函数特征函数三、三、特征函数的性质特征函数的性质证明证明证明证明证明证明证明证明证明证明常用分布的常用分布的特征函数特征函数证明证明证明证明证明证明证明证明证明证明四、四、分布函数的再生性分布函数的再生性本节书面作业本节书面作业习题四（习题四（P245））第第 4848、、5050、、5252、、5757题题。

点击阅读更多内容