
概率论基础第二版第四章数字特征与特征函数.ppt
130页概率论概率论 Probability Theory中央民族大学理学院中央民族大学理学院xuciwen@徐赐文徐赐文第四章第四章 数字特征与特征函数数字特征与特征函数内容提要p数学期望p方差、协方差、相关系数p随机变量的不相关p中心矩、原点矩p特征函数典型问题Ø掌握数学期望的定义、性质、求法及应用Ø掌握方差、相关系数的定义、性质、求法Ø了解特征函数的定义、性质、求法及应用我们知道,随机变量的分布列或概率密度,全面地描述了随机变量的统计规律.但在许多实际问题中,这样的全面描述并不使人感到方便,许多情况下也不必要.§1 数学期望数学期望一、离散型随机变量的数学期望一、离散型随机变量的数学期望 [例例0] 有A,B两射手,他们的射击技术如表所示,试问哪一个射手本领较好?0.30.50.20.60.10.3概率10981098击中环数BA射手名称5416212817103只数Nk3210-1-2日走时误差xk则抽查到的100只手表的平均日走时误差为即[例例00] 某手表厂在出厂产品中,抽查了N=100只手表的日走时误差,其数据如表:频率频率[定义定义4.4.1] 设离散型随机变量x 的概率分布为如若则称为随机变量x 的数学期望数学期望,记为Ex .如果则称随机变量x 的数学期望不存在数学期望不存在.即此时 Ex=[注] 随机变量x 的数学期望由数学期望由x的概率分布惟一确定概率分布惟一确定.所以A的射击技术较B的好.0.30.50.20.60.10.3概率10981098击中环数BA射手名称[例例0] 有A,B两射手,他们的射击技术如表所示,试问哪一个射手本领较好?解解 A射击平均击中环数为B射击平均击中环数为 解解 ① 分布律为: X0123P0.30.40.20.1② 平均废品数为: [例例2(p173例例5)] 设随机变量x具有如下的分布,求Ex.解解 虽然有收敛,但发散,因此Ex不存在.((1)) 0-1分布数学期望分布数学期望 设x 的分布列为: x x01Pqp则 其中[注] 在伯努利试验中,这里的((2)) 二项分布数学期望二项分布数学期望 设随机变量x服从二项分布,即则随机变量x的数学期望Ex=n p.证明证明((3)泊松分布数学期望)泊松分布数学期望 证明设随机变量x服从泊松分布,即则随机变量x的数学期望Ex=λ .((4))超几何分布的数学期望超几何分布的数学期望 设((5)几何分布的数学期望)几何分布的数学期望设随机变量x服从几何分布,即证明证明其中0 赌客把钱押在赌台上的这12个字上押定开盒,凡押中者(字和颜色都对)以一比十的得到奖金不中者押金归庄家(假设每次押1元)看看你得钱x的分布列:因此 其数学期望为Ex=11/12支出(1元)和期望收入(11/12)明显“吃亏”二、离散型随机变量的数学期望的应用二、离散型随机变量的数学期望的应用 [例例4(p174例例7)] (彩票彩票) 彩票的发行彩票的发行,每张面值每张面值1元元,设设x=x=“每一张彩每一张彩票可能的获奖数票可能的获奖数(元元)”,其概率分布如下其概率分布如下,求求Ex x[解解]=0.5 (元元)即平均每张彩票获奖即平均每张彩票获奖0.5 (元元)[例例5(p175例例8)] (保险保险) 这里主要问题是如何这里主要问题是如何确定保险费确定保险费.在保险在保险学中学中,收取保险费的原则是收取保险费的原则是:被保险人交的被保险人交的“纯保险费纯保险费”与他们所能与他们所能得到的赔偿金的期望值相等得到的赔偿金的期望值相等[分析分析] 设设N个人参加保险,每人交的纯保险费,个人参加保险,每人交的纯保险费,a 元,出事的元,出事的概率为概率为p,出事赔偿金为,出事赔偿金为b元,则元,则a与与b有如下关系有如下关系::设设x=x=“N个人中出事的人数个人中出事的人数”,,则则x ~ x ~ B(N, p) ,且有:,且有:由收取保险费的原则可知:由收取保险费的原则可知:Na = bEx x= = bNp即:即:a = b p确定确定保费保费[例例6(p175例例9)] (投资之决策投资之决策) 投资总具有一定的风险,通过计算投资总具有一定的风险,通过计算期望收益来期望收益来确定投资方向。 确定投资方向 某人有某人有10万元现金,想投资于某项目,预估成功的机会为万元现金,想投资于某项目,预估成功的机会为30%,可得利润,可得利润8万元,失败的机会为万元,失败的机会为70%,将损失,将损失2万元,若万元,若存入银行,同期间的利率为存入银行,同期间的利率为5%,问是否应作此项投资?,问是否应作此项投资?[分析分析] 设设x x为投资利润,则为投资利润,则x x 的概率分布为:的概率分布为:因而投资期望收益为:因而投资期望收益为:而同期存入银行的收收益为而同期存入银行的收收益为=10*5%=0.5(万元万元)值得冒险投资![例例7(p176例例10)] (一种验血新技术一种验血新技术) 在一个人数很多的单位中普在一个人数很多的单位中普查某疾病查某疾病,N个人去验血个人去验血.对这些人的血的化验可以用两种办法进对这些人的血的化验可以用两种办法进行行.(1) 每个人的血分别化验每个人的血分别化验,这时需化验这时需化验N次次;(2) 把把k个人的血混个人的血混在一起进行化验在一起进行化验.如如结果是阴性结果是阴性的的,那么对这那么对这k个人只作个人只作一次一次检验检验就够了就够了;如如结果是阳性结果是阳性,必须对这必须对这k个人再逐个分别化验,此时共个人再逐个分别化验,此时共需需k+1次次化验化验.假定每个人化验呈阳性反应的概率为假定每个人化验呈阳性反应的概率为p,且每个人反且每个人反应是独立的应是独立的,则当则当p相当小时采用办法相当小时采用办法(2)能减少化验次数。 能减少化验次数[分析分析] 设设x x为每个人的血化验次数为每个人的血化验次数(k个人一组个人一组),q=1- p,则则x x 的概率的概率分布为分布为: :因此因此所以,当所以,当化验次数减少化验次数减少三、连续型随机变量的数学期望三、连续型随机变量的数学期望 p我们已知离散型随机变量x的数学期望为Ex=p自然要问连续型随机变量的数学期望是什么?p设p(x) 是连续型随机变量x的密度函数,取分点x0 如果每卖出一份报可得报酬a,卖不掉而退回则每份赔偿b.若某日该报童买进n份报,试求其期望所得,进一步,还要求最佳的卖出份数n.解解 设实卖报数为设实卖报数为x x,则实卖报数与潜在卖报数的关系:,则实卖报数与潜在卖报数的关系: 由已知条件可得:由已知条件可得:解(续)解(续) 设所得为设所得为h h,则所得与实卖报数的关系为:,则所得与实卖报数的关系为: 所以期望所得为:所以期望所得为:[例例13((p182例例15))] 假定在国际市场上每年对我国某种出口商品的需求量需求量是随机变量x(吨),且x ~U[2000,4000].设每售出这种商品1吨,可为国家挣得外汇3 3万元万元,但假如销售不出而屯积于仓库,则每吨需浪费保养费1 1万元万元,问题是要确定应组织多少货源,才能获利最大?解解以y(吨)表示进货数,则所得收益为(万元):x 的概率密度为由得:当得:当y=3500(吨吨)时,期望利益达最大时,期望利益达最大于是[定义定义4.1.4] 随机向量 的数学期望为 ,其中六、多维随机变量的数学期望六、多维随机变量的数学期望这里, 为 的联合分布函数, 为[注注] 若若 则则七、数学期望的基本性质七、数学期望的基本性质[性质性质1] 若若a≤≤x x ≤≤b,b,则则a≤≤E Ex x ≤≤b b ;; 特别地,特别地,E E (c) = c, c为常数。 为常数[性质性质2(线性性)(线性性)] 对任意常数对任意常数重新计算重新计算超几何分布的数学期望超几何分布的数学期望 设[背景背景] 在一袋中有在一袋中有N件产品件产品,其中次品其中次品M件件,现进行现进行不放回地取不放回地取n件产品,求次品数为件产品,求次品数为x x的数学期望易的数学期望易知知令令则则且且本节书面作业本节书面作业习题四(习题四(P245))第第 1-11-1、、2 2、、3 3、、5-15-1、、7-17-18 8、、9 9、、1010、、11-111-1题题§2 方差、相关系数、矩方差、相关系数、矩 [例例0] A,B两种手表的日走时误差分别具有如下的分布律: 易知E(XA)=E(XB)=0.由数学期望无法判别两种手表的优劣.但直觉告诉我们A优于B,怎么样用数学的方法把这种直觉表达出来呢?一、方差一、方差 [分析分析]Ø A手表之所以优于B手表,是因为A手表的日走时较B手表稳定.其日走时与其日平均误差的偏离程度小.Ø 研究随机变量与其均值的偏离程度是有必要的.Ø 怎么样去度量这个偏离程度呢怎么样去度量这个偏离程度呢?Ø (1) xk-E(X)表示 xk与 E(X)之间的偏差;Ø (2) E[X-E(X)]不能反映X与E(X)之间的整体偏差;Ø (3) E{|X-E(X)|}可以度量X与E(X)之间的整体偏差,但运算不方便;Ø (4)E{[X-E(X)]2}可以度量X与E(X)之间的整体偏差,且运算也较方便.[定义定义4.2.1] 设x是一个随机变量,若E[x-Ex]2存在,则称它为x 的方差方差(variance).记为Dx或Var(x),即Dx= Var(x)= E[x-Ex]2称为x的标准差标准差或均方差或根方差均方差或根方差.[定理定理]证明证明 Dx=E[x-Ex]2 =E{x2 -2xEx+ [Ex]2} = Ex2-2ExEx+ [Ex]2 = Ex2- [Ex]2 方差实际上是随机变量x的函数f(x x)=[x x-Ex x]2的数学期望.于是Ø对于离散型随机变量x,若P{ x = xk}= pk, k=1,2,…则Ø 对于连续型随机变量x,若其概率密度为p(x),则[例例0] A,B两种手表的日走时误差分别具有如下表的分布律.问哪种手表质量好些?解解 易知E(XA)=E(XB)=0.所以由于D(XA) [定理定理4.2.1(柯西柯西-施瓦兹不等式施瓦兹不等式)] 对于二维随机向量(x,h),若Ex2,Eh2存在,则有|Exh|2≤Ex2Eh2证明证明 考虑实变量t的二次函数h(t)=E[(tx-h)2]=t2 Ex2-2tExh+Eh2因为对一切t,有(tx-h)2≥0,所以h(t)≥0. 从而二次方程h(t)=0或者没有实根,或者只有重根,因而,由二次方程根的判别式知识得|Exh|2≤Ex2Eh2相关系数的性质相关系数的性质性质性质1 随机变量x和h的相关系数满足|rxh|≤1.性质性质2 |rxh|=1 的充要条件是,存在常数a,b使得 P{h =a+bx}=1.性质性质3 若x与h相互独立,则rxh=0.性质性质1 随机变量x和h的相关系数满足|rxh|≤1.证明证明 令令则从而|rxh|≤1.性质2 |rxh|=1 的充要条件是,存在常数a,b使得 P{h=ax+b}=1证明证明 令由rxh2=[E(x*h*)]2≤E(x*2)E(h*2)=1 知|rxh|=1等价于[E(x*h*)]2-E(x*2)E(h*2)=0 它又等价于h(t)=E[(tx*-h*)2]=0有重根t0.又因为E(t0x*-h*)=t0E(x*) -E(h*)=0所以D(t0x*-h*) = 0,由方差的性质知它等价于 P{t0x*-h* =0}=1,即P{h =ax+b}=1其中a=t0σ(h)/σ(x),b=E(h) - t0 E(x) σ(h)/σ(x).性质性质3 若x与h相互独立,则rxh=0.证明证明 若x与h 相互独立,则E(xh)=ExEh,又 Cov(x,h)= E(xh) -ExEh,所以相关系数的含义相关系数的含义Ø考虑以x 的线性函数a+bx 来近似表示h.以均方误差 e=E[h - (a+bx)]2 =Eh2+b2Ex2+a2-2bExh+2abEx-2aEh 来衡量以a+bx近似表达h的好坏程度.e的值越小表示a+bx与h 的近似程度越好.为此令从而得解得Ø相关系数只是随机变量间线性关系强弱的一个度量.当|rxh|=1 时,说明x与h间存在着线性关系(除去一个零概率事件以外).当|rxh|<1 时,这种线性相关程度随着rxh的减小而减弱.[定义定义4.2.4] (1) 当rxh=1 时,称x与h 正线性相关; (2) 当rxh=-1 时,称x 与h 负线性相关; (3) 当rxh = 0时,称x与h 不相关.[注注] (1) x与h 不相关,只是意味着x与h 不线性相关,但可能存在着别的函数关系; (2)若rxh 存在,则当x与h 独立时, x与h 一定不相关;但x与h不相关时, x与h 不一定独立.[定理定理4.2.2] 对随机变量对随机变量x与h,下面各项等价: (1) Cov(x, h)=0; (2) x与h 不相关; (3) Exh= ExEh ; (4) D(x+h)= Dx+Dh .[定理定理4.2.3] 若随机变量若随机变量x与h独立,则x与h不相关。 oxhoooxxxhhh0 的数学期望与方差[抽样调查[抽样调查(sample survey)]]以随机的方式抽取若干个体作调以随机的方式抽取若干个体作调 查,利用所得数据算出估计值,并给出估计值的精度查,利用所得数据算出估计值,并给出估计值的精度 [简单随机抽样][简单随机抽样]总体由有限个个体组成且满足总体由有限个个体组成且满足:(1) 每一每一个个体被抽到的机会相同个个体被抽到的机会相同;(2) 每一个个体与总体的分布相每一个个体与总体的分布相同解解 取一张时,其数字x 的均值及方差分别为及若以 记n张卡片的数字之和,以 记第i次抽得的卡片上的数字,则解(续)解(续)因此所以下面求得上式最后的协方差即可:当n=N时,因此故最后有有限修正因子[例例9((p196)](现代证券组合理论现代证券组合理论—Markowitz—均值均值—方差理方差理论论)()(学生自看学生自看))[定义4.2.5] 设设x x 和和hh是随机变量是随机变量,(1) 若Ex k ,(k = 1,2,…)存在,则称它为x的k阶原点矩,简称k阶矩.(2)若E[xx -Exx]k, (k=1,2,…)存在,则称它为xx 的k阶中心矩.(3)若E(xx k hh l) (k,l=1,2,…)存在,则称它为xx 和hh的k+l阶混合矩.(4)若E[xx -Exx]k[hh -Ehh]l (k,l=1,2,…)存在,则称它为xx和hh的k+l阶混合中心矩.六、矩六、矩(moment)设n维随机变量(x1,x2,…,xn),其协方差矩阵C和向量X与μ分别为若(x1,x2,…,xn)的密度函数为则称(x1,x2,…,xn)是n维正态的随机向量维正态的随机向量,或服从n维正态分布,记为N(μ,C).n维正态分布的性质维正态分布的性质(1) n维随机变量(x1, x2,…,xn)服从n维正态分布的充要条件是x1,x2,…,xn的任意线性组合k1x1+k2x2+…+knxn服从一维正态分布. (2) 若(x1,x2,…,xn)服从n维正态分布,设h1,h2,…,hm是xj (j=1,2,…,n)的线性函数,则(h1,h2,…,hm)服从m维正态分布. (3) 若(x1,x2,…,xn)服从n维正态分布,则“x1,x2,…,xn相互独立”与“ x1,x2,…,xn两两不相关”是等价的.[定义定义1] 如果离散型随机变量x在h =yj的条件下的条件分布列为P{x=xi|h =yj},又若则称为x在h =yj的条件下的条件数学期望条件数学期望,简称为条件期望,并记作E{x|h =yj}. 类似地有E{h | x =xi}的定义.七、条件数学期望七、条件数学期望[定义定义2] 如果连续型随机变量x在条件h =y下的条件概率密度为px|h (x|y),若则称为x在条件h =y下的条件数学期望,或简称为条件期望. 类似地有E{h |x=x}的定义.[例例] 设(x,h)~N(m1, s12 ;m2,s22;r),如果已知h =y,试求 E{x |h =y}.解解 由第三章同理由第三章同理可求得:这是N(m1+rs1(y-m2)/s2, s12 (1-r2))分布的密度函数,因而均值为E{x|h =y}= m1+rs1(y-m2)/s2条件数学期望的应用 设(x,h)是二维随机向量,如果已知其中某个随机变量的取值h = y,要据此去估计或预测另一个随机变量x的取值.条件数学期望E{x|h =y}是在已知h = y发生的条件下,对x 的一个“合理”的预测. 一般情形下,由(E{x|h = y},y)或(x,E{h |x=x})可以得到平面上的两条曲线, 称它们为回归曲线回归曲线或简称为回归回归(第一类回归第一类回归).把条件数学期望E{x |h =y}作为在已知h =y发生的条件下,对x的一个预测是“合理”.下面讨论其合理性. 已知E{x |h}是h 的函数,现在不妨设还有h 的函数 f (h)可以作为对对x x 的估计的估计.这时要求 E[x-f (h)]2=min. 如果(x,h)的密度函数为p(x,y),就有 由方差的性质(C≠Ex 时,有E[x-Ex] 2 [注注] (1)EzEz= = Ex Ex + +i iE Eh h[注注] (2)欧拉公式[定义定义2] 设设随机变量随机变量x x 的分布函数为的分布函数为 则则称称为为x x的的特征函数特征函数(characteristic function).[注注](2)特征函数的定义域为实数空间,且由分布函数惟一确定二、二、特征函数的计算特征函数的计算常用分布的常用分布的特征函数特征函数三、三、特征函数的性质特征函数的性质证明证明证明证明证明证明证明证明证明证明常用分布的常用分布的特征函数特征函数证明证明证明证明证明证明证明证明证明证明四、四、分布函数的再生性分布函数的再生性本节书面作业本节书面作业习题四(习题四(P245))第第 4848、、5050、、5252、、5757题题。
