
概率论与数理统计第二章.ppt
113页湖南商学院信息系湖南商学院信息系 数学教研室数学教研室 第二章 随机变量及其分布第二章 随机变量及其分布第一节 随机变量的定义第二节第二节 离散型随机变量离散型随机变量第三节第三节 连续型随机变量连续型随机变量第四节 随机变量函数的分布湖南商学院信息系湖南商学院信息系 数学教研室数学教研室 第二章 随机变量及其分布第一节 随机变量的定义 一、随机变量概念的产生一、随机变量概念的产生 在实际问题中,随机试验的结果可以用数在实际问题中,随机试验的结果可以用数量来表示,由此就产生了随机变量的概念量来表示,由此就产生了随机变量的概念. 1、有些试验结果本身与数值有关(本身、有些试验结果本身与数值有关(本身就是一个数)就是一个数). 例如,掷一颗骰子面上出现的点数;例如,掷一颗骰子面上出现的点数; 七月份郑州的最高温度;七月份郑州的最高温度;每天从郑州下火车的人数;每天从郑州下火车的人数;昆虫的产卵数;昆虫的产卵数;2、在有些试验中,试验结果看来与数值无、在有些试验中,试验结果看来与数值无关,但我们可以引进一个变量来表示它的各关,但我们可以引进一个变量来表示它的各种结果种结果.也就是说,也就是说,把试验结果数值化把试验结果数值化. 正如裁判员在运动正如裁判员在运动场上不叫运动员的场上不叫运动员的名字而叫号码一样,名字而叫号码一样,二者建立了一种对二者建立了一种对应关系应关系. 这种对应关系在数学上理解为定义了一种这种对应关系在数学上理解为定义了一种实值函数实值函数.e.X(e)R这种实值函数与在高等数学中大家接触到这种实值函数与在高等数学中大家接触到的函数一样吗?的函数一样吗?((1)它随试验结果的不同而取不同的值,)它随试验结果的不同而取不同的值,因而在试验之前只知道它可能取值的范围,因而在试验之前只知道它可能取值的范围,而不能预先肯定它将取哪个值而不能预先肯定它将取哪个值.((2)由于试验结果的出现具有一定的概)由于试验结果的出现具有一定的概率,于是这种实值函数取每个值和每个确率,于是这种实值函数取每个值和每个确定范围内的值也有一定的概率定范围内的值也有一定的概率. 称这种定义在样本空间上的实值函数为称这种定义在样本空间上的实值函数为随随量量机机变变简记为简记为 r.v.(random variable) 而表示随机变量所取的值而表示随机变量所取的值时时,一般采用小写字母一般采用小写字母x,y,z等等.随机变量通常用大写字母随机变量通常用大写字母X,Y,Z或希腊字母或希腊字母ζ,η等表示等表示 例如,从某一学校随机选一例如,从某一学校随机选一学生,测量他的身高学生,测量他的身高. 我们可以把可能的我们可以把可能的身高看作随机变量身高看作随机变量X,然后我们可以提出关于然后我们可以提出关于X的各种问题的各种问题. 如如 P(X>1.7)=?? P(X≤1.5)=?P(1.5
用一个钉板作赌具 下面我们在计算机上模拟这个游戏:下面我们在计算机上模拟这个游戏:街头赌博街头赌博高尔顿钉板试验高尔顿钉板试验高高尔尔顿顿钉钉板板试试验验这条曲线就近似我们将要介绍这条曲线就近似我们将要介绍的的正态分布正态分布的密度曲线的密度曲线 (I)、、正态分布的定义正态分布的定义 若若r.v. X 的的概率密度为概率密度为记作记作 f (x)所确定的曲线叫作所确定的曲线叫作正态曲线正态曲线.其中其中 和和 都是常数,都是常数, 任意,任意, >0,,则称则称X服从参数为服从参数为 和和 的正态分布的正态分布. (Normal)(II)、、正态分布正态分布 的图形特点的图形特点 正态分布的密度曲线是一条关于正态分布的密度曲线是一条关于 对对称的钟形曲线称的钟形曲线. .特点是特点是““两头小,中间大,左右对称两头小,中间大,左右对称””. . 决定了图形的中心位置,决定了图形的中心位置, 决定了图形决定了图形中峰的陡峭程度中峰的陡峭程度. . 正态分布正态分布 的图形特点的图形特点故故f(x)以以μ为对称轴,并在为对称轴,并在x=μ处达到最大处达到最大值值: :令令x=μ+ +c, x=μ- -c (c>0), 分别代入分别代入f (x), 可得可得f (μ+ +c)=f (μ- -c)且且 f (μ+ +c) ≤f (μ), f (μ- -c)≤f (μ)这说明曲线这说明曲线 f(x)向左右伸展时,越来越向左右伸展时,越来越贴近贴近x轴。
即轴即f (x)以以x轴为渐近线轴为渐近线 当当x→ ∞∞时,时,f(x) → 0, ,用求导的方法可以证明,用求导的方法可以证明,为为f (x)的两个拐点的横坐标的两个拐点的横坐标x = μ σ这是高等数学的内容,如果忘记了,课下这是高等数学的内容,如果忘记了,课下再复习一下再复习一下实实例例 年年降降雨雨量量问问题题,,我我们们用用上上海海99年年年降雨量的数据画出了频率直方图年降雨量的数据画出了频率直方图从直方图,我们可以初步看出,年降从直方图,我们可以初步看出,年降雨量近似服从正态分布雨量近似服从正态分布下面是我们用某大学大学生的身高的下面是我们用某大学大学生的身高的数据画出的频率直方图数据画出的频率直方图红线红线是拟是拟合的正态合的正态密度曲线密度曲线可见,某大学大学生的身高应可见,某大学大学生的身高应服从正态分布服从正态分布人人的的身身高高高高低低不不等等,,但但中中等等身身材材的的占占大大多多数数,,特特高高和和特特矮矮的的只只是是少少数数,,而而且且较较高高和和较较矮矮的的人人数数大大致致相相近近,,这这从从一一个个方方面面反反映映了了服服从从正正态态分分布布的的随随机机变变量量的的特特点。
点 除了我们在前面遇到过的年降雨量和身除了我们在前面遇到过的年降雨量和身高外高外, ,在正常条件下各种产品的质量指标,在正常条件下各种产品的质量指标,如零件的尺寸;纤维的强度和张力;农作物如零件的尺寸;纤维的强度和张力;农作物的产量,小麦的穗长、株高;测量误差,射的产量,小麦的穗长、株高;测量误差,射击目标的水平或垂直偏差;信号噪声等等,击目标的水平或垂直偏差;信号噪声等等,都服从或近似服从正态分布都服从或近似服从正态分布. .(III) 、、设设X~ ,X的分布函数是的分布函数是( (IV)IV)、、标准正态分布标准正态分布的正态分布称为标准正态分布的正态分布称为标准正态分布. .其密度函数和分布函数常用其密度函数和分布函数常用 和和 表示:表示:它的依据是下面的定理:它的依据是下面的定理: 标准正态分布的重要性在于,标准正态分布的重要性在于,任何一个任何一个一般的正态分布都可以通过线性变换转化为一般的正态分布都可以通过线性变换转化为标准正态分布标准正态分布. . 根据定理根据定理1,1,只要将标准正态分布的分布只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概函数制成表,就可以解决一般正态分布的概率计算问题率计算问题. ., ,则则 ~N(0,1) 设设定理定理1 书末附有标准正态分布函数数值表,有了书末附有标准正态分布函数数值表,有了它,可以解决一般正态分布的概率计算查表它,可以解决一般正态分布的概率计算查表. .((V V)、)、正态分布表正态分布表表中给的是表中给的是x>0时时, Φ(x)的值的值.当当-x<0时时若若~N(0,1) 若若 X~~N(0,1),由标准正态分布的查表计算可以求得,由标准正态分布的查表计算可以求得,这说明,这说明,X的取值几乎全部集中在的取值几乎全部集中在[-[-3,3] ]区间区间内,超出这个范围的可能性仅占不到内,超出这个范围的可能性仅占不到0.3%. .当当X~~N(0,1)(0,1)时,时,P(|X| 1)=2 ( (1)-)-1= =0.6826 P(|X| 2)=2 ( (2)-)-1= =0.9544P(|X| 3)=2 ( (3)-)-1= =0.9974((VIVI)、)、3 3 准则准则将上述结论推广到一般的正态分布将上述结论推广到一般的正态分布, , 时,时,可以认为,可以认为,Y 的取值几乎全部集中在的取值几乎全部集中在区间内区间内. . 这在统计学上称作这在统计学上称作““3 3 准则准则”” (三倍标准差原则)(三倍标准差原则). . 例例1 ((1))假设某地区成年男性的身高(单假设某地区成年男性的身高(单位:位:cmcm))X~~N( (170,7.,7.692) ),,求该地区成年求该地区成年男性的身高超过男性的身高超过175175cmcm的概率。
的概率 解解: (1) : (1) 根据假设根据假设X~~N( (170,7.,7.692) ),,则则故事件{X>175}的概率为P {X>175}==0.2578解解: (2) : (2) 设车门高度为设车门高度为h cm, ,按设计要求按设计要求P(X≥ h)≤0.01或或 P(X< h)≥ 0.99,,下面我们来求满足上式的最小的下面我们来求满足上式的最小的 h. .((2 2)公共汽车车门的高度是按成年)公共汽车车门的高度是按成年男性与车门顶头碰头机会在男性与车门顶头碰头机会在0.01以下以下来设计的,问车门高度应如何确定来设计的,问车门高度应如何确定? ?因为因为X~~N( (170,7.,7.692),),故故 P(X< h)=0.99查表得查表得 ( (2.33)=)=0.9901>0.99所以所以 = =2.33, ,即即 h=170+17.92 188设计车门高度为设计车门高度为188厘米时,可使厘米时,可使男子与车门碰头男子与车门碰头机会不超过机会不超过0.01. .P(X< h ) 0.99求满足求满足的最小的的最小的h .若若 r.v. X的概率密度为:的概率密度为:则称则称X服从区间服从区间( a, b)上的均匀分布,记作:上的均匀分布,记作:X ~~ U[a, b]二、均匀分布二、均匀分布(Uniform)(注:(注:X ~~ U((a, b))))均匀分布常见于下列情形:均匀分布常见于下列情形: 如在数值计算中,由于四舍五如在数值计算中,由于四舍五 入,小数入,小数点后某一位小数引入的误差,例如对小数点点后某一位小数引入的误差,例如对小数点后第一位进行四舍五后第一位进行四舍五 入时,那么一般认为误入时,那么一般认为误差服从(差服从(-0.5, 0.5)上的均匀分布。
上的均匀分布若X ~~ U[a, b],,则则对于满足对于满足的c,d, 总有则称则称 X 服从参数为服从参数为 的指数分布的指数分布. 指数分布常用于可靠性统计研究指数分布常用于可靠性统计研究中,如元件的寿命中,如元件的寿命.三、三、指数分布:指数分布:若若 r.v X具有概率密度具有概率密度常简记为常简记为 X~E( ) . 这一讲,我们介绍了连续型随机变量、这一讲,我们介绍了连续型随机变量、概率密度函数及性质概率密度函数及性质 还介绍了正态分布,还介绍了正态分布,它的应用极为广它的应用极为广泛,在本课程中我们一直要和它打交道泛,在本课程中我们一直要和它打交道. 后面第五章中,我们还将介绍为什么后面第五章中,我们还将介绍为什么这么多随机现象都近似服从正态分布这么多随机现象都近似服从正态分布;还还要给出德莫佛极限定理的证明要给出德莫佛极限定理的证明. 另外我们简单介绍了均匀分布和指另外我们简单介绍了均匀分布和指数分布数分布一、问题的提出一、问题的提出 在实际中,人们常常对随机变量的函数在实际中,人们常常对随机变量的函数更感兴趣更感兴趣. 例如,已知圆轴截面直径例如,已知圆轴截面直径 d 的分的分布,布,求截面面积求截面面积 A= 的分布的分布. 第二章第四节 随机变量函数的分布又如:已知又如:已知t=t0 时刻噪声电压时刻噪声电压 V的分布,的分布,求功率求功率 W=V2/R (R为电阻)的分布等为电阻)的分布等. 一般地、设随机变量一般地、设随机变量X 的分布已知,的分布已知,Y=g (X) (设设g是连续函数),如何由是连续函数),如何由 X 的的分布求出分布求出 Y 的分布?的分布? 这个问题无论在实践中还是在理论这个问题无论在实践中还是在理论上都是重要的上都是重要的.二、离散型随机变量二、离散型随机变量函数的分布函数的分布解:解: 当当 X 取值取值 1,,2,,5 时,时, Y 取对应值取对应值 5,,7,,13,,例例1设设X求求 Y= 2X + 3 的概率函数的概率函数.~~而且而且X取某值与取某值与Y取其对应值是两个同时发生取其对应值是两个同时发生的事件的事件,两者具有相同的概率,两者具有相同的概率.故故如果如果g(xk)中有一些是相同的,把它们作适当中有一些是相同的,把它们作适当并项即可并项即可.一般,若一般,若X是离散型是离散型 r.v ,,X的概率函数为的概率函数为X ~~则则 Y=g(X)~~如:如: X ~~则则 Y=X2 的概率函数为:的概率函数为:Y ~~三、连续型随机变量函数的分布三、连续型随机变量函数的分布解:设解:设Y的分布函数为的分布函数为 FY(y),,例例2设设 X ~求求 Y=2X+8 的概率密度的概率密度.FY(y)=P{ Y y } = P (2X+8 y )=P{ X } = FX( )于是于是Y 的密度函数的密度函数故故注意到注意到 0 < x < 4 时,时, 即即 8 < y < 16 时,时, 此时此时Y=2X+8例例3设设 X 具有概率密度具有概率密度 ,求求Y=X2的概率密度的概率密度.求导可得求导可得当当 y>0 时时, 注意到注意到 Y=X2 0,,故当故当 y 0时,时,解:解: 设设Y和和X的分布函数分别为的分布函数分别为 和和 ,,若若则则 Y=X2 的概率密度为:的概率密度为: 从上述两例中可以看到,在求从上述两例中可以看到,在求P(Y≤y) 的过的过程中,关键的一步是设法程中,关键的一步是设法从从{ g(X) ≤ y }中解出中解出X,从而得到与从而得到与 {g(X) ≤ y }等价的等价的X的不等式的不等式 .例如,用例如,用 代替代替 {2X+8 ≤ y }{ X } 用用 代替代替{ X2 ≤ y } 这样做是为了利用已知的这样做是为了利用已知的 X的分布,从的分布,从而求出相应的概率而求出相应的概率.这是求这是求r.v的函数的分布的一种常用方法的函数的分布的一种常用方法.例例4 设随机变量设随机变量X的概率密度为的概率密度为求求Y=sinX的概率密度的概率密度.当当 y 0时时, 当当 y 1时时, 当当时时故故解:注意到解:注意到, =P(0 X arcsiny)+P( - arcsiny X )) 当当0
