
北邮概率论与数理统计离散型随机变量和分布律2.2.doc
11页§2.2 离散型随机变量及其分布律用随机变量描述随机现象,通过对随机变量的概率分布的研究达到对随机现象的统计规律性的全面把握.对于一个随机变量及任一个实数集,所有的事件的概率构成了的概率分布.显然这种方式描述概率分布是不方便的,为此我们需要寻找描述概率分布的数学工具.对于离散型随机变量,如果知道了它取各个可能值的概率,那么我们可求出任一事件的概率.因此离散型随机变量,其概率分布可通过它取各个可能值的概率来描述,这便是下面介绍的离散型随机变量的分布律.一般的随机变量的概率分布的描述及连续型随机变量的概率分布的描述将在后面两节中介绍.2.1.1 离散型随机变量的分布律定义 设是离散型随机变量,其所有可能的取值为,取各个可能值的概率为, <2.2.1>称<2.2.1>式为的分布律. 分布律常用如下的表格表示:…………由概率的定义,易得分布律具有如下基本性质:<1>非负性 ,.<2>规范性 .以上两条基本性质是分布律必须具有的性质,也是判断某个有限或无穷数列是否能成为分布律的充要条件.例1 掷两颗骰子,表示两颗骰子的点数之和,〔1求的分布律;〔2求点数之和至少为8的概率.解:<1>所有可能取的值为2,3,4,5,6,7,8,9,10,11,12,并且,,,,,,,,,,即得的分布律X23456789101112P<2> 例2 将2个球随机地放入3个盒子中,表示某指定的盒子中球的个数,求的分布律。
解:所有可能取的值为0,1,2,并且,,, 即得的分布律X012P2.2.2 常用的离散型分布下面介绍几种常用的离散型分布<一>.二项分布 在重伯努利试验中,设每次试验成功的概率为,如果记为重伯努利试验中成功的次数,则的分布律为,,其中.若记,则上面分布律改写为,,.容易验证.由于上述分布中每个概率正好是的二项展开式的一项,因此把这个分布称为二项分布.于是有下面定义.定义 若随机变量的分布律为,,其中,,则称服从参数为的二项分布,记为~. 二项分布是非常重要的离散型分布之一,这个分布的背景就是多重伯努利试验.对于具体的随机现象,若能归于多重伯努利试验模型,那么表示某种结果发生次数的随机变量就服从二项分布.比如将一骰子掷次,点数6出现的次数服从参数为的二项分布,即~.件产品中有件次品,从中有放回地抽检件,那么取出的次品件数服从参数为的二项分布,~.假设某种药的治愈率为,今有个病人服用该药,治愈人数服从二项分布. 连续发送个码字,误码率为,那么误码数服从二项分布. 二项分布中,各个概率随变化而变化,一般的规律是先随增大而增大,然后随增大而变小,有最大值.那么为何值时,这个概率最大?这个问题留给同学去解决。
在二项分布中一种最简单的二项分布便是二点分布.时的二项分布称为两点分布. 两点分布也叫做<0-1>分布, 其分布律为.或用表格表示为当一个试验只有两种可能结果时就可用二点分布来描述.比如,一粒种子是否发芽,一次射击是否命中目标,抽检的一件产品是否为合格品等等.二点分布是二项分布的特例,但反过来二项分布也可由个具有相同参数的二点分布的和得到.我们可通过二点分布和二项分布的经验背景得到此结论.考虑重伯努利试验模型.表示重伯努利试验成功的次数.表示试验第一次成功的次数,表示第二次试验成功的次数,…,表示第次试验成功的次数.那么,并且均服从参数为的二点分布,~.这里要注意的是,由于各次试验相互独立,因而随机变量也相互独立<随机变量的独立性概念将在下一章讨论>.准确地说是:服从参数为的二项分布的随机变量可表示为个独立同分布的二点分布的随机变量之和.例1 按规定,某种型号电子元件的使用寿命超过1500小时的为一级品.已知某一大批产品的一级品率为0.2,现从中随机地抽查20只.求20只元件中一级品只数的分布律.解:我们将检查一只元件是否为一级品看成是一次试验,检查20只元件相当于做20重伯努利试验.从而知~,即的分布律为.将计算结果列表如下为了对本题的结果有一个直观了解,我们作出上表的图形<见P35>.例2 设有80台同类型设备,各台工作是相互独立的,发生故障的概率都是0.01,且一台设备的故障能由一个人处理.考虑两种配备维修工人的方法,其一是由4人维护,每人负责20台.其二是由3人共同维护80台.试比较这两种方法在设备发生故障时不能及时维修的概率的大小.〔P36二.泊松分布 由微积分的知识可得从而,这样只要,便构成一个分布律,这种分布律称为泊松分布.定义 若随机变量的分布律为,,其中,则称服从参数为的泊松分布,记为~. 泊松分布是1837年由法国数学家泊松
罗瑟福〔Rutherford和盖克
在生物学、医学、保险业、排队论等领域中,泊松分布是一种常用的分布.例如,容器内的细菌数,铸件的疵点数,交通路口的事故数,呼叫次数等等.思考题:泊松分布中的各个概率随变化而变化的规律如何?何时取得最大值?<三>.超几何分布在上一章中,我们讨论了不放回抽样模型:设有件产品,其中有件不合格,从中不放回地取件,则其中不合格品件数的分布律为,,这种分布称为超几何分布,记为~. 若把"不放回地取件"改为"放回地取件",则服从二项分布.但当远小于时,两个分布差别不大.思考题:超几何分布中的各个概率随变化而变化的规律如何?何时取得最大值?<四>.几何分布、负二项分布考虑独立重复试验序列,若每次试验成功的概率为,一直进行到试验成功为止,所需的试验次数是一个随机变量,它的分布律为,这种分布称为几何分布,记为~容易验证.例如,连续掷一骰子,直至点数6为止,则所需的抛掷次数是一个随机变量,且~.几何分布具有一个特别的性质:无记忆性.设想连续进行试验,一直到第次试验都未成功,从此时算起为了等到试验成功所需的试验次数还是服从几何分布,参数还是原来的参数,与无关.这就是所谓的无记忆性.用数学的语言刻画几何分布的无记忆性就是:设~,则对任意正整数,有,或.上面等式的证明并不难,请同学们完成. 有趣的是,在取正整数值的离散分布中,只有几何分布具有无记忆性。
还是考虑独立重复试验序列,若每次试验成功的概率为,一直进行到试验成功次为止,所需的试验次数是一个随机变量,它的分布律为,,这种分布称为负二项分布或帕斯卡分布,记为~易见时的负二项分布就是几何分布.负二项式有泰勒展开式记,由上面展开式可得若令表示次成功之前失败的次数,那么,且的分布律为,可见的分布中各个概率正是负二项式<的展开式中的各项再乘.这也是负二项分布这个名称的由来.几何分布是负二项分布的特例,那么反过来呢?考虑独立重复试验序列模型.表示直至试验成功次为止所需的试验次数.表示试验第一次成功所需的试验次数,表示第一次试验成功后等待到第二次试验成功所需的试验次数,如此,表示第次试验成功后等待到第次试验成功所需的试验次数.那么均服从参数为的几何分布,且.又由几何分布的无记忆性可以知道相互独立,即参数为的负二项分布的随机变量可表示为个独立同分布的几何分布的随机变量之和.. .。












