
概率学讲义.doc
123页第一章 事件及其概率 §1 随机现象与统计规律性 一、随机现象 在自然界和人类社会中存在着两类现象. 第一类,在一定条件下某种现象必定发生或必定不会发生,这类现象称为确定性现象. 例如:自由落体在经过t秒钟后,落下的距离s必定是;在标准大气压下,水到60沸腾.第一种是必然会发生的,称为必然事件,记作Ω. 第二种是必然不会发生的,称为不可能事件,记作φ. 另一类,在一定条件下,某种现象可能发生也可能不发生,称这类现象为随机现象. 例如:杭州明年正月初一下雪;播种1000颗种子,有850颗发芽;发射一枚炮弹,弹着点与目标之间的距离为15米. 对随机现象,在基本相同的条件下,重复进行试验或观察,可能出现各种不同的结果;试验共有哪些结果事前是知道的,但每次试验出现哪一种结果却是无法预见的,这种试验称为随机试验(random experiment). 每次试验不能预测其结果,这反映随机试验结果的出现具有偶然性;但如果进行大量重复试验,所出现结果又具有某种规律性——统计规律性. 例如各次发射炮弹,弹着点与目标之间的距离可能各不相同,但如果射手技术较好,多次发射中距离近的必定是多数. 概率论就是研究大量随机现象的统计规律性的数学分支. 由于随机现象的广泛性,决定了这门学科的重要性. 即使在一定条件下某类现象可以视为确定性的,但在作更为深入的考察时,又应看作是随机的了. 例如对上面提到的自由落体运动,当我们考虑空气阻力、空气流动等因素时,物体下落的距离就不一定恰好是了. 随机试验的某一可能结果称为随机事件(random event),简称事件. 一次试验中,某事件A可能发生,也可能不发生,发生的可能性有大有小. 这一可能性大小的数量指标就是我们所要研究的事件的概率. 二、概率的统计定义 在相同条件下重复作N次试验,各次试验互不影响. 考察事件A出现的次数(频数) n,称 为A在N次试验中出现的频率(frequency). 频率一般与试验次数N有关;并且在N固定时, 作若干组N次试验,各组频率一般也不相同. 但当N很大时,频率却呈现某种稳定性,即在某常数附近摆动;且当N无限增大时,一般说来,频率会“趋向”这个常数. 这种规律称为随机现象的统计规律. 很自然,把频率所稳定到的那个常数表示事件A在一次试验中发生的可能性的大小,称作概率(probability), 记为P(A). 概率的这种定义称为统计定义. 实验者 掷硬币次数 出现正面 次数 频 率 蒲 丰 皮尔逊 皮尔逊 4040 12000 24000 2048 6019 12012 0.5069 0.5016 0.5005 例1 掷一枚硬币,可能出现正面,也可能出现反面. 记A={出现正面},当硬币均匀时,在大量试验中出现正面的频率应接近50%. 历史上有不少数学家作过试验,结果如右表. 自然地,我们认为对均匀硬币来说,P(A)=1/2. 例2 英文字母使用频率的研究,对于信息的编码、密码的破译等是十分有用的. 大量统计表明,字母E的使用频率最高,约为0.105;其次为字母T、O;字母J、Q与Z的使用频率最低,仅为0.001. 据此可以认为,在英语中,字母E出现的概率最高,约为0.105. 日常生活与生产实践中,诸如一批种子的“发芽率”,某人射击的“命中率”,某产品的“次品率”等等,都是用频率来近似概率的例子. 这里我们并没有给出“频率稳定性”的确切含义. 在第四章里,通过对概率论中著名的“大数定律”的讨论我们将会对上述含义有较深入的理解. 虽然我们并不能由概率的统计定义确切地定出一个事件的概率,但是它提供了一种估计概率的方法. 频率与概率的关系就像物体长度的测量值与该长度之间的关系:物体的长度是客观存在的,是该物体的固有属性,测量值是它的某种程度的近似值. 同样,随机事件发生的可能性的大小——概率是随机事件的客观属性,多次随机试验所得的频率则是它的某种程度的近似. 必须注意,应用概率的统计定义时,各次试验是在基本相同的条件下独立进行的,而且次数要足够的多. 从频率的统计定义立即可以看出,频率具有下述三个性质: 1. 非负性:; 2. 规范性:对必然事件Ω,=1; 3. 可加性:若A与B是两个不会同时发生的事件,以A+B表示A或 B至少出现其一这个事件,则=+. 性质3可以推广到任意有限个事件. §2 古典概型 一、样本空间和样本点 投掷一颗骰子,虽无法预卜其结果如何,但总不外乎是“出现1点”,…,“出现6点”这6个基本的可能结果之一. 不妨把这些试验结果的全体记为{1,2,…,6}. 随机试验的每一基本结果称为样本点(sample point),常记作ω. 样本点的全体称为样本空间(sample space),常记作Ω. 上述例子中,若记=“出现i点”,那么. 样本点和样本空间是概率论中的两个基本概念. 随着对所讨论问题的兴趣不同,同一随机试验可以有不同的样本空间. 讨论问题前必须先取定样本空间. 例1 口袋中装有10个球:三个红球三个白球和四个黑球. 任取一球. 样本空间可以取为={取得一个红球,取得一个白球,取得一个黑球}. 但若把球编号,红球编为1—3号,白球和黑球分别为4—6和7—10号;则每取一球,必定是且只能是这些球号中的一个,故也可取样本空间为,其中=取得第i号球, i=1,2,…,10. 例2 在例1中,如果每次共取两个球, 则每个样本点可以用所取得的两个球号(i, j) 来表示,样本空间可以是 Ω={(1,2), (1,3), …,(1,10), (2,3), …,(2,10), …,(9,10)}, 共有=45个样本点; 这是二维的样本空间. 例1和例2都是有限样本空间. 例3 考察单位时间内落在地球上某一区域的宇宙射线数,这可能是0, 也可能是1, 是2, …,很难确定一个上界. 于是可以取样本空间为Ω={0, 1, 2,…}, 它包含无限多个样本点,但可按一定的顺序排列起来(称为无限可列个). 例4 考察发射一枚炮弹时,落地点与目标之间的距离. 这可能是0到某常数之间的任一实数,可取样本空间为Ω= [0, a], 它是一维连续区间. 在实际问题中,如何取一个合适的样本空间是一个值得研究的问题. 样本空间取得好,解题就方便得多. 在一般问题中,则往往认为样本空间已经给定,在此基础上展开讨论. 二、古典概型 (一) 模型及定义 古典概型是最简单的随机试验模型,也是很多概率计算的基础,而且有不少实际应用. 古典概型有两个特征: 1. 样本空间是有限的, ,其中, i=1, 2, …,n, 是基本事件. 2. 各基本事件的出现是等可能的,即它们发生的概率相同. 很多实际问题符合或近似符合这两个条件,可以作为古典概型来看待. 在“等可能性”概念的基础上,很自然地引进如下的古典概率(classical probability)定义. 定义1 设一试验有n个等可能的基本事件,而事件A恰包含其中的m个基本事件,则事件A的概率P(A)定义为 P(A)= (1) 根据这个定义,对上段的例1,如果从袋中取出一球是随机的,那么,“得红球”这一事件发生的概率就是3 /10. 在判断所讨论的问题是否属古典概型时. 条件1是容易检验的,条件2有时就难一些. 实际问题中,抛掷均匀硬币,对外形相同的产品质量抽查都属这一类. 当判断确认属于古典概型时,就可用公式(1)来计算概率. 这时常常要用到排列、组合数的计算,我们将有关的基本公式列于本章末尾的补充与注记里. (二)古典概率直接计算的例子 例5 掷两枚均匀硬币,求出现两个正面的概率. 取样本空间:{甲正乙正,甲正乙反,甲反乙正,甲反乙反}. 这里四个基本事件是等可能发生的,故属古典概型. n=4, m=1, P=1/ 4. 例6 有n个球, N个格子(n≤N),球与格子都是可以区分的. 每个球落在各格子内的概率相同(设格子足够大,可以容纳任意多个球). 求:(1) 指定的n格各有一球的概率;(2) 有n格各有一球的概率. 把球编号为1—n, n个球的每一种放法是一个样本点,这属于古典概型. 由于一个格子可落入任意多个球,样本点总数应该是N个中取n个的重复排列数. (1) 记A={指定的n格各有一球},它包含的样本点数是指定的n格中n个球的全排列数n!,故 P(A)=n! /. (2) 记B={有n格各有一球},它所包含的样本点数是N格中任取n格的选排列数,故 P(B)=/=N! /(N-n)! 例7 口袋中a只白球,b只黑球. 随机地一只一只摸,摸后不放回. 求第k次摸时得白球的概率. 解法1 把球编号,按摸的次序把球排成一列,直到(a+b)个球都摸完,每一列作为一个样本点,样本点总数就是a +b个球的全排列数 (a +b)! . 所考察的事件相当于在第k 位放白球,共有a种放法,每种放法又对应其它a+b-1个球的(a+b-1)! 种放法, 故该事件包含的样本点数为a(a+b-1)!,所求概率为 P= a (a+b-1)! / (a+b)! = a / (a+b). 解法2 各球不编号,即所有白球都看成相同,所有黑球也看成相同. a+b个球仍按摸球的次序排列,但a个同样位置放白球,不论白球间如何交换,只算一种放法,即只作为一个样本点. 这也是古典概型,样本点总数应为. 所考察的事件为在第k位放白球,其它各位放a-1个白球,共种放法,故 P=/=a / (a+b). 本题两种解法区别在于样本空间不同. 第一种解法把所有球都看成不同的,考虑样本点的总数与所述事件包含的样本点数时都必须计及球的次序,所以都用排列;第二种解法中同色球不加区别,故只须考虑哪几个位置放白球,分子分母都用组合.但这两类解法都是古典概型,都可用(1)式计算概率,只是计算前要取定样本空间,分子分母在同一样本空间内计算. 本题的结果与k无关,即不论第几次,摸得白球的概率都一样,都是白球所占的比例数.这相当于抽签,不论先抽后抽,中签的机会都一样. 例8 a件次品,b件正品,外形相同. 从中任取n件(n≤a),求={恰好有k件次品}的概率. 解 类似例7,可以把a件次品看成不同,也可看成相同,后者解法较为简单. 此时把a+b件产品取n件的任一个组合作为一个样本点,总数为; 事件包含的样本点数为,故 P()=/. (2) 本例是产品抽样检查时常用的概率模型. 例9 某人在口袋里放着两盒牙签,每盒n根. 使用时随机取一盒, 并在其中随机取一根.到某次他发现取出的一盒已经用完.问:此时另一盒中恰好有m根牙签的概率是多少? 解法1 我们来考察前(2n+1-m)次抽用的情况.每次抽用时有两种方法(抽出甲盒或乙盒), 故总的不同抽法有种. 所述事件包含的抽法种数可计算如下:先看“最后一次(即第2n+1-m次)是抽出甲盒”的情况.这时在前2n-m次抽用中,必须有n次抽到甲盒,这种抽法有种;类似地,“最后一次是抽出乙盒”的抽法也有这么多.所以,所述事件包含的抽法种数为2,从而事件的概率为 2/=/. 解法2 因每盒中只有n根,最晚到第2n+1次抽取时必发现抽出的盒子已空. 故不管结果如何,总把试验做到抽完第2n+1次为止,不同的抽法有种. 再计算所述事件包含的抽法总数.仍先考虑“先发现甲盒为空”的情况.实际上是在抽第(n + r)次时 (r=0,1,…,n-m) 抽出甲盒,这时甲盒已被抽n次;前(n+r-1)次抽取时,乙盒被抽出r次,(不同的抽法有种);紧接着的第(n-m-r)次全抽出乙盒;第(2n-m+1)次抽时抽得甲盒,发现它已空,但仍把它放回口袋,后面m次仍从两盒中随机取一盒(有种取法).因此对固定的r,抽法有种,“先发现甲盒为空”的抽法共有种. 对于乙盒也同样讨论,因此所述事件概率为 2/=/. 不难证明两种不同解法的结果相同,从而得出等式 = 或 =. 两种解法对照,第二种解法虽然具体,但繁复.前一解法注意到:所使所设事件发生,抽取必然是2n+1-m次. 从而推倒出简洁的结果. 三、几何概率 古典概型要求样本点总数为有限.若是有无限个样本点,特别是连续无限的情况,虽。












