
R语言Lecture2概率论复习及R相关应用.ppt
115页概率论复习及R相关,引言,在我们所生活的世界上, 充满了不确定性,扔硬币、掷骰子和玩扑克等简单游戏,将不确定性数量化,20世纪初叶才开始的.,世间万物的繁衍生息;大自然的千变万化……, 面临着不确定性和随机性.,已经给人类活动的一切领域带来了一场革命.,随机现象是不是没有规律可言?,多次重复抛一枚硬币,正面朝上的次数大致一半;,测量一物体的长度,由于仪器及观察受到的环境的影响,每次测量的结果可能是有差异的. 但多次测量结果的平均值随着测量次数的增加逐渐稳定于一常数.,在一定条件下对随机现象进行大量观测会发现某种规律性.,数理统计 研究怎样有效地收集、整理和分析带有随机性质的数据,以对所观测的问题作出推断和预测,概率论 研究随机现象的统计规律性 概率论的起源 赌博 概率论的发展 测度,概率论与数理统计的应用和渗透,本学科的应用,几乎遍及所有科学技术领域、 工农业生产和国民经济的各个部门中.,1. 气象、水文、地震预报、人口控制及预测,产品的抽样验收,新研制的药品能否应用,3. 寻求最佳生产方案,购物排队、红绿灯转换等,都可用一类概率,模型来描述,其涉及到 的知识就是 排队论.,目前,概率统计理论 进入其他自然科学领,域的趋势还在不断发展. 在社会科学领域 ,特,别是经济学中研究最优决策和经济的稳定增长,等问题,都大量采用 概率统计方法. 正如法国,数学家 拉普拉斯所说 : “ 生活中最重要的问题,,其中绝大多数在实质上只是概率的问题.”,机器维修、病人候诊、存货控制、水库调度、,第一章 随机事件与概率,§1.1 样本空间与随机事件,一 .随机试验: 对随机现象进行一次观察和实验,统称为随机试验。
随机实验简称为实验,用E表示,实验E的所有可能结果构成的集合,称为E的样本空间,用S表示,定义,满足某些条件的可能结果所组成的集合,称为随机事件随机事件用大写字母A,B,C表示.,在一次试验中,事件A发生的含义是,当且仅当A中一个样本点(或基本事件)发生(或出现)事件A发生也称为事件A出现,事件的发生,2. 随机事件,其中T1,T2分别是该地区的最低与最高温度,观察某地区每天的最高温度与最低温度,观察总机每天9:00~10:00接到的次数,投一枚硬币3次,观察正面出现的次数,例 给出一组随机试验及相应的样本空间,一. 古典概率,§1-2 事件的概率(Probability),1.古典概型,定义1 若随机试验满足下述两个条件: (1) 它的样本空间只有有限多个样本点; (2) 每个样本点出现的可能性相同.,称这种试验为有穷等可能随机试验 或古典概型.,,这样就把求概率问题转化为计数问题 .,定义2 设试验E是古典概型, 其样本空间S由n个样本点组成 , 事件A由k个样本点组成 . 则定义事件A的概率为:,称此概率为古典概率. 这种确定概率的方法 称为古典方法 .,排列组合是计算古典概率的重要工具 .,二. 几何概率,,1.定义,向任一可度量区域G内投一点,如果所投的点落在G中任意可度量区域g内的可能性与g的度量成正比,而与g的位置和形状无关,则称这个随机试验为几何型随机试验。
或简称为几何概型2. 概率计算,1. P(A)=[A的度量]/[S的度量],两人约定于12点到1点到某地会面,先到者等20分钟后离去,试求两人能会面的概率?,例1:,解:设x,y分别为甲、乙到达时刻(分钟),令A={两人能会面}={(x,y)||x-y|≤20,x≤60,y≤60},P(A)=A的面积/S的面积=(602-402)/602=5/9,三.概率的频率定义,例2:从同一型号同一批次的反坦克弹中任抽一发反坦克弹射击目标,观测命中情况设A代表“命中”这一事件,求P(A)?,1 事件的频率 在一组不变的条件下,重复作n次试验,记m是n次试验中事件A发生的次数 频率 f=m/n,2.频率的稳定性,掷一枚均匀硬币,记录前400次掷硬币试验中频率P*的波动情况 (正面出现频率的趋势,横轴为对数尺度),3.概率的频率定义,在一组不变的条件下,重复作n次试验,记m是n次试验中事件A发生的次数当试验次数n很大时,如果频率m/n稳定地在某数值p附近摆动,而且一般地说,随着试验次数的增加,这种摆动的幅度越来越小,称数值p为事件A在这一组不变的条件下发生的概率,记作P(A)=p.,意义:,(1) 提供了估计概率的方法; (2)提供了一种检验理论正确与否的准则.,设试验的基本事件总数为n,事件A所包含的基本事件总数为m,事件AB所包含的基本事件总数为k。
§1.3 条件概率,利用条件概率求积事件的概率即乘法公式,推广,乘法公式,某厂生产的灯泡能用1000小时的概率 为0.8, 能用1500小时的概率为0.4 , 求已用 1000小时的灯泡能用到1500小时的概率,解 令 A 灯泡能用到1000小时 B 灯泡能用到1500小时,所求概率为,,三.全概率公式,定义,若事件组B1,…Bn,满足:,(1),B1,…Bn互不相容且P(Bi)0,i=1,…,n,(2),,事件B1,…Bn,为样本空间的一个划分 则对任何事件A,均有,,上式称为全概率公式,则称事件B1,…Bn,为样本空间的一个划分,定理,,,Bayes公式,全概率公式,§1.4 事件的独立性,例 已知袋中有5只红球, 3只白球.从袋中 有放回地取球两次,,设第 i 次取得白球为,求,事件 Ai ( i =1, 2 ) .,解,,一.事件的独立性,事件 A1 发生与否对 A2 发生的概率没有影响,,定义,设 A , B 为两事件,若,则称事件 A 与事件 B 相互独立,可视为事件A1与A2相互独立,四对事件,任何一对相互独立,则其它三对也相互独立,试证其一,事实上,第一章复习要点,随机试验 样本空间 随机事件 基本事件 频率 概率 古典概型 A的对立事件及其概率 互不相容事件的和事件的概率 加法公式 条件概率 概率的乘法公式 全概率公式 贝叶斯公式 事件的独立性 n重贝努利试验,随机变量,第二章 复习提纲,第二章 随机变量及其分布,为了更好的揭示随机现象的规律性并利用 数学工具描述其规律,引入随机变量来描述随 机试验的不同结果,例 总机某段时间内接到的次数,可用 一个变量 X 来描述,例 抛掷一枚硬币可能出现的两个结果,也可以 用一个变量来描述,有了随机变量,随机试验中的各种事件,就可以通过随机变量的关系式表达出来.,二、引入随机变量的意义,如:单位时间内某交换台收到的呼叫次数用X表示,它是一个随机变量.,事件{收到不少于1次呼叫} { X 1},{没有收到呼叫} {X= 0},§2.1 随机变量的概念,定义 设E是一随机试验,S 是它的样本空间,,则称 S 上的单值实值函数 X ( )为随机变量,随机变量一般用 X, Y , Z ,或小写希腊字母 , , 表示,若,如,若用X 表示总机在9:00~10:00接到 的次数,,或,—— 表示“某天9:00 ~ 10:00 接到的 次数超过100次”这一事件,则,例如,要研究某地区儿童的发育情况,往往 需要多个指标,例如,身高、体重、头围等,S = {儿童的发育情况 },X ( ) — 身高,Y ( ) — 体重,Z ( ) — 头围,各随机变量之间可能有一定的关系,也可能 没有关系—— 即 相互独立,随机变量的分类,离散型随机变量,非离散型随机变量,,— 其中一种重要的类型为 连续性随机变量,定义了一个 x 的实值函数,称为随机变量 X 的分布函数,记为F ( x ) ,即,§2.2 离散型随机变量及其概率分布,定义 若随机变量 X 的可能取值是有限多个或 无穷可列多个,则称 X 为离散型随机变量,描述离散型随机变量的概率特性常用它的概率 分布或分布律,即,概率分布的性质,F( x) 是分段阶梯函数,在 X 的可能取值 xk 处发生间断,间断点为第一类跳跃间断点, 在间断点处有跃度 pk,(1) 0 – 1 分布,注 其分布律可写成,常用0 – 1分布描述,如产品是否格、人口性别统,计、系统是否正常、电力消耗是否超负荷等等.,(2) 二项分布,背景:n 重Bernoulli 试验中,每次试验感兴趣 的事件A 在 n 次试验中发生的次数 —— X 是 一离散型随机变量,若P ( A ) = p , 则,称 X 服从参数为n, p 的二项分布,记作,0 – 1 分布是 n = 1 的二项分布,二项分布的取值情况,设,由图表可见 , 当 时,,分布取得最大值,此时的 称为最可能成功次数,R软件中的统计计算 一、统计分布,每一种分布有四个函数: d―density(密度函数),p―分布函数, q―分位数函数,r―随机数函数。
比如,正态分布dnorm,pnorm,qnorm,rnorm,下列各分布前面加前缀d、p、q或r就构成函数名: norm:正态, t:t分布, f:F分布,chisq:卡方(包括非中心) unif:均匀, binom:二项分布,,统计计算 一、统计分布,下列各分布前面加前缀d、p、q或r就构成函数名: exp:指数, weibull:威布尔, gamma:伽玛, beta:贝塔 lnorm:对数正态, logis:逻辑分布, cauchy:柯西, binom:二项分布, geom:几何分布, hyper:超几何, nbinom:负二项, pois:泊松 signrank:符号秩, wilcox:秩和, tukey:学生化极差,Binomial package:stats R Documentation The Binomial Distribution Description: Density, distribution function, quantile function and random generation for the binomial distribution with parameters 'size' and 'prob'.,查询的函数dbinom、 pbinom、 qbinom、 rbinom帮助信息,并用帮助文件中的案例进一步学习.,Usage: dbinom(x, size, prob, log = FALSE) pbinom(q, size, prob, lower.tail = TRUE, log.p = FALSE) qbinom(p, size, prob, lower.tail = TRUE, log.p = FALSE) rbinom(n, size, prob) Arguments: x, q: vector of quantiles. p: vector of probabilities. n: number of observations. If 'length(n) 1', the length is taken to be the number required. size: number of trials. prob: probability of success on each trial. log, log.p: logical; if TRUE, probabilities p are given as log(p). lower.tail: logical; if TRUE (default), probabilities are P[X x].,Details: The binomial distribution with 'size' = n and 'prob' = p has density p(x) = choose(n,x) p^x (1-p)^(n-x) for x = 0,。












