
置信区间(详细定义及计算)课件.ppt
36页第七章置信区间的概念置信区间的概念一、置信区间的概念一、置信区间的概念 二二 、数学期望的置信区间、数学期望的置信区间 三三 、方差的置信区间、方差的置信区间 1这种形式的估计称为区间估计区间估计. .前面,我们讨论了参数点估计. 它是用样本算得的一个值去估计未知参数.但是点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误差范围,使用起来把握不大.范围通常用区间的形式给出的较高的可靠程度相信它包含真参数值.也就是说,我们希望确定一个区间, 使我们能以比 这里所说的“可靠程度”是用概率来度量的,称为置信概率,置信度或置信水平. 习惯上把置信水平置信水平记作 ,这里 是一个很小的正数,称为显著水平显著水平2若由总体X的样本 X1,X2,…Xn 确定的则称 为随机区间两个统计量随机区间与常数区间不同, 其长度与在数轴上的位置与样本有关当一旦获得样本值那么,都是常数为常数区间3若满足设 是总体X的 一个未知参数,的置信区间置信区间.(双侧置信区间). 的置信水平(置信度)为分别称为置信下限和置信上限为显著水平.为置信度,则称区间 是若存在随机区间对于给定的4置信水平的大小是根据实际需要选定的.根据一个实际样本,,使一个尽可能小的区间 由于正态随机变量广泛存在,指标服从正态分布,特别是很多产品的我们重点研究一个正态总体情形由给定的置信水平,我们求出即取置信水平 或 0.95,0.9 等.例如,通常可取显著水平 等.数学期望 和方差 的区间估计。
5设为总体的样本,分别是样本均值和样本方差对于任意给定的α,我们的任务是通过样本寻找一它以1-α的概率包含总体X的数学期望μ个区间,6设则随机变量1 1、已知、已知σσ2 2时,时,μμ的置信区间的置信区间令7这就是说随机区间它以1-α的概率包含总体 X的数学期望μ由定义可知,此区间即为μ的置信区间置信区间8置信区间也可简记为它以1-α的概率包含总体X的数学期望μ由定义可知,此区间即为μ的置信区间置信区间其置信度为 1-α置信下限置信上限9查表得若由一个样本值算得样本均值的观察值则得到一个区间我们称其为置信度为0.95的μ的置信区间 其含义是:若反复抽样多次,每个样本值(n =16) 按公式即确定一个区间10确定一个区间在这么多的区间内包含μ的占0.95,不包含μ的占0.05本题中属于那些包含μ的区间的可信程度为0.95. 或“该区间包含μ”这一事实的可信程度注: μ的置信水平1-α的置信区间不唯一为0.95.11当 n 充分大时, 无论X服从什么分布,都近似有μ的置信区间是总体的前提下提出的均可看作EX的置信区间12 设总体X ~ N(μ,0.09), 有一组样本值: 12.6,13.4,12.8,13.2, 求参数μ的置信度为0.95的置信区间.解解μ的置信区间为 代入样本值算得 , [12.706,13.294].得到μ的一个区间估计为注:该区间不一定包含注:该区间不一定包含μ.μ.有 1-α= 0.95,σ0= 0.3,n = 4,13可以取标准正态分布上α分位点-z0.04 和 z0.01 ,则又有则μ的置信度为0.95的置信区间为与上一个置信区间比较,同样是其区间长度不一样,上例比此例短。
14第一个区间为优(单峰对称的) 可见,像 N(0,1)分布那样概率密度的图形是单峰且对称的情况 当n固定时以的区间长度为最短,我们一般选择它若以L为区间长度,则可见L随 n 的增大而减少(α 给定时),有时我们嫌置信度0.95偏低或偏高, 也可采用0.99或0.9. 对于 1- α不同的值, 可以得到不同的置信区间15估计在区间 内.这里有两个要求:只依赖于样本的界限(构造统计量)可见,对参数 作区间估计, 就是要设法找出两个一旦有了样本,就把2. 估计的精度要尽可能的高.如要求区间长度尽可能短,或能体现该要求的其它准则.1. 要求 很大的可能被包含在区间 内,就是说,概率即要求估计尽量可靠. 要尽可能大.可靠度与精度是一对矛盾,条件下尽可能提高精度.一般是在保证可靠度的16已知某种油漆的干燥时间X(单位:小时)服从正态分布其中μ未知,现在抽取25个样品做试验,得数据后计算得取求μ的置信区间解解所求为17中随机地抽查了9人,其高度分别为:已知幼儿身高现从5~6岁的幼儿115, 120, 131, 115, 109, 115, 115, 105, 110cm;18当总体X的方差未知时,容易想到用样本方差Ѕ 2代替σσ2 2。
已知已知则对给定的α,令查t 分布表,可得的值则μ的置信度为1- α的置信区间为1940名旅游者解解本题是在σσ2 2未知的条件下求正态总体参数μ的置信区间选取统计量为由公式知μ的置信区间为查表则所求μ的置信区间为为了调查某地旅游者的消费额为X,随机访问了得平均消费额为元,样本方差设求该地旅游者的平均消费额μ的置信区间若σσ2 2==2525μ的置信区间为即20用某仪器间接测量温度,重复测量5次得求温度真值的置信度为 0.99 的置信区间解解设μ为温度的真值,X表示测量值,通常是一个正态随机变量 问题是在未知方差的条件下求μ的置信区间 由公式查表则所求μ的置信区间为21解解本题是在σσ2 2未知的条件下求正态总体参数μ的置信区间 由公式知μ的置信区间为查表则所求μ的置信区间为为了估计一批钢索所能承受的平均张力(单位kg/cm2),设钢索所能承受的张力X,分别估计这批钢索所能承受的平均张力的范围与所能承受的平均张力随机选取了9个样本作试验,即则钢索所能承受的平均张力为 6650.9 kg/cm2由试验所得数据得22下面我们将根据样本找出σσ2 2 的置信区间,这在研究生产的稳定性与精度问题是需要的。
已知总体我们利用样本方差对σσ2 2进行估计,由于不知道S2与σσ2 2差多少?容易看出把看成随机变量,又能找到它的概率分布,则问题可以迎刃而解了的概率分布是难以计算的,而对于给定的23则得到σσ2 2随机区间随机区间以 的概率包含未知方差σσ2 2,,这就是σσ2 2的置信度为1-α的置信区间置信区间24某自动车床加工零件,抽查16个测得长度(毫米)怎样估计该车床加工零件长度的方差解解 先求σσ2 2的估计值或查表25所求标准差标准差σσ的置信度为0.95的 置信区间由得得得得26为了估计灯泡使用时数(小时)的均值μ和解解查表测试了10个灯泡得方差σσ2 2,,若已知灯泡的使用时数为X,求μ和σσ2 2的置信区间由公式知μ的置信区间为μ的置信区间为查表即由公式知σσ2 2的置信区间为σσ2 2的置信区间为27电动机由于连续工作时间(小时)过长会烧坏,解解查表烧坏前连续工作的时间X,得求μ和σσ2 2的置信区间今随机地从某种型号的电动机中抽取9台, 测试了它们在设由公式知μ的置信区间为即所求σσ2 2的置信度为0.95的 置信区间得得28一般是从确定误差限误差限入手.使得称 为 与 之间的误差限 . ,可以找到一个正数 ,只要知道 的概率分布,确定误差限并不难. 我们选取未知参数的某个估计量,根据置信水平由不等式可以解出 :这个不等式就是我们所求的置信区间.29被估被估参数参数条件条件统计量统计量置信区间置信区间μ已知已知σ2μ未知未知σ2σ2未知未知μ30P294 4 5 6 8 10 1231例例4 假定初生婴儿的体重服从正态分布,随机抽取12 名婴儿,测得体重为:(单位:克) 3100, 2520, 3000, 3000, 3600, 3160, 3560, 3320, 2880, 2600, 3400, 2540 试以 95% 的置信度估计初生婴儿的平均体重以及方差.解解 设初生婴儿体重为X 克,则 X~N( , 2 ),(1) 需估计 ,而未知 2.32作为统计量. 有有 = ,,n= ,,t0.025(11)= ,,即的置信区间。
1) 需估计 ,而未知 2.33(2) 需估计2 ,而未知 ,有 20.025(11)= ,20.975(11)= ,34解解由置信区间的概念,所求μ的0.99的 置信区间为在交通工程中需要测定车速(单位 km/h),由以往2、现在作了150次观测,试问平均测量值的误差在 的经验知道,即测量值为X,测量值的误差在 之间1、至少作多少次观测,才能以0.99的可靠性保证平均之间的概率有多大?由题意要求用平均测量值 来估计μ其误差由题意知35才能以0. 99的可靠性保持平均测量误差在之间即则钢索所能承受的平均张力为 6650.9 kg/cm2令36。
