数理统计总.doc
(一)P22:设总体X服从0-1分布,其概率函数为P(X=x)=Px(1-P)1-X,x=0,1 X1,X2Xn是来自总体X的样本,试写出样本(X1,X2Xn)的联合概率函数。解:(X1,X2Xn)的联合概率函数为 F(X1,X2Xn)= =,Xi=0,1 若求由样本X1.X2Xn构造的任何函数的概率分布时,原则上都可以通过对f(X1,X2Xn)的积分或求和来确定。(二)P30: 习题6:试证样本方差可以表示为。证明: (三)P31习题15设总体X的概率密度函数为是来自于总体X的样本,试求。解:(四)P391:刘圣2: 由定理知 且假设二者独立,故由F-分布的定义知3:证明若:则 其中证明:若则同时 且二者相互独立,所以由t分布的定义得=(五)P45设总体X的概率密度函数为f(x)=3x2,0x1,X1 X2 X5是来自总体X的样本。又设X(1)<X(2)<X(3)<X(4)<X(5)是样本的一组顺序统计量。试求X(3)的概率密度函数。解:X的分布函数为 由式(2-7),X(3)的概率密度函数为 =(六)P58,设总体均为未知参数,是来自总体X的样本。试求的极大似然估计量。解: X的概率密度函数为 所以的似然函数为 取对数得 令 所以,的极大似然估计量为 (七) P69设总体X的均值E(X)=与方差D(X)=2存在,X1X2,Xn是来自总体X的样本,则样本均值为的无偏估计,样本方差S2为2的无偏估计。是2的有偏估计,但它是2的渐进无偏估计。证明 因为,所以为的无偏估计。又,故=所以S2为2的无偏估计。而所以不是2的无偏估计,但,故是2的渐进无偏估计。(八)P79刘智振(九) P94 例3-28 从一批电视显像管中随机抽取6个测试其使用寿命(单位:kh):15.6,14.9,16.0,14.8,15.3,15.5,假设显像管使用寿命XN(,2),其中参数,2 均未知,试求(1) 寿命均值的置信水平为0.95的单侧置信下限;(2) 寿命方差2的置信水平为0.90的单侧置信上限。解 (1)选取样本的函数为 给定置信水平0.95,使 (a)从t-分布表查出分位数为t0.05(5)=2.02.式(a)等价于 (b)则的置信水平为0.95的置信下限为 (c)根据样本观测值得样本均值为=15.35,样本方差为s2=0.203,n=6,代入式(c)得的置信下限为的置信水平为0.95的单侧置信区间为(14.98,)。(2) 选取样本的函数为给定置信水平0.90,使 (d)从分布表查出分位数为。式(d)等价于 (e)则2的置信水平为0.90的置信上限为 (f)把s2=0.203代入式(f),得2的置信上限为2的置信水平为0.90的单侧置信区间为(0,0.63)。十(P100): 设总体服从伯努利分布B(1,p),其中参数未知,是来自总体简单随机样本,试求的的置信水平为.的置信区间。解:的极大似然估计量为样本的函数服从二项分布(,),但是分布依赖未知参数。由于充分大时,的渐进分布为正态分布,故选取样本的函数为当充分大时,的建近分布为标准正态分布(,),显然分布不依赖给定置信水平为,使解绝对不等式,得的近似置信区间为的置信区间为,其中用这种方法求的置信区间,计算过程比较麻烦,因此经常选取样本的函数为当的极限分布是标准正态分布。给定置信水平为,使则的近似置信水平为的置信区间为:十一: (P134) 某工厂用旋转式机器将胶水装入250ml的瓶内,且随机地将胶量分配到每个瓶内。假设每瓶数量服从正态分布,其中标准差,现在研制一种新机器比原来机器明显要快。从中抽取81瓶,计算样本标准差s=3.15.试问在显著水平下,用心机器投入生产,标准差是否显著减少?解 圆假设和备择假设设为 等价于: 当原假设为真时,检验统计量当时,n=80是大样本,所以80S2/16服从标准正态分布,其中给定显著性水平使从标准正正态分布表中查出临界值z0.99=-2.33作为临界值的近似值,得,则拒绝域为(0,50.53计算检验统计量的观测值,得因此拒绝原假设。可以认为研制的新机器投入生产,其每瓶装的胶量的标准差显著小于以往的标准差。十二:证明: 求的分布:分别是的无偏估计量由得:由得,即最小二乘估计量是的无偏估计量。同理:即最小二乘估计量是的无偏估计量由和得这表明是的无偏估计量,利用式则的方差为:由和则的方差为十三:例5.3基础计算如下:于是和的最小二乘估计量分别为则直线回归方程为(2) 样本观察值的拟合度也就是由直线回归方程计算的值,例如对应,得将25个计算值列入表5-3的第3列。(3) 残差,i=1,2,.,25,例如,。将25个残差列入表5-3的第4列。十四例5-4:对例5-3中的线性回归方程进行显著性检验。用F检验法。1. 检验假设H0: 1=0,H110。2. 当H0为真时,选取检验统计量为 3. 给定显著性水平=0.05,使P(FF0.05(1,23)=0.05 查F分布表。得临界值为F0.05(1,23)=4,28,则拒绝域为4.28,+)。4. 计算F的观察值 ,则5. 做推断 由于F=54.53落在拒绝域中,所以拒绝原假设,可以认为回归直线与样本观察值得拟合很好,即线性回归方程有效。用样本相关系数检验法。给定显著性水平=0.05,使.查R分布表。得临界值为r0.05(23)=0.404.计算R的观察值。得由于>0.404,所以拒绝原假设。与F检验法的结果一致。若检验统计量选取样本测定系数,则R12=0.7034,在总离差平方和中有70.34%可以通过自变量x来解释,即y与x之间存在线性相关关系。随堂重点习题:P.1371. 原假设和备择假设为当原假设为真时,检验统计量为且t服从自由度为10+9-2=17的t分布给定显著性水平=0.05,临界值为则拒绝域为,的数值为把代入检验统计量得:由于,所以不拒绝原假设,可以认为AB两种方案装配时间差异不显著。证明:证:令 其中