
统计学(第三版课后习题答案(20220107020408).pdf
16页Hah和网速是无形的1:各章练习题答案2.1 (1)属于顺序数据2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率 % A1414B2121C3232D1818E1515合计100100(3)条形图(略)2.2 (1)频数分布表如下:40 个企业按产品销售收入分组表按销售收入分组(万元)企业数(个)频率( %)向上累积向下累积企业数频率企业数频率100 以下100 110 110 120 120 130 130 140 140 以上5 9 12 7 4 3 12.5 22.5 30.0 17.5 10.0 7.5 5 14 26 33 37 40 12.5 35.0 65.0 82.5 92.5 100.0 40 35 26 14 7 3 100.0 87.5 65.0 35.0 17.5 7.5 合计40 100.0 (2)某管理局下属40 个企分组表按销售收入分组(万元)企业数(个)频率( %)先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40 100.0 2.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率( %)25 30 30 35 35 40 40 45 45 50 4 6 15 9 6 10.0 15.0 37.5 22.5 15.0 合计40 100.0 直方图(略)。
2.4 ( 1)排序略2)频数分布表如下:100 只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率( %)650660 2 2 660670 5 5 670680 6 6 680690 14 14 690700 26 26 700710 18 18 710720 13 13 720730 10 10 730740 3 3 740750 3 3 合计100 100 直方图(略)3)茎叶图如下:65 1 8 66 1 4 5 6 8 67 1 3 4 6 7 9 68 1 1 2 3 3 3 4 5 5 5 8 8 9 9 69 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 70 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 9 71 0 0 2 2 3 3 5 6 7 7 8 8 9 72 0 1 2 2 5 6 7 8 9 9 73 3 5 6 74 1 4 7 2.5 (1)属于数值型数据2)分组结果如下:分组天数(天)-25-20 6 -20-15 8 -15-10 10 -10-5 13 -50 12 05 4 510 7 合计60 (3)直方图(略)。
2.6 (1)直方图(略)2)自学考试人员年龄的分布为右偏2.7 (1)茎叶图如下:A 班树茎B 班数据个数树叶树叶数据个数0 3 59 2 1 4 4 0448 4 2 97 5 12 11 6 9 23 7 00113449 8 7 6655200 8 123345 6 6 632220 9 011456 6 0 10 000 3 ( 2)A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分布比A 班分散,且平均成绩较A 班低2.8 箱线图如下:(特征请读者自己分析)2.9 (1)x=274.1 (万元); Me=272.5 ;QL=260.25 ;QU=291.25 2)17.21s(万元)2.10 (1)甲企业平均成本19.41(元),乙企业平均成本18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本2.11x=426.67(万元);48.116s(万元)2.12 (1)( 2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差的大小基本上不受样本大小的影响 3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。
2.13 (1)女生的体重差异大,因为女生其中的离散系数为0.1 大于男生体重的离散系数0.08 2)男生:x=27.27 (磅),27.2s(磅);女生:x=22.73 (磅),27. 2s(磅);(3)68%;(4)95% 2.14 (1)离散系数,因为它消除了不同组数据水平高地的影响2)成年组身高的离散系数:024.01.1722.4sv;幼儿组身高的离散系数:032.03.713.2sv;由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大2.15 下表给出了一些主要描述统计量,请读者自己分析方法 A 方法 B 方法 C 平均165.6 平均128.73 平均125.53 中位数165 中位数129 中位数126 众数164 众数128 众数126 标准偏差2.13 标准偏差1.75 标准偏差2.77 极差8 极差7 极差12 最小值162 最小值125 最小值116 最大值170 最大值132 最大值128 2.16 (1)方差或标准差;(2)商业类股票;(3)(略)2.17 (略)第 3 章概率与概率分布3.1 设 A女性, B工程师, AB女工程师, A+B 女性或工程师(1)P(A)4/12 1/3 (2)P(B)4/12 1/3 ( 3)P(AB)2/12 1/6 (4)P(A+B) P(A) P(B) P(AB)1/3 1/3 1/6 1/2 3.2 求这种零件的次品率,等于计算“任取一个零件为次品”(记为A)的概率()P A。
考虑逆事件A“任取一个零件为正品”,表示通过三道工序都合格据题意,有:于是( )1()10.6480.352P AP A3.3 设 A 表示“合格”,B 表示“优秀”由于BAB,于是)|()()(ABPAPBP0.80.150.12 3.4 设 A第 1 发命中 B命中碟靶 求命中概率是一个全概率的计算问题再利用对立事件的概率即可求得脱靶的概率 0.8 10.2 0.50.9 脱靶的概率10.90.1 或(解法二):P(脱靶 )P(第 1 次脱靶 ) P(第 2 次脱靶 ) 0.2 0.50.1 3.5 设 A活到 55 岁, B活到 70 岁所求概率为:3.6 这是一个计算后验概率的问题设 A优质率达95,A优质率为80, B试验所生产的5 件全部优质P(A)0.4,P(A)0.6,P(B|A)=0.955,P(B|A)=0.85,所求概率为:决策者会倾向于采用新的生产管理流程3.7 令 A1、A2、A3分别代表从甲、 乙、丙企业采购产品,B 表示次品 由题意得: P(A1)0.25,P(A2)0.30,P(A3)0.45;P(B|A1)0.04,P(B|A2) 0.05,P(B|A3)0.03;因此,所求概率分别为:(1))|()()|()()|()()(332211ABPAPABPAPABPAPBP 0.250.040.300.050.450.03 0.0385 (2)3506.00385.00135.00.030.450.050.300.040.2503.045.0)|(3BAP3.8 据题意,在每个路口遇到红灯的概率是p24/(24+36) 0.4。
设途中遇到红灯的次数X,因此, XB(3,0.4)其概率分布如下表:xi0 1 2 3 P(X=xi) 0.216 0.432 0.288 0.064 期望值(均值)1.2(次),方差0.72,标准差 0.8485(次)3.9 设被保险人死亡数X,X B(20000 ,0.0005) 1)收入 20000 50(元) 100 万元要获利至少50 万元,则赔付保险金额应该不超过50 万元,等价于被保险人死亡数不超过10 人所求概率为:P(X 10) 0.58304 2)当被保险人死亡数超过20 人时,保险公司就要亏本所求概率为:P(X20)1P(X 20)10.998420.00158 (3)支付保险金额的均值50000E(X) 50000200000.0005(元) 50(万元)支付保险金额的标准差50000 (X) 50000(200000.0005 0.9995)1/2158074(元)3.10(1)可以 当 n 很大而 p 很小时, 二项分布可以利用泊松分布来近似计算本例中, =np=20000 0.0005=10,即有 XP(10) 计算结果与二项分布所得结果几乎完全一致 2)也可以。
尽管p 很小,但由于n 非常大, np 和 np(1-p)都大于 5,二项分布也可以利用正态分布来近似计算本例中, np=200000.0005=10,np(1- p)=200000.0005(1- 0.0005)=9.995,即有 X N(10,9.995)相应的概率为:P(X 10.5) 0.51995,P(X 20.5) 0.853262可见误差比较大(这是由于P太小,二项分布偏斜太严重)注】由于二项分布是离散型分布,而正态分布是连续性分布,所以,用正态分布来近似计算二项分布的概率时,通常在二项分布的变量值基础上加减0.5 作为正态分布对应的区间点,这就是所谓的“连续性校正 ” 3)由于 p0.0005,假如 n=5000,则 np2.51.645 ,所以应该拒绝0H6.6 z3.11,拒绝0H6.7 z1.93 ,不拒绝0H6.8 z7.48,拒绝0H6.9 2206.22 ,拒绝0H6.10 z-5.145 ,拒绝0H6.11 t1.36,不拒绝0H6.12 z -4.05 ,拒绝0H6.13 F8.28 ,拒绝0H6.14 (1)检验结果如下:t-检验 :双样本等方差假设变量 1 变量 2 平均100.7 109.9 方差观测值20 20 合并方差假设平均差0 df 38 tStat P(T=t) 单尾1.73712E-06 t 单尾临界P(T=t) 双尾3.47424E-06 t 双尾临界t-检验 :双样本异方差假设变量 1 变量 2 平均100.7 109.9 方差观测值20 20 假设平均差0 df 37 tStat P(T=t) 单尾1.87355E-06 t 单尾临界P(T=t) 双尾3.74709E-06 t 双尾临界( 2)方差检验结果如下:F-检验双样本方差分析变量 1 变量 2 平均100.7 109.9 方差观测值20 20 df 19 19 F P(F4.07,应拒绝0234:0H,说明 X、2X、3X联合起来对Y 确有显着影响。
4)计算总成本对产量的非线性相关系数:因为20.973669R因此总成本对产量的非线性相关系数为20.973669R或 R=0.9867466 (5)评价:虽然经t 检验各个系数均是显着的,但与临界值都十分接近,说明t 检验只是勉强通过,其把握并不大如果取0.01,则查 t 分布表得0.005(124)3.3554t,这时各个参数对应的t 统计量的绝对值均小于临界值,则在0.01的显着性水平下都应接受0:0jH的原假设8.9 利用 Excel 输入 X、y和 Y 数据,用Y 对 X回归,估计参数结果为t 值=( 9.46)( -6.515)整理后得到:xey314.09693.307?第 9 章时间序列分析9.1 (1) 3031.0621.05=301.3131=39.393(万辆)(2)99(30 2) /(30 1.078)12/1.07817.11%(3)设按 7.4%的增长速度n 年可翻一番则有1.07460/ 302n所以 n=log2/log1.074=9.71 (年)故能提前0.29 年达到翻一番的预定目标9.2 (1)( 1)以 1987 年为基期, 2003 年与 1987 年相比该地区社会商品零售额共增长:(2)年平均增长速度为1%)8. 61 (%)2. 81(%)101(1555。












