
统计学贾俊平-第四版课后习题答案-2..pdf
22页33某百货公司连续 40 天的商品销售额如下:单位:万元41463542253628362945463747373437383730493436373930454442384326324333383640444435要求:根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图1、确定组数:lg40lg(n)1.6020611 6.32,取 k=6K 1lg(2)lg20.301032、确定组距:组距( 最大值 - 最小值) 组数=(49-25)6=4,取 53、分组频数表销售收入(万元)销售收入(万元)= 2526 - 3031 - 3536 - 4041 - 4546+总和频数频数1561410440频率频率%2.512.515.035.025.010.0100.0累计频数累计频数1612263640累计频率累计频率%2.515.030.065.090.0100.0频数1614121086420= 2526 - 3031 - 3536 - 4041 - 4546+频数频数销售收入3.9.下面是某考试管理中心对2002 年参加成人自学考试的12000 名学生的年龄分组数据:年龄18192121222425293034353940444559%1.934.734.117.26.42.71.81.2(1) 对这个年龄分布作直方图;(2) 从直方图分析成人自学考试人员年龄分布的特点。
解:解: (1)制作直方图:将上表复制到Excel 表中,点击:图表向导柱形图选择子图表类型完成即得到如下的直方图:(见 Excel 练习题 2.6)1 / 22%4035302520151050%(2)年龄分布的特点:自学考试人员年龄的分布为右偏3.11 对于下面的数据绘制散点图xy解:225325420130816718y1819212122242529303435394044455935302520151050024x68103 12甲乙两个班各有40名学生, 期末统计学考试成绩的分布如下:考试成绩优良中及格不及格人数甲班361894乙班615982要求:(1) 根据上面的数据,画出两个班考试成绩的对比条形图和环形图2 / 22201816141210864201815人数 甲班人数 乙班42963698优良中及格不及格2894366优良中及格不及格918153.14已知1995 2004 年我国的国内生产总值数据如下(按当年价格计算):单位:亿元国内生产总值年份199519961997199819992000200120022003200458478.1678846744626783452820675894681973148105172.311739021368759第一产业1199313844.214211214552414471961462821541181611731692812076807第二产业28538336133722338619405584493548750529806127472387第三产业17947204282302925174270382990533153360753918843721要求: (2) 绘制第一、二、三产业国内生产总值的线图。
3 / 2280000700006000050000400003000020000100000第一产业第二产业第三产业199519961997199819992000200120022003200441一家汽车零售店的10 名销售人员 5 月份销售的汽车数量(单位:台)排序后如下:24710101012121415要求:(1)计算汽车销售量的众数、中位数和平均数2)根据定义公式计算四分位数3)计算销售量的标准差4)说明汽车销售量分布的特征解:Statistics汽车销售数量NValidMissingMeanMedianModeStd. DeviationPercentiles2550751009.6010.00104.1696.2510.0012.504 / 22HistogramHistogram32F Fr re eq qu ue en nc cy y1Mean =9.6Std. Dev. =4.169N =1002.557.51012.515汽车销售数量汽车销售数量43 某银行为缩短顾客到银行办理业务等待的时间准备采用两种排队方式进行试验:一种是所有颐客都进入一个等待队列:另种是顾客在三千业务窗口处列队3 排等待。
为比较哪种排队方式使顾客等待的时间更短两种排队方式各随机抽取9 名顾客得到第一种排队方式的平均等待时间为 72 分钟,标准差为 197 分钟第二种排队方式的等待时间(单位:分钟)如下:556667687173747878要求:(1)画出第二种排队方式等待时间的茎叶图第二种排队方式的等待时间(单位:分钟) Stem-and-Leaf Plot Frequency Stem & Leaf 1.00 Extremes (=5.5) 3.00 6 . 678 3.00 7 . 134 2.00 7 . 88 Stem width: 1.00 Each leaf: 1 case(s)(2)计算第二种排队时间的平均数和标准差MeanStd. Deviation5 / 2270.714143Variance0.51(3)比较两种排队方式等待时间的离散程度第二种排队方式的离散程度小4)如果让你选择一种排队方式,你会选择哪种?试说明理由选择第二种,均值小,离散程度小46在某地区抽取 120 家企业,按利润额进行分组,结果如下:按利润额分组(万元)200300300400400500500600600 以上合计要求:(1)计算 120 家企业利润额的平均数和标准差。
2)计算分布的偏态系数和峰态系数解:Statistics企业利润组中值 Mi(万元)NValidMissingMeanStd. DeviationSkewnessStd. Error of SkewnessKurtosisStd. Error of Kurtosis1200426.6667116.484450.2080.221-0.6250.438企业数(个)19304218111206 / 22HistogramHistogram5040F Fr re eq qu ue en nc cy y302010Mean =426.67Std. Dev. =116.484N =120200.00300.00400.00500.00600.00700.000企业利润组中值Mi(万元)企业利润组中值Mi(万元)47为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100 名 717 岁的少年儿童作为样本,另一位调查人员则抽取了1 000 名 717 岁的少年儿童作为样本请回答下面的问题,并解释其原因1)两位调查人员所得到的样本的平均身高是否相同?如果不同,哪组样本的平均身高较大?(2)两位调查人员所得到的样本的标准差是否相同?如果不同,哪组样本的标准差较大?(3)两位调查人员得到这 l 100 名少年儿童身高的最高者或最低者的机会是否相同?如果不同,哪位调查研究人员的机会较大?解: (1)不一定相同,无法判断哪一个更高,但可以判断,样本量大的更接近于总体平均身高。
2)不一定相同,样本量少的标准差大的可能性大3)机会不相同,样本量大的得到最高者和最低者的身高的机会大48一项关于大学生体重状况的研究发现 男生的平均体重为 60kg,标准差为 5kg;女生的平均体重为 50kg,标准差为 5kg请回答下面的问题:(1)是男生的体重差异大还是女生的体重差异大?为什么?女生,因为标准差一样,而均值男生大,所以,离散系数是男生的小,离散程度是男生的小2)以磅为单位(1ks22lb),求体重的平均数和标准差都是各乘以2.21, 男生的平均体重为60kg2.21=132.6磅, 标准差为5kg2.21=11.057 / 22Cases weighted by 企业个数磅;女生的平均体重为 50kg2.21=110.5磅,标准差为 5kg2.21=11.05磅3)粗略地估计一下,男生中有百分之几的人体重在55kg 一 65kg 之间?计算标准分数:Z1=x x5560 x x6560=-1;Z2=1,根据经验规则,男生大约有68%ss55的人体重在 55kg 一 65kg 之间4)粗略地估计一下,女生中有百分之几的人体重在40kg60kg 之间?计算标准分数:Z1=x x4050 x x6050=-2;Z2=2,根据经验规则,女生大约有95%ss55的人体重在 40kg 一 60kg 之间。
49一家公司在招收职员时,首先要通过两项能力测试在 A 项测试中,其平均分数是100 分,标准差是 15 分;在 B 项测试中,其平均分数是400 分,标准差是 50 分一位应试者在 A 项测试中得了 115 分,在 B 项测试中得了 425 分与平均分数相比,该应试者哪一项测试更为理想?解:应用标准分数来考虑问题,该应试者标准分数高的测试理想ZA=x x115100 x x425400=1;ZB=0.5ss5015因此,A 项测试结果理想410一条产品生产线平均每天的产量为3 700 件,标准差为50 件如果某一天的产量低于或高于平均产量,并落人士2 个标准差的范围之外,就认为该生产线“失去控制” 下面是一周各天的产量,该生产线哪几天失去了控制?时间产量(件)时间产量(件)日平均产量日产量标准差标准分数 Z标准分数界限3-0.6-0.2-22-22-22周一周二周三周四周五周六周日38503670369037203610359037003700500.4-1.8-2.2-22-22-220-22周一周二周三周四周五周六周日3 850 3 670 3 690 3 720 3 610 3 590 3 700周六超出界限,失去控制。
413在金融证券领域,一项投资的预期收益率的变化通常用该项投资的风险来衡量预期收益率的变化越小,投资风险越低;预期收益率的变化越大,投资风险就越高下面的两个直方图, 分别反映了 200 种商业类股票和 200 种高科技类股票的收益率分布在股票市场上,高收益率往往伴随着高风险但投资于哪类股票,往往与投资者的类型有一定关系1)你认为该用什么样的统计量来反映投资的风险?标准差或者离散系数2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票?选择离散系数小的股票,则选择商业股票8 / 22(3)如果进行股票投资,你会选择商业类股票还是高科技类股票?考虑高收益,则选择高科技股票;考虑风险,则选择商业股票解: (1)方差或标准差; (2)商业类股票; (3) (略) 7.1 从一个标准差为 5 的总体中抽出一个容量为40 的样本,样本均值为 251)样本均值的抽样标准差x等于多少?(2)在 95%的置信水平下,允许误差是多少?解:已知总体标准差=5,样本容量 n=40,为大样本,样本均值x=25,(1)样本均值的抽样标准差x=5=0.790640n(2)已知置信水平 1=95%,得Z/2=1.96,于是,允许误差是 E =Z/2=1.960.7906=1.5496。
n7.2 某快餐店想要估计每位顾客午餐的平均花费金额在为期3 周的时间里选取 49 名顾客组成了一个简单随机样本1)假定总体标准差为 15 元,求样本均值的抽样标准误差xn15=2.14349(2)在 95的置信水平下,求边际误差x tx,由于是大样本抽样,因此样本均值服从正态分布,因此概率度 t=z2因此,x tx z2x z0.025x=1.962.143=4.2(3)如果样本均值为 120 元,求总体均值 的 95的置信区间置信区间为:x x,x x=1204.2,1204.2=(115.8,124.2)7.109 。












