
《数据模型与决策》习题解答(共20页).doc
20页精选优质文档-----倾情为你奉上第二章习题(P46)14.某天40只普通股票的收盘价(单位:元/股)如下:29.62518.0008.62518.5009.25079.3751.25014.00010.0008.75024.25035.25032.25053.37511.5009.37534.0008.0007.62533.62516.50011.37548.3759.00037.00037.87521.62519.37529.62516.62552.0009.25043.25028.50030.37531.12538.00038.87518.00033.500(1)构建频数分布*2)分组,并绘制直方图,说明股价的规律3)绘制茎叶图*、箱线图,说明其分布特征4)计算描述统计量,利用你的计算结果,对普通股价进行解释解:(1)将数据按照从小到大的顺序排列1.25, 7.625, 8, 8.625, 8.75, 9, 9.25, 9.25, 9.375, 10, 11.375, 11.5, 14, 16.5, 16.625, 18, 18, 18.5, 19.375, 21.625, 24.25, 28.5, 29.625, 29.625, 30.375, 31.125, 32.25, 33.5, 33.625, 34, 35.25, 37, 37.875, 38, 38.875, 43.25, 48.375, 52, 53.375, 79.375,结合(2)建立频数分布。
2)将数据分为6组,组距为10分组结果以及频数分布表为了方便分组数据样本均值与样本方差的计算,将基础计算结果也列入下表区间组频数累计频数组中值组频数组中值组频数组中值组中值99545225101915150225052425125312511353538513475237459040503406018010800合计4097533925根据频数分布与累积频数分布,画出频率分布直方图与累积频率分布的直方图频率分布直方图从频率直方图和累计频率直方图可以看出股价的规律股价分布10元以下、10—20元、30—40元占到60%,股价在40元以下占87.5%,分布不服从正态分布等等累积频率分布直方图(3)将原始数据四舍五入取到整数1,8 ,8 ,9 ,9 ,9 ,9 ,9 ,9 ,10 ,11 ,12 ,14 ,17 ,17 ,18 ,18 ,19 ,19 ,22 ,24 ,29 ,30 ,30 ,30 ,31 ,32 ,34 ,34 ,34 ,35 ,37 ,38 ,38 ,39 ,43 ,48 ,52 ,53 ,79以10位数为茎个位数为叶,绘制茎叶图如下茎(十位数)叶(个位数及其小数)0122493438523679由数据整理,按照从小到大的准许排列为:最小值,下四分位数,中位数,上四分位数 ,最大值,四分位数间距,,因此可以做出箱线图为:茎叶图的外部轮廓反映了样本数据的分布状况。
从茎叶图和箱线图可以看出其分布特征:中间(上下四分位数部分)比较集中,但是最大值是奇异点数据分布明显不对称,右拖尾比较长4)现用原始数据计算常用的描述性统计量样本均值:样本方差:样本标准差:用分组数据计算常用的描述性统计量:,样本均值:样本方差:样本标准差:与用原始数据计算的结果差别不大此外,可以用Excel中的数据分析直接进行描述性统计分析,结果如下:平均25.4219 区域78.125标准误差2.5651 最小值1.25中位数22.9375 最大值79.375众数29.625求和1016.875标准差16.2233 观测数40方差263.1961 最大(1)79.375峰度1.6025 最小(1)1.25偏度1.0235 置信度(95.0%)5.1885 补充习题:1. 测量血压14次,记录收缩压,得样本如下: 121,123,119,130,125,115,128,126,109,112,120,126,125,125求样本均值,样本方差,样本中位数,众数和极差2. 根据列表数据分组人数[20,25)2[25,30)6[30,35)9[35,40)4[40, 45]1求样本均值,样本方差,样本标准差3. 调查30个中学生英语成绩,得样本如下:54, 66, 69, 69, 72,75, 77, 75, 76, 79, 76,77, 78, 79,81,81, 85, 87, 83, 84,89, 86,89, 89, 92, 95,96,96, 98, 99把样本分为5组,组距为10,且最小组的下限为50,作出列表数据和直方图补充习题答案1. 测量血压14次,记录收缩压,得样本如下: 121,123,119,130,125,115,128,126,109,112,120,126,125,125求样本均值,样本方差,样本中位数,众数和极差。
解:排序: 109112115119120121123125125125126126128 130均值:= 121.71 方差:= 37.76 中位数:= 124 众数:me= 125 极差:R=xn-x1= 21 2.根据列表数据分组人数组中值[20,25)222.5[25,30)627.5[30,35)932.5[35,40)437.5[40, 45]142.5求样本均值,样本方差,样本标准差解: 分组人数组中值[20,25)222.5[25,30)627.5[30,35)932.5[35,40)437.5[40, 45]142.5 样本均值:= 31.59091 样本方差:=25.32468 样本标准差:=5.0323调查30个中学生英语成绩,得样本如下:54, 66, 69, 69, 72,75, 77, 75, 76, 79, 76,77, 78, 79,81,81, 85, 87, 83, 84,89, 86,89, 89, 92, 95,96,96, 98, 99把样本分为5组,组距为10,且最小组的下限为50,作出列表数据和直方图解:列表 区间频数[ 50,60)1[60,70)3[70,80)10[80,90)10[90,100]6 第四章习题(p118)21.下面的10个数据是来自一个正态总体的样本数据:10,8,16,12,15,6,5,14,13,9(1)总体均值的点估计是多少?(2)总体标准差的点估计是多少?(3)总体均值99%的置信区间是多少?解: (1)总体均值的点估计(2)总体标准差的点估计(3)这是正态总体方差未知的条件下,总体均值的区间估计问题,,总体均值99%的置信区间为:第五章习题(p154)7.某一问题的零假设和备择假设分别如下: 当某个样本容量为100,总体标准差为12时,对下面每一个样本的结果,都采用显著性水平计算检验统计量的值,并得出相应的结论。
1)解:这是总体分布未知,大样本前提下,总体均值的单边检验问题故,可以用大样本情况下单个总体均值的检验提出原假设与备择假设: 选择检验统计量,当成立时,给定显著性水平,,拒绝域(1),,拒绝接受,即不能认为2),,接受3),,拒绝接受,即不能认为4),,接受12.有一项研究要作的假设检验是: 某个样本有6个数据,他们分别是:20,18,19,16,17,18根据这6个数据,分别回答以下问题:(1)它们的均值和标准差各是多少?(2)当显著性水平时,拒绝规则是什么?(3)计算检验统计量t的值4)根据以上信息,你所得出的结论是什么?解:说明:本题是小样本,应该有总体服从正态分布的假定1)由样本数据得,,样本均值:;样本方差:样本标准差:(2)在总体服从正态分布的假定之下,这是正态总体方差未知的条件下,总体均值的双边检验问题,用检验提出原假设与备择假设: 选择检验统计量:,当原假设成立时,当显著性水平时,,因此:拒绝域为:(3)计算检验统计量t的值(4),接受即,总体均值与20没有显著性差异13.一家钢铁企业主要生产一种厚度为25mm的钢板历史统计资料显示,其中一台设备生产的钢板的厚度服从正态分布。
最近,该厂维修部门对这台设备进行了大修这台设备重新投入生产后,车间生产监管员担心这台设备经过维修后生产的钢板厚度会发生变化为验证这一担心是否属实,他随机选出20块钢板,对其厚度进行测量测量结果如表5—11所示请判断这台设备经过维修后生产的钢板的厚度是否发生了明显的变化()表5—11 20块样本钢板的厚度 (单位:mm)22.622.223.227.424.527.126.628.126.924.926.225.323.124.226.125.830.428.623.523.6解:这是一个正态总体方差未知的条件下,总体均值的双边检验问题)提出原假设和备择假设: (2)选择检验统计量:, 当显著性水平时,,拒绝域为:(3)计算检验统计量t的值(4),接受即,这台设备经过维修后生产的钢板的厚度没有发生明显的变化25.一家保健品厂最近研制出一种新的减肥药品为了检验这种减肥药的效果,它分别对10名志愿者服用减肥药之前的体重和服用减肥药一个疗程后的体重进行测量测量数据如下:(单位:kg)服药前7175826982.57671867880.5服药后6675.58067。












