
北京大学社会统计学2013年秋季学期第一次作业.doc
7页作业 11、 下表给出了 1960 年,1970 年和 1986 年美国 25 岁及 25 岁以上的人的教育水平的分布教育水平”是指完成的正规学校教育年数小组区间包含左端点但不包含右端点:例如,由表的第二行,1960 年大约 14%的人完成了 5-8 年的正规学校教育; 1986 年,大约5%的人属于这个类1)画 1986 年数据的直方图你可以解释“16 或更多”为 16-17 年正规学校教育;几乎没有人完成 17 年以上的教育2)对 1986 年的数据,将头两个小组区间合并成一个(0-8 年,含 8%的人)再画直方图3)对 1970 年的数据画直方图,并将它与 1986 年的直方图进行比较在 1970 年与 1986年之间人口的教育水平发生了什么变化?是上升,下降,还是停留在大致相同的水平?4)从 1960 年到 1970 年教育水平发生了什么变化?教育水平正规学校教育年数 1960 1970 19860-5 8 6 35-8 14 10 58-9 18 13 69-12 19 19 1212-13 25 31 3813-16 9 11 1716 或更多 8 11 19注:由于四舍五入,百分数加起来不等于 100%来源:统计摘要,1988 年,表 2022、下面给出非全日雇员工资的直方图。
没有一个人月收入 1000 美元以上请标明 200 至500 美元的小组区间上的直方有多高?3、一调查研究人员在某城取 100 名 18-24 岁的男子作为样本另一调查研究人员取 1000名这样的男子作为样本1)哪一位调查研究人员将在他所取样本中得到男子身高的较大的平均数?或者这两个平均数大致相等?2)哪一位调查研究人员将在他所取得样本中得到男子身高的较大标准差?或者这两个标准差大致相等?3)哪一位调查研究人员有可能得到这 1100 名男子样本中得最高者?或者对这两位调查人员来说,这种机会是相等的?4)哪一位调查研究人员有可能得到这 1100 名男子样本中的最矮者?或者对这两位调查人员来说,这种机会是相等的?4、在一条限速为 30 英里/小时的地段 ,随机抽选 10 辆车测它们的速度,得到数据:22,32,38,27,39,23,29,30,31,29请分别计算本次抽样的中位值、均值、极差、四分位差、方差和标准差5、下表为某月市医院就医病人数的频次分布表请分别计算样本的众值、中位值、均值、异众比率、级差、四分位差、方差和标准差6、下表为 72 名离婚者婚龄的统计1)试作频率统计表、直方图和折线图。
2)试求众值、中位值和均值并作简单讨论3)试求异众比率、级差、四分位差、和标准差婚 龄 人 数1-3 54-6 107-9 2010-12 1413-15 916-18 419-21 322-24 225-27 428-30 17、下表是社会学系某年级学生的总评学分绩点按照这个原始数据,作出四个个完整的分布统计表:等 级 频 数0-4 35-9 510-14 1015-19 1320-24 925-29 930-34 735-39 6总计 62(1)不分组的频次统计表;(2)利用计算法确定组距画出分组的频次统计表;(3)利用经验法分组的频次统计表,包括标示组限、频次、相对频次,频率,cf↑,cf↓,c%↑,c%↓;(4)利用经验法分组分组的频次统计表,包括每组的标示上下组限,真实上下组限,组距,组中值和频次学生编号 总评学分绩点1 932 923 924 915 906 897 898 899 8810 8811 8712 8713 8714 8715 8616 8617 8418 8419 8420 8421 8422 8323 8324 8225 8226 8127 8128 8129 8030 8031 7932 7833 7834 7835 7836 7537 7438 7139 68绩点 频次68 171 174 175 178 479 180 281 382 283 284 586 287 488 289 390 191 192 2总计 388、下面的统计表有哪些问题,指出来,并画一个完整的频次和频率统计表,在表中把真实组限、组距和组中值都列上。
某厂工人的月收入分布 1501-1900 401301-1500 1411101-1300 158901-1100 136701-900 65501-700 109、以下是某厂职工教育程度的调查:SE=“文盲”,CE=“小学”,JH=“初中”,SH=“高中”,CH=“大专”,SC=“大学本科”,CM= “研究生” SH JH JH CM CM CH CM CM SH CE SH CH CM CH JH CE CH SH SH CH CH CH JH SH CM SH SH CM CH JHCH CH JH CH CH JH SE CM CH JH CE CE CE CH CHCH CH CH JH SC SH JH CM CH CE JH JH SH CH CHCH SH CH CM JH CH JH CH CE SC CH SC SH JH CHCM CH SH CH CE JH CH CM CH SH SH SC CH CH CHCH CM JH CM CH CE SC CH JH SC1) 试作统计表和统计图2) 选择适当的集中值和离散值,并分析。
10、设以下是某区家庭子女数的统计表1)试作频率统计表、直方图和折线图2)试求均值和标准差子女数 户 数0 4171 2402 3663 2224 1345 636 397 248 2111、下面的图是一个直方图,表示了在药物研究项目中所有 14148 位妇女的血压分布使用直方图回答下列问题:a) 血压在 130mm 以上的妇女的百分数大约是 25%,50% ,还是 75%?b) 血压在 90mm 与 160mm 之间的妇女的百分数大约是 1%,50%,还是 99%?c) 在哪个区间有较多妇女:135-140mm 还是 140-150mm?d) 哪个区间更拥挤一些:是 135—140mm 还是 140—150mm?e) 在区间 125—130mm 内,直方图的高大约为每 mm2.1%多少百分数的妇女具有这个小组区间里的血压?f) 哪个区间有较多妇女:是 97-98mm,还是 102—103mm?g) 所有的毫米中,哪里最拥挤?每磅的%每%的磅每mm的百分数0123490 100 110 120 130 140 150 160血压(mm)12、三个人使用密度尺度对一项研究中的实验对象的体重绘制了直方图。
只有一个人是正确的是哪一个,为什么?(1)100 150 200(2) (3)2 21 10 0100 150 200 100 150 20013、求标准正态曲线下的面积:1)1.25 的右边2)-0.4 的左边3)0.8 的右边4)-0.85 的左边5)-1.35 与 1.35 之间6)0.4 与 1.3 之间7)-0.3 与 0.9 之间14 一个数列有 10 个数,这些数字要么是 1、要么是 2、要么是 3。
1)如果平均数是 2,标准差是 0,该数列应该由那些数字组成?(2)如果标准差是 1,该数列应该由哪些数字组成?(3)该数列的标准差可能大于 1 吗?15 如果正态分布的均值是 80,其标准差为 12,试问:(1)80 和 93 之间的个案占多少?(2)90 和 105 之间,70 和 105 之间的个案比例是多少?(3)小于 68 的个案比例是多少?(4)为了得到各包含总面积 2%的尾端,需要从均值两边扩展几个标准差?(5)什么分数有 4%的个案数超过它?(换言之 ,定于第 96 个百分位数上。
