
重庆工商大学统计学原理(同等学力加试科目)复试仿真模拟三套题.pdf
24页2017年 重 庆 工 商 大 学 统 计 学 原 理 ( 同 等 学 力 加 试 科 目 )复 试 仿 真 模 拟 三 套 题 ( 一 )说 明 : 本资料为2017复试学员内部使用, 严格按照2017复试常考题型及难度全真模拟预测一 、简答题1 •解释多重判定系数和调整的多重判定系数的含义和作用 答案】(1 ) 多重判定系数是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合程度的一个统计量,反映了在因变量y的变差中被估计的回归方程所解释的比例,其计算公式为:* 嗡= " 篝 2 )调整的多重判定系数考虑了样本量(n )和模型中自变量的个数(k )的影响,这就使得的值永远小于产, 而且胃的值不会由于模型中自变量个数的增加而越来越接近I , 其计算公式为= 1 -( 1-W ) x 9二 2 .给出显著■性检验中,P 值的含义,以及如何利用P 值决定是否拒绝原假设 答案】P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率如 果P值很小,说明这种情况发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设P值越小,我们拒绝原假设的理由就越充分。
从研完总体中抽取一个随机样本, 计算检验统计量的值和概率P值, 即在假设为真的前提下,检验统计量大于或等于实际观测值的概率如 果P °旧5 ,说明结果更倾向于接受假定的参数取值即一般以P<0.05为显著,P<0-01为非常显著,其含义是样本间的差异由抽样误差所致的概率小 于Q05或0.01但是,P值不能赋予数据任何重要性,只能说明某事件发生的机率P<0.01时样本间的差异比P<0.05时更大,这种说法是错误的3 .在盒子图( 箱线图) 的作图中,会使用哪些描述指标 答案】箱线图(Boxplot) 也称箱须图(Box-whiskerPlot),是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较由上面叙述可知,箱线图使用的描述指标有:最小值、第一四分位数、中位数、第三四分位数与最大值4 .解释总体分布、样本分布和抽样分布的含义。
答案】总体分布就是总体中所有个体关于某个变量( 标 志 ) 的取值所形成的分布假 设X为总体随机变量,那么总体分布就是指X的分布很显然,同一变量不同的总体或同一总体不同的变量,其分布是不同的样本分布就是样本中所有个体关于某个变量( 标 志 ) 的取值所形成的分布假 设 X 为总体随机变量X 在样本中的体现,那么样本分布就是指X 的分布,或者说是关于《 个观测值的分布同样,同一变量不同的样本或同一样本不同的变量,其分布是不同的一般意义上说,抽样分布就是样本统计量的概率分布,它由样本统计量的所有可能取值和与之对应的概率组成 如果说样本分布是关于样本观测值的分布, 那么抽样分布则是关于样本统计量的分布,而样本统计量是由样本观测值计算而来的具体地说,抽样分布就是从容量为W的总体中抽取容量为n 的样本时,所有可能的样本统计量所形成的分布假设从容量为W的有限总体中最多可以抽取m 个容量为n 的不同样本, 那么把所有m 个样本统计值形成频率分布, 就是抽样分布可以说,抽样分布是研究样本分布与总体分布之间的桥梁5 . 多元回归分析中为什么需要使用修正的判定系数( 可决系数) 来比较方程的拟合效果? 是如何计算的?【 答案】在多元线性回归分析中,常用修正的判定系数,而不用多重判定系数来衡量估计模型对样本观测值的拟合优度。
这是由于多重判定系数R: 随着样本解释变量个数的增加. R?的值越来越高( 即R2是解释变量个数的增函数) 也就是说,在样本容量不变的情况,在模型中增加新的解释变量不会改变总离差平方和,但可能增加回归平方和,减少残差平方和,从而可能改变模型的解释功能因此在多元线性回归模型之间比较拟和优度时,R2不是一个合适的指标,需加以调整而修正判定系数竹. 其值不会随着解释变量个数k 的增加而增加,因此在用于估计多元回归模型方面要优于多重判定系数也修正判定系数大的计算公式为味…一回吊SSEZ(n-k-l)_ _ SST/(n-l)6 . 简述平稳序列和非平稳序列的含义 答案】(1 ) 平稳序列是基本上不存在趋势的序列这类序列中的观察值基本上在某个固定的水平上波动,虽然在不同的时间段波动的程度不同,但并不存在某种规律其波动可以看成是随机的 2 ) 非平稳序列包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也可能是几种成分的组合因此,非平稳序列可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列二、计算题7 .设随机变量Xi, X?相互独立且x的概率密度为2e-2\x> 00,.v<0X2的概率密度为/2W = '4「 ,x> 00,.r<0求 :( 1)E(X1 + X?)(2 ) E (2X ,-3X ; )(3 ) E (X R )【 答案】由题意可求得:E(X1) = J : xj\(x)dx = j" Odr + J: 2xe-2xdx = gE(X2) = j ^ Xf2(X)dX =『OdX+『4XeTx =;E(X:) =。
岫 =f : Odr + f 4x/汕 q1 1 3(1 ) £(Xt+ X2) = £ (X ,+ X2) = - + - = ^:-i s(2 ) E(2X, -3 X 1)= 2 E (X ,)-3£(X ^) = 1 - - = - ;(3 )因为随机变量X ,X?相对独立,所以有:E(XiX2) = E(Xl)E(X2) = - x -1一88 .某地区1996 - 2000年国民生产总值数据如表1所示表1年份19971998199920002001国民生产总值( 亿元)40. 968. 558发展速度( % )环比—定基—15!. 34增长速度( % )环比—10. 3定基—(1 ) 计算并填写表1中所缺数字;(2 )计算该地区1997s2001年间的国民生产总值;(3 )计算该地区1998s2001年间国民生产总值的平均发展速度和平均增长速度 答案】 (1 ) 由 于1998年的环比增长速度为10.3% ,所以该年的国民生产总值为:*9 9 8 = X (1 + @ 9 9 8 ) = 40.9 x (1 + 0 .103) = 45.1127(亿 元 )定基增长速度为:G.=#一1 = 10・ 3%^1997由于增长速度= 发展速度-1,所 以1998年的环比发展速度和定基发展速度均为110.3%.1999 年 :定基增长速度为:G 网 = 2 里—1 =黑 一 1 = 67.48%:'1997 4U.9定基发展速度= 定基增长速度+ 1=167.48%;环比增长速度为:5-=/一1 = 4 ;; ];7-1 = 51・84%:环比发展速度= 环比增长速度+ 1=151.84%。
2000 年:定基增长速度为:G200G = 铲 ■ - 1 = 募-1 = 41.81%;定基发展速度= 定基增长速度+1=141.81%;环比增长速度为:G2Goo = § 殁 一 1 =言 ^-1 = - 6 3 3 % :环比发展速度= 环比增长速度+ 1 =84.67%2001 年 :由于2001年的定基发展速度6 加 为⑸.34% ,所以该年的国民生产总值为:=Y.m xG ,( x) 1 = 40.9x1.5134 = 6 1.8981( 亿 元 ) :匕的 61,8981该 年 的 环 比 发 展 速 屋 券 = =106,72%2000 -5 0由于增长速度= 发展速度-1,所 以 2001年的环比增长速度和定基增长速度分别为6.72%和51.34%0经上述计算可得1996s2001年国民生产总值数据表表 2年份19971998199920002001国民生产总值( 亿元)40.945.112768.55861.8981发展速度( %)环比—110.3151.8484.67106.72定基—110.3167.48141.81151.34增长速度( %)环比—10.351.84-15.336.72定基—10.367.4841.8151.34( 2 ) 由 表 13-3可 知 1997s2001年间的国民生产总值。
3 ) 1998-2001年国民生产总值的平均增长速度为:则 1998s2001年国民生产总值的平均发展速度为111.12%.9 . 设随机变量( X, Y ; 的概率密度函数为/( -v ..y) = i 30 < x < 1, 0 < y < 20,其他计算:(1)( 2 ) p ( x > y ) ;⑶ 尸[ y< ; | x < g【 答案】⑴ 呼 > 》=J闻>+割邛血¥滋=?( 3)2 2 p( yj ) 1城 " + 耕 -3610 . 1995年我国国内生产总值5.76万亿元 九五” 的奋斗目标是到2000年增加到9.5万亿元;远景目标是2010年比2000年翻一番试问:( 1) “ 九五”期间将有多大平均增长速度?( 2 ) 1996年 s20 10 年 ( 以 1995年为基期) 平均每年发展速度多大才能实现远景目标?【 答案】( 1 ) 由题意可知, “ 九五”期间的平均增长速度=T = J 筌 - 1 = 0 1 0 5 2 .N X] V 5.76即 “ 九五”期间W W 10 $ 2% 的增长速度 2 ) 远景目标:20 10 年的国内生产总值= 9.5x 2= 19 ( 万亿元) . 由于所以,1996年—20 10 年平均每年发展速度是10 8.3% 才能实现远景目标。
11 . 一家房地产评估公司想对某城市的房地产销售价格( y 后地产评估价值( ⑴、 房产评估价值(q )和 使 用 面 积 建 立 一 个 模 型 ,以便对销售价格作出合理预测为此,收集了 15栋住宅的房地产评估数据,经回归得到表1 和表2 中的结果a = 0 .0 5 ) .表 1( 1 ) 写出销售价格对地产评估价值、房产评估价值、使用面积的多元线性回归方程,并解释dfSSMSF Significance F回归 370090029.0823363343.0348.620.00残差 115285944.2548054039总计 175375973.334表 2Coefficients标准误差t StaiP-valueIntercept207.9037617.04860.33690.7425X Variable 11.43780.56452.5472().0271X Variable 20.85450.26633.20910.0083X Variable 30.06260.06560.95380.3607各回归系数的( 2 ) 检验回归方程的线性关系是否显著?( 3 ) 检验各回归系数是否显著?( 4 ) 计算多重判定系数加, 并说明它的实际意义。
5 ) 计算估计标准误差s「并说明它的实际意义 6 ) 你认为使用面积( 4) 在预测销售价格时是否有用? 试说明理由 答案】 ( 1 ) 由表中数据可得多元线性回归方程为:y =207.9037+l.4378.xi+0.8545x2+0.0626x31.4378表示当房产评估价值5)和使用面积( ⑹不变时, 地产评估价值( 小)每变动一个单位,房地产销售价格( y ) 的平均变动量为1.4378个单位A = 0 .8545表示当地产评估价值( 两) 和使用面积( 右 ) 不变时, 房产评估价值( M) 每变动一个单位,房地产销售价格( y ) 的平均变动量为0 .8545个单位0 = 0 .0 626表示当地产评估价值( 立) 和房产评估价值( 也〉 不变时,使用面积MN ) 每变动一个单位,房地产销售价格( y ) 的平均变动量为0 .0 626个单位 2 ) 建立假设:/ A = A = A = 0“I:d ,A,自至少有一个不等于o由方差分析表可知, P 值= o.oo< a = O .O 5, 拒绝原假设,即回归方程的线性关系是显著的 3 ) 建立假设对于任意参数4( /= 1, 2, 3) , 有,。
:月=0H , : (3.丰 0由表中数据可得,A 口寸应的P 值= o, O 27i< a = O .O 5;4 对应的p 值= o.oo83< a = o.o5:尸, 对应的p 值 = 0 360 7> a = 0 . 0 5 所以地产评估价值( X1) 和房产评估价值( 巧) 的影响是显著的,而使用面积( 4 ) 的影响是不显著的 “ 、 々工业,—AM , SSR 70090029.08 , 、C4多重判定系数/=—— =- - - - - - - - - - - - -= 92.99%SST 75375973.33在销售价格的变动中,由92.99% 的变动可以由地产评估价值、房产评估价值和使用面积来解SSEyn -k -}估计标准误差' 的实际意义:用地产评估价值、房产评估价值和使用面积来预测销售价格时,平均的预测误差为693.21 6 ) 使用面积( 小) 在预测销售价格时的影响不大由于在( 3 ) 题中• A未通过显著性检验12 . 某厂生产某产品1000件,其价格为P=2()00元/ 件, 其使用寿命X ( 单位:天) 的分布密度为_ J _ e 4弑" 对)= 1 20 0 0 00 x < 365x > 365现由某保险公司为其质量进行保险: 厂方向保险公司交保费Po元/ 件,每件产品若寿命小于10 95天 ( 3 年 ) ,则由保险公司按原价赔偿20 0 0 元/ 件,试由中心极限定理计算:( 1 ) 若保费P Q O O 元/ 件, 保险公司亏本的概率?( 2 ) 试确定保费P。
, 使保险公司亏本概率不超过I % 1°3= 0 .96, ①( 1.45) = 0 .926, ①( 1.61) = 0 .946, ①( 2.33) = 0 .99)【 答案】 ( 1 ) 设该厂出现产品寿命小于10 95天的总产品件数是Y 保险公司刚好亏本时,产品寿命小于10 95天的总产品件数是y;,则lOOOPo = 2OOOy当尸0 = 10 0 时,尸50 所以保险公司亏本的概率为:p( r > 50 ) = i-p( r < 50 )每件产品寿命小于10 95天的概率为:p = [ — — e 20000 dr = l - 04°毓=0.04上的2000010 0 0 件产品中寿命小于10 95天的总产品件数h B ( 10 0 0 , 0 .0 4) , 所以E(y)=np=10(X)x 0.04=40. D(K) = 〃/?(1 - p) = 38.4y -4 0 50-40由中心极限定理:V 50) = P ( - f = < ^ 7 = ) = P(z w 1.61) = 0.946,所以公司亏本的V38.4 V38.4概率是 1 -0.946=0.054(2 )由题意即是求P。
•使得P(2000r >1000po)< l% „ny -4 0 r —up(y >也)= p(- = X > 2 )= P(z > 2 ) < 1 %2 V384 V384 >7384^ - 4 0-^T=- 2 2.33 . p,, 2 108.89即保费至少是108.89,才能使保险公司亏本的概率不超过1%.2017年重庆工商大学统计学原理( 同等学力加试科目) 复试仿真模拟三套题( 二 )说 明 : 本资料为2017复试学员内部使用, 严格按照2017复试常考题型及难度全真模拟预测一、简答题1 . 什么叫变异、变量和变量值,试举例说明 答案】 标志在同一总体不同总体单位之间的差别称为变异例如: 人的性别标志表现为男、女;年龄标志表现为20岁、30岁等变异标志又称为变量,是说明现象某种特征的概念,其特点是从一次观察到下一次观察结果会呈现出差别或变化变量的具体取值称为变量值具体包括:(1 ) 分类变量,如“ 性别” 就是分类变量,其变量值为“ 男” 或“ 女” ;(2 )顺序变量, 如“ 产品等级” 就是J II页序变量, 其变量值可以为“ 一等品” 、 “ 二等品” 、 “ 三等品二“ 、 力口, ,足次口口寺;(3 ) 数值型变量,如“ 年龄” 是连续数值型变量,变量值为非负数;“ 企业数” 是离散数值型变量,变 量 值 为 1,2 , ……2 .要检验多个总体均值是否相等时,为什么不作两两比较,而用方差分析方法?【 答案】方差分析不仅可以提高检验的效率,同时由于它是将所有的样本信息结合在一起,也增加了分析的可靠性。
检验多个总体均值是否相等时,如果作两两比较,则需要进行多次的检验随着增加个体显著性检验的次f数,偶然因素导致差别的可能性也会增加( 并非均值真的存在差别) 而方差分析方法则是同时考虑所有的样本, 因此排除了错误累积的概率, 从而避免拒绝一个真实的原假设3 .二项分布与超几何分布的适用场合有什么不同? 它们的均值和方差有什么区别?【 答案】( 1 ) 从理论上讲,二项分布只适合于重复抽样( 即从总体中抽出一个个体观察完后放回总体,然后再抽下一个个体) 但在实际抽样中,很少采用重复抽样不过,当总体的元素数目况很大而样本量, 相对于AT来说很小时,二项分布仍然适用但如果是采用不重复抽样,各次试验并不独立,成功的概率也互不相等,而且总体元素的数目很小或样本量《 相对于W 来说较大时,二项分布就不再适用,这时,样本中“ 成功” 的次数则服从超几何概率分布 2 ) 若 X 服从二项分布 8 5 , p),则 E(X) =np. D (X) = n p (l-p ).N MM N -n若 Y 服从超几何分布〃 ( 〃 ,N, M)则 3 丫) = "/,D(X) = n — ( 1 - - ) - -oM NN N4 .在投掷一枚均匀硬而进行打赌时,出现正面时投掷者高5元,出现反面时输3元,记投掷者赢钱数为X。
试写出此问题的样本空间Q ,以及随机变量X的定义和概率分布 答案】记赢钱数为X , 0 为投掷后出现的两种结果,令c = { 正面,反面卜其中0 G C则◎的函数定义为:3 = 正面 = 反面X (/®)、 = 1_5,3则有P( X = -3 ) = P{ 出现反面} = : , P(X =5)= ? { 出现正面} = ;于是X 的概率分布为:X-35P\_225 . 什么是集中趋势和离散趋势? 它们常用的指标有哪些?【 答案】集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在常用的反映集中趋势的指标有平均数、中位数和众数数据的离散趋势是数据分布的另一个重要特征,它反映的是各变量值远离其中心值的程度数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散程度越小,其代表性就越好描述数据离散程度采用的测度值, 根据所依据数据类型的不同主要有异众比率、四分位差、方差和标准差此外,还有极差、平均差以及测度相对离散程度的离散系数等6 .抽样误差影响因素分析 答案】影响抽样误差的因素主要有:(1 ) 样本单位数目在其他条件不变的情况下,抽样数目越多,抽样误差越小;抽样数目越少,抽样误差越大。
当 n=N时,就是全面调查,抽样误差此时为零2 ) 总体标志变动程度 在其他条件不变的情况下,总体标志变异程度越大,抽样误差越大;总体变异程度越小,抽样误差越小 ( 3 ) 抽样方法一般讲,不重复抽样的抽样误差要小于重复抽样的抽样误差当 n 相 对 N 非常小时,两种抽样方法的抽样误差相差很小,可忽略不计4 ) 抽样组织方式采用不同的抽样组织方式,也会有不同的抽样误差一般讲分层抽样的抽样误差较小,而整群抽样的抽样误差较大.二 、计算题7 .研究人员估计了两个回归模型,相关结果如下表 1 模 型 1模型RR万调整的R方估计标准误1.977*.954.95320 6, 712表 2 预测变量: ( 常量 ),性别,收入模型作标准化系数B标准误差tS ig.1 ( 常圜628. 0 5647. 15713.318.0 0 0收入.619.0 1144.10 7.0 0 0性别31.0 6212. 10 0.733.466表3模型2樵型R方调整R方估计标准误1.977 1.954.95420 6. 223表4预测变量: ( 常 量 ) ,收入模型非标准化系数B标准误差tS ig.1 ( 常量)收入639.961.62144. 164.0 1414. 19045. 155.0 0 0.0 0 0(1 ) 根据表中的数据比较两个模型的拟合效果,并 对t检验的结果进行分析。
2 )在以上两个模型中,你会选择哪一个模型进行预测? 为什么?( 3 )写出你选定的回归方程,并分析回归系数的含义 4 ) 一名男性职工上月收入为30 0 0元,预测其支出 答案】(1 ) 根据已知数据, 模 型1的调整判定系数为0 .953,模型2的调整判定系数为( ) .954,二者近似相等,所以从判定系数角度看两个模型的拟合效果是一样的由于表中关于收入的统计量的P值都为0 .0 0 0 ,所以收入对于支出的影响是显著的;而在模型1中,关于t统计量的P值为0 , 466,大于一般情况下给定的显著性水平,故该变量对支出的影响不显著 2 )由 (1 ) 中的分析,模 型1中 的 “ 性别”变量没有通过检验,并且在模型2的基础上去掉该变量未使i估计标准误差明显的减少,因此可以判定,应选择模型2进行预测3 )设y表示支出,x表示收入,则选定的回归方程为:? = 639.961+ 0 .62以0回归系数2= 0 .621表示,收入每增加।个单位,支出平均增加 .621个单位 4 )当》=3 0 0 0时 ,y = 639.961 + 0 .621X 30 0 0 = 250 2.961,即当该名男性职工上月收入为30 0 0元时,其支出为250 3元。
8 .已知一组15名工人的资料,如 表 1 所示表1工人资料工人编号性别年龄文化程度技术级别1男52文盲62男3()初中33男19初中24男46高中45女47小学46男34小学27女22初中88男31高中59男55高中810男32初中511女49中专412男34初中413男34初中414男61技工7_______ 15_______男36初中_______ 4_______要求:( 1 ) 按照性别、文化程度和技术级别分别对数据进行分组 2 ) 以组距为10岁、20岁以下、60岁以上各为一组,编制频数分布表 答案】 (1 )表 2性别人数( 人)男12女3合 计15按照文化程度进行分组,如 表 3所示表 3文化程度人数( 人)文 盲1小 学2初 中7高 中3中 专1技 工1合 计15按技术等级进行分组,如表4 所示表 4技术等级人数( 人)22314652617182合 计15( 2 )编制频数分布表,如表5所示表5年龄人数( 人)20岁以下120 -30130 -40740 -50350 -60260岁以上1合计159 .已知某商店销售的三种商品的销售额及销售量增长幅度资料如表所示。
表商品计量单位销售量增长幅度( %)销售 额 ( 万元)基期报告期甲件210 0110乙公斤5150130丙米320 0220要 求 (1 )计算销售量总指数和销售量变动引起的销售额的变动 2 )计算价格总指数和价格变动引起的销售额变动 答案】(1 )由已知,销售额总指数为:, 2 P q 110 + 130 + 220 460 也 门 £ p o 4 o 10 0 + 150 + 20 0 450销售额总变动为:EP屈 - ZP M) = 4 6 0- 450 = 10 (万元)销售量总指数为:_ 1( X) x 1.0 2 + 150 x 1.0 5 + 20 0 x 1.0 3 _ 465.5ZPMo - 10 0 + 150 + 20 0 - 450=10 3.44%可见,报告期的销售量比基期增加了 3.44% ,由此增加的销售额= 465.5450 = 65 (万元) . ( 2 )由于销售额总指数= 销售量总指数X 价格总指数,所以价格总指数为:I 102.2%厂 103.44%= 98.80%可见,报告期的价格比基期下降了 1 2% , 由此减少的销售额= 15$ 10 = 5.5 ( 万元) .10 . 从总体中随机抽取了 n =200的样本,调查后按不同属性归类,得到如下结果:〃1= 28, 〃 , 二 56, “ 3= 48.〃4= 36, w5= 32依据经验数据,各类别在总体中的比例分别为:阳= 0 1,乃 2 = 0 2,^ 3= 0 .3.乃4 = 0 , 2, = 0 .2以a = 0 .1的显著性水平进行检验, 说明现在的情况与经验数据相比是否发生了变化( 用 P 值 ) 。
答案】提出假设:” : 现在情况与经验数据相比没有发生变化,玲: 现在情况与经验数据相比发生了变化由 已 知 条件可得/ 值为:, ( 28-0 .1x 20 0 ) 2 ( 56-0 .2x 20 0 ) 2 ( 48-0 .3x 20 0 )2X~ — -----! -------------- + -------------:------ + ----- :-------------0 .1x 20 0 0 .2x 20 0 0 .3x 20 0( 36-0 .2x 20 0 ) 2 ( 32 — 0 .2x 20 0 ) 2-0 .2x 20 0 - -0 .2x 20 0= 14而P ]/ ( 5-1) > 14] = 0 .0 0 7295< 0 .1 = a , 故拒绝原假设11 . 抽样调查某省50户城镇居民平均每人全年可支配收入资料,如 表1所示表 1居 民 年 人 均 可 支 配 收 入 单 位 :百元887766857492678477945860746475667855706678646587499777696871657877867882989586100667470626856835271108要 求 :( 1 ) 试根据上述资料编制频数分布表;( 2 ) 根据所编制的频数分布表绘制直方图。
答案】 ( 1 )由题中数据可得频数分布表,如 表 2 所示表 2 频数分布表帆民q人均可支配收入( 白元)M数输率( % )60以卜51060-70142870-80163280-9081690 ~ 100510100-110. 24合计_ _ _ _ _ _ _ _ _ _ _ _ _ _50100.00( 2 ) 利用E x c el可绘制直方图,如 图 1所示图 112 . 甲、乙两台机床生产同一型号的滚珠,现在从这两台机床生产的钢珠中分别抽取9 个 与 10个,测得滚珠直径的样本均值分别为孑= 61256 1mm) , 7= 149572 ( m m ) 标准差分别为5, = V( M ) 985 ( m m ) .5, = 70 X) 318( mm) 假设滚珠直径服从正态分布, 问两台机床生产的滚珠直径均值是否相同( ,= 0 2 )?附:参考数据eC ) 为标准正态分布,①( 2.33) = 0 .990 0 97, 0 > ( 1.96) = 0 .9750 0 2P(,t>tu(n)) = a , to.oi( 17) = 2.5669, p{ F ( nl, n, ) > F „( n, , n2) } = « , FUO I( 8. 9) = 5.47 ,居刈( 9. 8) = 5.91【 答案】已知4 =9 ,叼 = 1 0 , 孑 = 15」 256, 7 7 = 14.9572. s; = 0 .0 985 , 5; = 0 .0 318 0首先,对两总体方差是否相等进行显著性检验:“ 。
: : =6,% : & h £ 检验统计量的值为:尸= 生 = 竺 配 = 30 97si 0 .0 318由于心. 格 9) = -- - = 0 .169< F = 3, 0 97< ( 8, 9) = 5.47, 所以接受原假设,即两△ o . o i ( % 8)总体方差显著相等下面在两总体方差未知,但相等的条件下,对两总体均值是否相同进行检验根据题意,建立假设:a:从一必2关°由(廿) ,(宁愿卧 弋 : ; . 向8 =063|9 检 验 统 出 的 值 为 :/? 1 4-M2 - 2 9 + 10 — 2仔一万) - 3 - 〃2) 15. 1256- 14. 9572 ,t =-----7 -----= ] -----= 1. 45o. v „J - + — Jo. O6319x| 1 + — |7 % «2 V " ioj当口 = 0. 02 时 ,L/ 2( % + & -2) = /OO2/ 2( 9 + 10- 2) = 2. 5669 因为 f = 1. 458 2017年重庆工商大学统计学原理( 同等学力加试科目) 复试仿真模拟三套题( 三 )说 明 : 本资料为2017复试学员内部使用, 严格按照2017复试常考题型及难度全真模拟预测一、简答题1 ,单因素方差分析的实质是什么? 并说明单因素方差分析的步骤 答案】单因素方差分析的实质是研究一个分类型自变量对一个数值型因变量的影响单因素方差分析的步骤为:( 1 ) 按要求检验的k个水平的均值是否相等,提出原假设和备择假设 2 ) 构造检验统计量,计算各样本均值不样本总均值手, 误差平方和S S 7\ SSE和SSA.( 3 ) 计 算 样 本 统 计 瓢 =S S E /(n -k )( 4 ) 统计决策比较统计量/ 和 外 ( k - " - 攵) 的值若/ > 此 , 拒绝原假设;反之,不能拒绝原假设2 . 考虑总体参数 的估计量,简述无偏估计量与最小方差无偏估计量的定义 答案】①无偏性( unb ia sedness ) 是指估计量抽样分布的数学期望等于被估计的总体参数设总体参数为 所选择的估计量为讥如果E ( @) = O .则称 为,的无偏估计量对于待估参数,不同的样本值就会得到不同的估计值。 这样,要确定一个估计量的好坏,就不能仅仅依据某次抽样的结果来衡量, 而必须由大量抽样的结果来衡量对此, 一个自然而基本的衡量标准是要求估计量无系统偏差 尽管在一次抽样中得到的估计值不一定恰好等于待估参数的真值, 但在大量重复抽样时, 所得到的估计值平均起来应与待估参数的真值相同, 即希望估计量的均值应等于未知参数的真值,这就是无偏性的要求②最小方差无偏估计( M VUE ) 是在无偏估计类中使均方误差达到最小的估计量,即在均方误差最小意义下的最优估计, 它是在应用中人们希望寻求的一种估计量设 』 是 的一个无偏估计量,若对于 的任一方差存在的无偏估计量力, 都有Var(0)
(3 )残差平方和(SSE )是各实际观测值M与回归值酒勺离差平方和,即E(y -次 , 它是除了X对y的线性影响之外的其他因素对y变差的作用,是不能由回归直线来解释的y,变差部分其又称为误差平方和 4 )三者之间的关系:总平方和(SST)= 回归平方和(SSR) + 残差平方和(SSE)C4 .如果有百分之五的人是左撇子,而小明和他弟弟都是左撇子;那么小明和他弟弟都是左撇子这个事件的概率是不是0. 05X0. 05=0. 00257?为什么?【 答案】不是显然,小明和他弟弟都是左撇子的事件不是独立的,所以这种计算方法错误当两个事件相互独立时,P(AB)=尸(A)尸(3 )⑴当两个事件不相互独立时,尸 (A8) = P( A)P(B\ A) = P(8)P( AI B)⑵记事件A为小明是左撇子, 事件B为小明的弟弟是左撇子显然小明是左撇子和他弟弟是左撇子这两个事件不相互独立, 所以选择第二个公式计算小明和他弟弟都是左撇子这个事件的概率5 .简述程系数、c系数、V系数的各自特点.【 答案】( I ) 相关系数是描述2x2列联表数据相关程度最常用的一种相关系数它的计算公式为: =质1式中‘/=2 " ' ;'『:《 为列联表中的总频数, 也即样本量。 说9 系数适合2x2Jr列联表,是因为对于2x2列联表中的数据,计算出的 系数可以控制在0〜1这个范围2 )列联相关系数又称列联系数,简称c系数,主要用于大于2x2列联表的情况C系数的计算公式为:4Vz-+«当列联表中的两个变量相互独立时,系 数c=0,但它不可能大于1c系数的特点是,其可能的最大值依赖于列联表的行数和列数,且随着R和C的增大而增大 3 )克莱默提出了 V系数V系数的计算公式为:v =JY〃- - / - - :xm in[(R -l), (C-1)]当两个变量相互独立时,V =0:当两个变量完全相关时,v =1,所 以V的取值在0 7之间如果列联表中有一维为2 ,即min[ (R T ) , (C T ) ]=1, 则V值就等于6 .解释多元回归模型、多元回归方程、估计的多元回归方程的含义 答案】( 1 )多元回归模型:设因变量为y . k个自变量分别为不,刍, …,4 ,描述因变量y如何依赖于自变量不,出 ,…,&和误差项£的方程称为多元回归模型其一般形式可表示为:y一4+ 夕山+ 夕2%+ …+£, 式中,02 P\' Pi' > 四是模型的参数,£为误差项2 )多元回归方程:根据回归模型的假定有£( y)= 4 + 4、+ 夕2 x? + …+A 4, 称为多元回归方程,它描述了因变量y 的期望值与自变量演,A之间的关系。 3 ) 估计的多元回归方程:回归方程中的参数为,为 %A 是未知的,需要利用样本数 据 去 估 计 它 们 当 用 样 本 统 计 量 瓦 屏A,…,A 去 估 计 回 归 方 程 中 的 未 知 参 数风,4, 4 , …,凤时,就得到了估计的多元回归方程,其一般形式为:"A+RN+AW+AA式中,瓦 瓦 反,…,A 是 参 数 外B、 ,外,…,凤的估计值,9 是因变量y 的估计值其中瓦 瓦 , …,龙称为偏回归系数.二 、计算题7 .华兴镇2001年—2004年鲜蛋季度销售量费料如表1所示.表 1 单位:万吨一季度二季度三季度四季度2001 年13.113. 97. 98. 62002 年10. 811. 59. 711. 02003 年14. 617. 516. 018. 22004 年18. 420. 016. 918. 0要求:(1 ) 用移动平均法修匀数列;(2 ) 拟合线性趋势模型,测定时间数列的长期趋势并预测该镇2005年第一季度鲜蛋的销售量;(3 ) 试用按月平均法测定该数列的季节变动并分析说明其结果 答案】(1 ) 为消除季节变动,选取移动平均时距项数k = 4 , 对序列作四次移动平均,结果如表2所小。 表 2年份季度鲜蛋销售量四次中心化移动平均一13.1——2001—13.97.910.5875四8.610― ■10.89.9252002一11.510.4522.9.711.225四11.012.45一14.613.98752003二17.515.67516.017.05四18.217.8375— •18.418.26252004一20.018.3516.9四18.0(2 )利用给定的数据,由Excel可得回归结果如下:表3Multiple R0.7867030.61890R Square20.59168Adjusted R Square1标准误差2.474359观测值16表4dfSSMSFSignificance F回归分析1139.2139.222.735980.0003残差1485.714376.122455——总计15224.9144———表5Coefficients标准误差t StatP-valueLower 95%Upper1Intercept8.69251.2975656.6990861.01E-055.909511.47X Variable 10.6398530.1341914.7682260.00030.3520420.927(由表5可得线性趋势方程为:2 =8.6925+ 0.639853r由趋势方程可得2005年 第1季度鲜蛋销售量的预测值为:% = 8.6925 + ().639853 x 17 = 19.57(万吨)(3 ) 利用按月平均法测定该序列的季节变动如表6 所示。 表 6份2001200220032004同季度合计①同季平均数% =Q)4季节比率Sj ( %) - y j y113.110.814.618.456.914.225100.67213.911.517.520.062.915,725111.2937.99.716.016.950.512.62589.3548.611.018.218.055.813.9598.73同年合计43.543.066.373.3226.1y =226.1/16=14.13400.0由表6 中的季节比率可以看出,第 2 季度的季节比率最大,第 3 季度的季节比率最小,这说明鲜蛋的销售量受第2 季度影响最大,受 第 3 季度的影响最小8 .炼铝厂测得所产铸模用的硬度X 与抗张强度Y 数据如下:(1 ) 求 Y 关于X 的回归方程;X685370847厂51837064 |Y288293349343290354283324340286( 2 ) 检验所得回归直线的显著性( Q 05) :( 3 ) 预报当铝的硬度X “=65时的抗张强度工【 答案】根据表格中的数据计算可知,n L O n 10 n 10=675 , Z y = Z % = 3150 , Z M = Z M = 46659, x = 67.5 , y = 315 ,i=l i=l >=1 i=l i=l i=in JOSST = Z ( y - y) 2 = Z ( y「 315) 2 = 7870。 i=l E( i ) 设估计的回归方程为g = A + 6 x ,则根据最小二乘法解得的位置参数的计算公式可得:n Z x y - Z x g y ,------- — = 1.867( 熊 产i«l i«lA = y -A x =188.978所 以 Y 关于X 的回归方程为:y = l 88.978 + 1.867x,n 10 CCD W( 2 ) SSR = Z ( 力- 刃 2 = Z ( g _ 3 i5 ) 2=3822, “ SR = 必= "= 3822,/=1 i=i 1 1SSE = £y = /( y,- 犷= 4048. MSE = " =震= 506 .77 77 M-2 10-2& = y/MSE = 22.494, j. = , - ----- ------- = , 22494 = 0,6 79 ,e A Fn i n fio t 10归 " 论 疗 快得士,尸V曰n i=i V i=i *V 1=1线性关系的显著性检验:假设:" : 回 =0:乩 : 笈 ¥ 0计算统计量F = —= —«7.553 .查表得,月皿“ ( 1, 8) = 5.318.M S E 50 6由于F >打 , 所以拒绝小, 表明抗张强度r 和硬度x 之间的线性关系是显著的。 回归系数的显著性检验:假设: /: 4 =0: % : 4 H o计算统计量, 4 = 摆= 2.75查表得% 式8) = 2.30 6 由于r > tal2 . 拒绝原假设, , 表明硬度x 是影响抗张强度y 的一个显著性因素 3 ) 点估计:yu = 188.978 + 1.867 x 65 = 310 .333置信区间估计:九士%2久( 玉 ) 一无尸£ ( 改 -4加I=310 .333 ± 1.860 x 22.494 x — + 炉 勺 ,匚=310 .333± 4.4224 部-67.5) 2即置信区间为( 30 5.911, 314, 755)预测区间估计:=310 .333 ± 1.860 x 22.494 x 1 + — + £5 -6 7 .5 厂= 310 .333 ±46.261J 1° 泉 丫 67寸即预测区间为( 264.0 72, 356.594) 9 . 某保险公司为50 个集体投保人提供医疗保险,假设他们医疗花费相互独立,且花费( 单位为百 元 ) 服从相同的分布律:; ; : : : I 当花费超过百元时,保险公司应支付超过百元的部分;当花费不超过百元时,由患者自己负担费用。 如果以总支付费X 的期望值E( X ) 作为预期的总支付费,那么,保险公司应收取总保险费为11 + 》 E( X ) ; 其中 为相对附加保费为使公司获利的概率超过95% , 附加保费” 至少应为多少 ( 己 知 中 ( 1.41) = 0 .92, 中( 1.65 ) = 0 .95 )50【 答案】设 Y, ( i= l, 2.…, 50 ) 为保险公司支付给每个投保人的费用,且X =2 匕 则由题意知/»!Yi( i= l. 2, …, 50 ) 相互独立并且分布律为:P(yt = 0 ) = 0 .5.P( Y = 0 .5) = 0 .4, P( Z = 2) = 0 .1因此£ ( ^ ) = 0 x 0 .5 + 0 .5x 0 4 + 2x 0 .1 = 0 .4化) = E . 2 ) — ( E % - =O ? x 0 .5 + o.52 x 0 .4 + 22X0.1-0.42 = 0 .345 0 5 0£ X = £(Z Z)= 0 4 X 50 = 20,OX =£>(Z Z)= 0.34X50 = 17/ a lM那么,由中心极限定理可得:P[X <( 1 + 仍E ( X) ] = P(X:E,X) < <, D ( X) j £ ) ( X) V17= 0 ( -^ = ) = 95%V17可 得 挈 = 1.65, 0 ="竺叵=0 .34 . . 即为使公司获利的概率超过95% , 附加保费。 至少应为后 200.3410 .某银行分行1999年平均存款余额为1250万元,2003年的存款资料如表所示表时间1月1日3月1日7月1日9月1日12月31日 |存款余额(万元)15001530154015601580要 求 ( 1 ) 计算该分行2003年的平均存款余额2 )计算该分行1999年至2003年存款余额的年平均增长速度3 )根据年平均增长速度推断2005的年平均存款余额4 )若该分行计划2007年的平均存款余额达到2000万元, 那么从2003年到2007年存款余额的年平均增长速度应达到什么水平?【 答案】 ( 1 ) 2003年的平均存款余额-1-5-0-0 -+- 1-5-3-0x 2\ + -1-5-3-0-+-1-5-4--0x 4“ + -1-5-4-0-+-1-5-6-0- x 2o + -1-5-6-0-+-1-5-8-0- x 4,..2 2 2 2_______12= 1546(万元)(2 ) 1999年至2003年的年平均增长速度=竺-1 = 5.46%V 1250(3 ) 2005年的年平均存款余额为1546x(1+ 5.46%)? = 1719(万元)(4 )从 2003年 到 2007年存款余额的年平均增长速度1隈7 = 6.65%11 . 分别从上海证券市场和深圳证券市场各抽取了 25只和31只股票计算出它们的收益率,算出其样本方差分别为=0,0139, s; =O.OO53(收益率的方差可反映证券风险,方差越大,则可认为其风险越大) .试问上海证券市场与深圳证券市场的投资风险是否有显著性差异(a =0.05) ,假定收益率服从正态分布。 FO.025 ( 24, 30) =2.14, & 皿( 30, 24) =2.21)【 答案】提出假设:% : cr; = crj,储:w 3 )计算估计标准误差 4 )处用所建立的回归方程估计当广告费用为S00万元时,该企业产品的销量 答案】 (1 )产品销售量y与广告费x之间的线性回归方程为:y = 28038+ 1125x截距280.3S表示当没有广告费用支出时,其产品的平均销售量为280.38件斜率〃.25表示每当广告费用支出增加7万元时,产品销售量平均增加〃.25件 2 ) 由于总平方和(SST ) = 回归平方和(SSR ) + 剩余平方和(SSE ) , 所以7500275002+4507= 9433%由回归方程斜率为正数可知,广告费用支出与产品销售量之间存在正相关关系,则相关系数r = X/R7 = 0.9712 , 相关程度较高 3)估计标准误差=、 彦 匕 =, 已亚 =18.62V n - 2 V 13( 4 )当 x=800 时,9 = 280.38+ 11.25x800 =9280 ( 件) 。
