好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

统计学贾俊平考研知识点总结.pdf

45页
  • 卖家[上传人]:新**
  • 文档编号:567435515
  • 上传时间:2024-07-20
  • 文档格式:PDF
  • 文档大小:336.55KB
  • / 45 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 统计学重点笔记第一章导论一、比较描述统计和推断统计:数据分析是通过统计方法研究数据,其所用的方法可分为描述统计和推断统计1)描述性统计:研究一组数据的组织、整理和描述的统计学分支,是社会科学实证研究中最常用的方法,也是统计分析中必不可少的一步内容包括取得研究所需要的数据、用图表形式对数据进行加工处理和显示,进而通过综合、概括与分析,得出反映所研究现象的一般性特征2)推断统计学:是研究如何利用样本数据对总体的数量特征进行推断的统计学分支研究者所关心的是总体的某些特征,但许多总体太大,无法对每个个体进行测量,有时我们得到的数据往往需要破坏性试验,这就需要抽取部分个体即样本进行测量,然后根据样本数据对所研究的总体特征进行推断,这就是推断统计所要解决的问题其内容包括抽样分布理论,参数估计,假设检验,方差分析,回归分析,时间序列分析等等3)两者的关系:描述统计是基础,推断统计是主体二、比较分类数据、顺序数据和数值型数据:根据所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据1)分类数据是只能归于某一类别的非数字型数据它是对事物进行分类的结果,数据表现为类别,是用文字来表达的,它是由分类尺度计量形成的。

      2)顺序数量是只能归于某一有序类别的非数字型数据也是对事物进行分类的结果,但这些类别是有顺序的,它是由顺序尺度计量形成的3)数值型数据是按数字尺度测量的观察值其结果表现为具体的数值,现实中我们所处理的大多数都是数值型数据总之,分类数据和顺序数据说明的是事物的本质特征,通常是用文字来表达的,其结果均表现为类别,因而也统称为定型数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此可称为定量数据或数量数据三、比较总体、样本、参数、统计量和变量: (1)总体是包含所研究的全部个体的集合通常是我们所关心的一些个体组成,如由多个企业所构成的集合,多个居民户所构成的集合总体根据其所包含的单位数目是否可数可以分为有限总体和无限总体有限总体是指总体的范围能够明确确定,而且元素的数目是有限可数的,需要注意的是,统计意义上的总体,通常不是一群人或一些物品的集合,而是一组观测数据2)样本是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本容量例如我们从一批灯泡中随机抽取100 个,这 100 个灯泡就构成了一个样本3)参数是用来描述总体特征的概括性数字度量有总体平均数、标准差、总体比例。

      由于总体参数通常是不知道的,所以参数是一个未知的常数所以才需要进行抽样,根据样本来估计总体参数(4)样本量是用来描述样本特征的概括性数字度量统计量是根据样本数据计算出来的一个量,通常包括:样本平均数、样本标准差、样本比例等,由于样本是我们已经抽出来的,所以统计量总是知道的,抽样的目的就是要根据样本统计量推断总体参数5)变量是说明现象某种特征的概念变量的特点是从一次观察到下一次观察会呈现出差别或变化,分为分类变量、顺序变量、数值型变量、离散型变量和连续型变量第二章数据收集一、调查方案的主要内容:(1)调查目的:是调查所要达到的具体目标,他所回答的是“为什么调查”“要解决什么样的问题”等(2)调查对象和调查单位:调查对象是根据调查目的的确定的调查研究的总体或调查范围调查单位是构成调查队选中的每一个单位,它是调查项目和调查内容的承担着或载体所要解决的是“向谁调查”由谁来提供所需数据(3)调查项目和调查表:调查项目要解决的问题是“调查什么”,也就是调查的具体内容,大多数统计调查中,调查项目通常以表格的形式来表现,称为调查表二、数据的误差:统计数据的误差通常是指统计数据与客观现实之间的差距,误差的类型主要有抽样误差和非抽样误差两类。

      1)抽样误差:主要是指在用样本数据进行推断时所产生的随机误差只存在于概率抽样中这类误差通常是无法消除的,但事先可以进行控制和计算 影响抽样误差大小的因素:(a)抽样单位的数目在其他条件不变的情况下,抽样单位的数目越多,抽样误差越小;反之,越大这是因为随着样本数目的增多,样本结构越接近总体,抽样调查也就越接近全面调查,当样本扩大到总体时,则为全面调查,也就不存在抽样误差了b)总体背研究标志的变异程度在其他条件不变的情况下,总体标志的变异程度越小,抽样误差越小,反之,越大抽样误差和总体标志的变异程度呈正比变化这是因为总体的变异程度小,表示总体各单位标志值之间的差异小则样本指标与总体指标之间的差异也可能小;如果总体各单位标志值相等,则标志变动度为零,样本指标等于总体指标,此时不存在抽样误差(c)抽样方法的选择重复抽样和非重复抽样的抽样误差大小不同采用不重复抽样比采用重复抽样的抽样误差小(d)抽样组织方式不同采用不同的组织方式,会有不同的抽样误差,这是因为不同的抽样组织所抽中的样本,对于总体的代表性也不同,通常,常利用不同的抽样误差,作出判断各种抽样组织方式的比较标准2)非抽样误差:主要包括:抽样框误差,回答误差、无回答误差、调查员误差;是调查过程中由于调查者或被调查者的人为因素所造成的误差。

      调查者所造成的误差主要有:调查方案中有关的规定或解释不明确导致的填报错误、抄录错误、汇总错误等;被调查者所造成的误差主要有:因人为因素干扰形成的有意虚报或瞒报调查数据非抽样误差理论上是可以消除的三、简单随机抽样:(1)概念:从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的;(2)特点: a、简单、直观,在抽样框完整时,可直接从中抽取样本b、用样本统计量对目标量进行估计比较方便(3)局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其它辅助信息以提高估计的效率 lg(lg()2lg()lg(1nK第三章数据的整理与展示一、数据排序的目的:(1)数据排序是按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索(2)排序还有助于对数据检查纠错,以及为重新归类或分组等提供方便3)在某些场合,排序本身就是分析的目的之一二、数据分组:是根据统计研究的需要,将原始数据按照某种标准化分成不同的组别,分组后的数据成为分组数据数据经分组后再计算出各组中数据出现的频数,就形成了一张频数分布表,分组方法有单变量值分组和组距分组两种,单变量分组通常只适合于离散变量,且在变量值较少的情况下使用,在连续变量或变量值较多情况下,通常采用组距分组。

      三、组距分组的步骤和原则:(1)步骤:a、确定组数:组数的确定应以能够显示数据的分布特征和规律为目的在实际分组时,可以按 Sturges 提出的经验公式来确定组数K b、 确定组距:组距 (Class Width) 是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距= ( 最大值 - 最小值 ) ÷组数c、统计出各组的频数并整理成频数分布表(2)原则:采用组距分组时,需遵循“不重不漏 ”的原则,“ 不重”是指一项数据只能分在其中的某一组,不能在其他组中重复出现;“不漏”是指组别能够穷尽,即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏为解决不重的问题,统计分组时习惯上规定“上组限不在内 ”,即当相邻两组的上下限重叠时,恰好等于某一组上限的变量值不算在本组内,而计算在下一组内当然,对于离散变量,我们可以采 用相邻两组组限间断的办法解决“不重”的问题也可以对一个组的上限值采用小数点的形式,小数点的位数根据所要求的精度具体确定缺点:组距分组掩盖了各组内的数据分布状况四、直方图和条形图的区别:首先,条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度则是固定的;直方图是用面积表示各组频数的多少,频数的高度表示每一组的频数或频率,宽度则表示各组的组距,因此高度与宽度均有意义。

      其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列最后,条形图主要用于展示各类数据,而直方图则主要用于展示数据型数据五、绘制线图应注意的问题:(1)时间一般绘在横轴,观测数据绘在纵轴(2)图形的长宽比例要适当,一般应绘成横轴略大于纵轴的长方形,其长宽比例大致是10 :7. (3)一般情况下,纵轴数据下端应从0开始,以便于比较,数据与0之间的间距过大,可以采取折断的符号将纵轴折断六、设计统计表注意的问题:首先,要合理安排统计表的结构,例如表号、行标题、列标题、数字资料的位置应安排合理其次,表头一般应包括表号、总标题和表中数据的单位等内容,总标题应简明确切地概括出统计表的内容再次,表中的上下两条线一般用粗线,中间的其他线用细线,表的左右两边不封口,列标题之间可以用竖线分开,而行标题之间通常不必用横线隔开最后,在使用统计表时,必要时可在表下方加上注释,特别注意标明数据来源七、数据的审核:(1)原始数据:a、完整性审核:检查应调查的单位或个体是否有遗漏;所有的调查项目或指标是否填写齐全 b、准确性审核:检查数据是否真实反映客观实际情况,内容是否符合实际;检查数据是否有错误,计算是否正确等(2)二手数据:a、适用性审核:弄清楚数据的来源、数据的口径以及有关的背景材料;确定数据是否符合自己分析研究的需要b、时效性审核:尽可能使用最新的数据八、数据的整理与显示( 基本问题 ) (1)要弄清所面对的数据类型,因为不同类型的数据,所采取的处理方式和方法是不同的(2)对分类数据和顺序数据主要是做分类整理(3)对数值型数据则主要是做分组整理(4)适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并不适合于低层次的数据第四章 数据的概括性度量一、集中趋势和离散趋势的度量:(1)集中趋势 是指一组数据向某一中心值靠拢的倾向,它反映了一组数据中心点的位置所在。

      描述集中趋势所采用的测度值分为:众数、中位数和分位数、平均数2)离散趋势 是数据分布的另一个重要特征,它所反映的各变量值远离其中心值得程度,因此也称为离中趋势,数据的离散程度越大,集中趋势的测度值对该组数据的代表性越差,反之,代表性越好描述数据离散程度所采用的测度值,根据所依据的数据类型的不同主要有异种比率、四分位差、方差和标准差此外还有极差、平均差以及测度相对离散程度的离散系数二、众数、中位数和平均数:(1)三者的关系:从分布的角度看,众数始终是一组数据分布的最高峰值,中位数的处于一组数据中间位置上的值,而平均数则是全部数据的算数平均因此,对于具有单峰分布的大多数数据而言,众数、中位数和平均数之间具有以下关系: (a)如果数据的分布是对称的,众数、中位数、平均数必定相等(b)如果数据是左偏分布,说明数据存在极小值,必然拉动平均数向极小值一方靠近,而众数和中位数由于是位置代表值,不受极值的影响,因此三者的关系为众数>中位数 > 平均数(c)如果数据是右偏分布,说明数据存在极大值,必然拉动平均数向极大值的一方靠近,则众数 < 中位数 < 平均数2)特点及应用场合(a)众数 是一组数据的峰值,是一种位置代表词,不受极端值的影响,具有不唯一性,对于一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。

      虽然对于顺序数据以及数值型数据也可以计算众数,但众数主要适合于作为分类数据的集中趋势测度值b)中位数 是一组数据中间位置上的代表值,主要适合于作为顺序数据的集中趋势测度值,虽然对于顺序数据可以使用众数,但以中位数为宜c)平均数 是就数值型数据计算的,而且利用了全部数据信息,它是实际中应用最广泛的集中趋势测度值平均数主要适合于作为数值型数据的集中趋势测度值当数据呈对称分布或接近对称分布时,三个代表值相等或接近相等,这是我们应该选择平均数作为集中趋势的代表值但平均数的主要缺点是易受数据极端值得影响,对于偏态分布的数据,平均数的代表性较差因此,当数据为偏态分布,特别是当偏斜的程度较大时,我们可以考虑选择众数或中位数等位置代表词三、异种比率:是非众数组的频数占总频数的比率主要用于衡量众数对一组数据的代表程度异众比率越大,说明非众数组的频数占总频数的比重越大,众数的代表性越差反之,越小,众数的代表性越好异种比率重要适合测度分类数据的离散程度当然,对于顺序数据以及数值型数据也可以计算异种比率四、四分位差:是上四分位数与下四分位数之差反映了中间50% 数据的离散程度,其数值越小,说明中间数据越集中,数值越大,说明中间数据越分散。

      四分位差不受极值的影响主要用于测度顺序数据的离散程度,当然,对于数值型数据也可以计算四分位差,但不适合于分类数据五、方差和标准差 : 极差 是一组数据的最大值与最小值之差,也称为全距它容易受极端值的影响,由于极差只是利用了一组数据两端的信息,不能反映出中间数据的分散状况,因而不能准确描述出数据的分散程度平均差 是各变量值与其平均数离差的绝对值的平均数,平均差以平均数为中心,反映了每个数据与平均数的平均差异程度,它能全面准确的反映一组数据的离散状况平均差越大说明数据的离散程度就越大,反之,越小为了避免离差之和等于0 而无法计算平均差这一问题,平均差在计算时对离差取了绝对值,以离差的绝对值来表示总离差方差(或标准差)是实际中应用最广泛的离散程度测度值,因此它能准确的反映出数据的离散程度方差是各变量值与其平均数离差平方的平均数标准差 是方差的平方根,与方差不同的是,标准差是具有量纲的,它与变量值的计量单位相同,其实际意义要比方差清楚,因此,在对实际问题进行分析时,我们更多的使用标准差六、标准分数:标准分数是指变量值与其平均数的离差除以标准差后的差可以测度每个数据在该组数据中的相对位置,并可以用它来判断一组数据是否有离群数据,也给出了一组数据中各数值的相对位置,例如,如果某个数值的标准分数为-1.5 ,我们就知道该数值低于平均数1.5 倍的标准差。

      在对多个具有不同量纲的变量进行处理时,常常需要对各变量数值进行标准化处理标准分数具有平均数为0、标准差为1 的特性实际上,标准分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变改组数据分布的形状,而只是使该组数据的平均数为0、标准差为 1七、经验法则:经验法则表明:当一组数据对称分布时(1)约有 68% 的数据在平均数加减1 个标准差的范围之内(2)约有 95% 的数据在平均数加减2 个标准差的范围之内(3)约有 99% 的数据在平均数加减3 个标准差的范围之内八、切比雪夫不等式:如果一组数据不是对称分布,经验法则就不再适用,这时就要使用切比雪夫不等式,它对任何分布形状的数据都适用,对于任意分布形态的数据,根据切比雪夫不等式, 至少有( 1-1/ k2)的数据落在k 个标准差之内其中k 是大于 1 的任意值,但不一定是整数对于k=2 、3、4,该不等式的含义是:(1)至少有 75% 的数据在平均数加减2 个标准差的范围之内(2)至少有 89% 的数据在平均数加减3 个标准差的范围之内(3)至少有 94% 的数据在平均数加减4 个标准差的范围之内九、相对离散程度:离散系数的作用:极差、平均差、方差和标准差等都是反映数据分散程度的绝对值,其数值的大小一方面 取决于原变量值本身水平高低的影响,也就是与变量的平均数大小有关,变量值绝对水平高的,离散程度的测度值自然也就大。

      绝对水平小的离散程度的测度值自然也就小; 另一方面 ,它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同因此对于平均水平不同或者计量单位不同的不同组别的变量值,是不能用上述离散程度的测度值直接比较其离散程度的为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数离散系数是指 一组数据的标准差与其相应的平均数之比离散系数是测度数据离散程度的相对统计量,通常是就标准差来计算的,因此也称为标准差系数,离散系数的作用 主要是用于比较对不同样本数据的离散程度离散系数大的说明数据的离散程度大,离散系数小的说明数据的离散程度小十、测度数据分布形状的统计量:(1)偏态 :如果一组数据的分布的对称的,则SK=0 ,如果 SK明显不等于零,表明分布是非对称的当SK为正值时,表示正偏离差值较大,可以判断为正偏或右偏;反之,为负偏或左偏,SK的值越大,表示倾斜的程度就越大(2)峰态 :如果一组数据服从标准正态分布,则峰态系数的值等于0,若峰态系数的值明显不同于0,表明分布比正太分布更平或更尖,通常称为平峰分布或尖峰分布当 K>0 时为尖峰分布,当K<0 时为扁平分布 第五章概率与概率分布一、常见的离散型概率分布:(1)两点分布(2)二项分布: n 重伯努利试验满足下列条件:a、一次实验只有两种结果,即成功和失败,这里的成功是指感兴趣的某种特征。

      b、一次实验成功的概率是p,失败的概率是 q=1-p ,而且概率 p 对每次实验都是相同的c、实验是相互独立的d、实验可以重复进行n 次e、在 n次试验中,成功的次数对应一个离散型随机变量,用X 表示(3)泊松分布:重要特征:a、所考查的事件在任意两个长度相等的区间里发生一次的机会均等 b、所考察的事件在任何一个区间里发生与否和在其他区间里发生与否没有相互影响,即是独立的泊松分布的另一个重要用途是作为二项概率分布的近似对一个n 重伯努利实验, p 代表每次伯努利实验成功的概率,当实验次数n 相对很大,成功概率 p 相对很小,而乘积np 大小适中时,泊松分布的一般表达式与二项分布的一般表达式近似相等,(4)超几何分布:二项分布只适合于重复抽样,但在实际抽样中,很少采用重复抽样不过,当总体的元素数目N 很大而样本容量n 相对于 N 很小时,二项分布仍然适用但如果是采用不重复抽样,各次实验并不独立,成功的概率也互不相等,而且总体元素的数目很小或样本容量n 相对于N 来说较大时,二项分布就不再适用,这时,样本中成功的次数则服从超几何分布超几何分布与二项分布的关系:由于呈几何分布所描述的实验与n 重伯努利实验相似,所以超几何分布与二项分部之间也存在着十分特殊而有意义的联系,从直观上来看吗,如果总体中的元素个数N 很大,使得M 的有限变化相对于N 而言比较小,那么超几何分布趋向于二项分布。

      这是因为在N 趋于无穷大时,每次抽样的样品即使不放回,对其后代表成功的事件发生的概率也不会有太大影响,可以近似认为不变,二者恰好满足了二项分布的前提二、正态分布的曲线的性质:(1)正态曲线的图形是关于x=的对称钟形曲线,且峰值在x=处、(2)正态分布的两个参数均值和标准差一旦确定,正态分布的具体形式就唯一确定,不同参数取值的正太分布构成一个完整的正态分布族3)正态分布的均值可以是实数轴的任意数值,他决定正态曲线的具体位置,标准差相同二均值不同的正太曲线在坐标轴上体现为水平位移 (4)正态分布的标准差为大于 0 的实数,他决定正态曲线的“陡峭“或”扁平“程度越大,正太曲线越扁平;越小,正太曲线越陡峭5)当 X 的取值向横轴左右两个方向无限延伸时,正态曲线的左右两个尾端也无限渐进横轴,但理论上永远不会与之相交6)与其他连续型随机变量相同,正太随机变量在特定区间上的取值概率由正太曲线下的面积给出,而且其曲线下的面积等于1 经验法则:正态随机变量落入其均值左右各1 个标准差内的概率是68.27% 正态随机变量落入其均值左右各2 个标准差内的概率是95.45% 正态随机变量落入其均值左右各3 个标准差内的概率是99.73% 三、数据正态性的评估方法:(1)、对数据画出频数分布的直方图或茎叶图。

      若数据近似服从正态分布,则图形的形状与上面给出的正太曲线应该相似(2)、求出样本数据的四分位差Qd/s≈1.3. (3)、对数据作正太概率图若数据近似服从正态分布,则数据点将落在一条近似直线上四、什么条件下用正态分布分布近似计算二项分布的效果较好当样本容量 n 越来越大时,二项分布越来越近似服从正太分布,这时,二项随机变量的直方图的形状接近正太分布的图形形状即使对于小样本,当p=0.5 时,二项分布的正太近似仍然相当好,此时随机变量X 的分布是相对是相对于其平均值=np 对称的当平p 趋于 0 或 1 时,二项分布将呈现出偏态,但当n 变大时,这种偏斜就会消失一般来说,只有当n 大到使 np 和 n(1-p)大于或等于5 时,近似的效果就相当好五、均匀分布的直观概率意义:将区间〔 a,b〕划分为任意多个小区间随机变量X 在任何小区间上取值的概率大小与该小区间的长度成正比,而与该小区间的具体位置无关 第六章抽样与抽样分布一、比较分层抽样、系统抽样和整群抽样(1)分层抽样是指将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本优点: a、保证样本的结构与总体的结构比较相近,从而提高估计的精度b、组织实施调查方便c、既可以对总体参数进行估计,也可以对各层的目标量进行估计。

      d、分层抽样的样本分布在各个层内,从而使样本在总体中的分布比较均匀(2)系统抽样是指将总体中的所有单位(抽样单位 )按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其它样本单位优点: 操作简便,系统抽样的样本在总体中的分布一般也比较均匀,由此抽样误差通常要小于简单随机抽样,提高估计的精度缺点:对估计量方差的估计比较困难(3)整群抽样是指将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查优点是: 不需要有总体的具体名单而只要有群的名单就可以进行抽样,而群的名单比较容易得到;此外调查的地点相对集中,节省调查费用,方便调查的实施缺点是 估计的精度较差二、比较三种不同性质的分布(1)总体分布指总体中各元素的观察值所形成的相对频数的分布分布通常是未知的,可以假定它服从某种分布(2)样本分布是指从总体中抽取一个容量为n 的样本,由这n 个观察值形成的相对频数分布也称经验分布当样本容量n逐渐增大时,样本分布逐渐接近总体的分布(3)从一般意义上说,抽样分布是指样本统计量的概率分布,样本统计量的概率分布随机变量是样本统计量,如样本均值 , 样本比例,样本方差等。

      结果来自容量相同的所有可能样本;提供了样本统计量长远我们稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据三、中心极限定理随着样本容量n 的增大( n>=30 ),不论原来的总体是否服从正态分布,样本值的抽样分布都趋于正态分布,其分布的数学期望为总体均值,方差为总体方差的1/n ,这就是中心极限定理,表述为:设从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布 四、重复抽样和不重复抽样相比,抽样均值分布的标准差有何不同样本均值的方差与抽样方法有关,在重复抽样条件下,样本均值的方差为总体方差的 1/n ,即在不重复抽样条件下,样本均值的方差则需要用修正系数去修正重复抽样时样本均值的方差,即不重复抽样的样本均值的方差小于重复抽样时的样本均值的方差对于无限总体进行不重复抽样时,可以按照重复抽样来处理,对于有限总体,当N 很大,而抽样比n/N 很小时,其修正系数趋于1,这时样本均值的方差也可以按照重复抽样的样本均值的方差公式来计算五、 2 分布的性质和特点(1)分布的变量值始终为正(2)分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称(3)期望为: E(2)=n,方差为: D(2)=2n(n为自由度 ) (4)可加性:若U和V为两个独立的2分布随机变量,U~2(n1),V~2(n2), 则U+V这一随机变量服从自由度为n1+n2的2分布第七章参数估计一、评价估计量的标准实际上,用于估计的的估计量有很多,如我们可以用样本均值作为总体均值的估计量,也可以用样本中位数作为总体均值的估计量,什么样的估计量才算是一个好的估计量呢?这需要一定的评价标准:1、无偏性:估计量抽样分布的数学期望等于被估计的总体参数。

      设总体参数为,被选择的估计量为,如果 E()=,称为的无偏估计量X22nX2222X122NnNnX 2、有效性:对同一总体参数的两个无偏估计量,方差较小的是更有效的估计量3、一致性:随着样本容量的增大,点估计量的值越来越接近被估的总体的参数换言之,一个大样本给出的估计量要比一个小样本给出的估计量更接近总体的参数二、怎样理解置信区间置信区间:由样本统计量所构造的总体参数的估计区间,其中区间的最小值称为置信下限,区间最大值称为置信上限是一个随机区间,的置信区间意味着,置信区间包含未知参数的概率为,这个区间会随着样本观察值的不同而不同但100 次运用这个区间,约有100()个区间能包含参数,也就是说大约还有100 a 个区间不包含总体参数判断置信区间优势的标准(好的置信区间的特性):置信度越高越好;置信区间宽度越小越好三、影响区间宽度的因素1. 总体数据的离散程度,用 s 来测度2.样本容量:当置信水平固定时,置信区间的宽度随着样本容量的增大而减小,换言之,较大的样本所提供的有关总体的信息要比小样本多3. 置信水平 (1 - a),影响z 的大小 :置信水平越大,z 越大四、简述样本容量与置信水平、总体方差、估计误差的关系??=( ???????)??????(1)样本量与置信水平呈正比,在其他条件不变的情况下,置信水平越大,所需的样本容量也就越大(2)样本量与总体方差呈正比,总体的差异越大,所需的样本容量就越大(3)样本量与边际误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量就越小五、 ????????√ ??的含义是什么? Zα2是标准正态分布上侧面积为α2时的 z 值。

      Zα2σ√ n是估计总体均值时的边际误差,也称为估计误差或误差范围六、对两个总体均值之差的小样本估计中,对两个总体和样本都有哪些假定(1)两个总体都服从正态分布(2)两个随机样本独立地分别抽自两个总体七、解释 95% 的置信区间抽取 100 个样本,根据每个样本构造一个置信区间,这样由100 个样本构造的总体参数的 100 个置信区间中, 95% 的区间包含了总体参数的真值,而5%没包含八、对于总体比例的估计,确定样本容量是否“足够大“的一般经验规则是:区间p ? 2√p(1 - p) 2? 中不包含 0 或 1.或要求 np≥5 和 n(1-p)≥5 八、独立样本和匹配样本如果两个样本是从两个总体中独立抽取的,即一个样本中的元素与另一个样本中的元素相互独立,则称为独立样本匹配样本是指一个样本中的数据与另一个样本中的数据相对应九、估计量和估计值(1)估计量:用于估计总体参数的随机变量如样本均值,样本比例、样本方差等例如 : 样本均值就是总体均值m 的一个估计量参数用表示,估计量用表示(2)估计值:估计参数时计算出来的统计量的具体值如果样本均值x=80 ,则 80 就是 m 的估计值? 第八章假设检验一、参数估计和假设检验的区别和联系(1)主要联系:a.都是根据样本信息推断总体参数;b.都以抽样分布为理论依据,建立在概率论基础之上的推断,推断结果都有风险;c.对同一问题的参数进行推断,使用同一样本,同一统计量,同一分布,二者可相互转换(2)主要区别:a.参数估计是以样本信息估计总体参数的可能范围,假设检验是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立; b.区间估计求得的是求以样本估计值为中心的双侧置信区间,假设检验既有双侧检验,也有单侧检验;c.区间估计立足于大概率,通常以较大的可信度(1-a)去估计总体参数的置信区间。

      假设检验立足于小概率通常是给定很小的显著性水平a 去检验总体参数的先验假设是否正确二、什么是假设检验中的显著性水平?统计显著是什么意思?(1)显著性水平是当原假设正确时却被拒绝的概率或风险,即假设检验中犯弃真错误的概率,通常用α 表示,它是人们根据经验的要求确定的,通常取α= 0.05 或 0.01显著性水平是人们事先指定的犯第Ⅰ类错误概率α 的最大允许值,确定了显著性水平α ,就等于控制了第Ⅰ类错误的概率但犯第Ⅱ类错误的概率 β 却是不确定的(2)统计显著值在原假设为真的条件下,用于检验的样本统计量的值落在了拒绝域内,作出了拒绝原假设的决定三、什么是假设检验的两类错误及其数理关系怎样 (1)假设检验中所犯的错误有两种:一类错误是原假设为真却别拒绝了,犯这类错误的概率用 α 表示,也称第Ⅰ类错误另一类错误是原假设为假却没有拒绝,犯这种错误的概率用β表示,也称第Ⅱ类错误(2)当α增加时 β减小,当 β增大时 α减小,要使 α 和β 同时减小的唯一办法是增加样本容量四、假设检验的步骤(1)陈述原假设 H0和备择假设 H12)从所研究的总体中抽出一个随机样本(3)确定一个适当的检验统计量,并利用样本数据算出其具体数值(4)确定一个适当的显著性水平,并计算出其临界值,指定拒绝域(5)将统计量的值与临界值进行比较,作出决策。

      统计量的值落在拒绝域,拒绝H0,否则不拒绝 H0,或者也可以直接利用P值作出决策五、建立原假设和备择假设的原则(建立假设的几点认识)(1)原假设和备择假设是一个完备事件组,且相互独立(2)在建立假设时,通常是先确定备择假设,然后再确定原假设(3)在假设检验中,等号“ = ”总是放在原假设上这是因为我们想涵盖备择假设 H1不出现的所有情况(4)这样的假设本质上带有一定的主观色彩,在面对某一实际问题,由于不同研究者有不同的研究目的,即使对同一问题也可能提出截然相反的原假设和备择假设,这并不违背假设的最初定义,只要符合研究的最终目的就是合理的六、单双侧检验的区别备择假设具有特定的方向性,并含有“< ”或“ >”的假设检验,称为单侧检验或单尾检验备择假设没有特定的方向性,并含有符号“≠ ”的假设检验,称为双侧检验或双尾检验 在单侧检验中,由于研究者感兴趣的方向不同,又可分为左侧检验和右侧检验七、检验统计量的特征和用途检验统计量是指根据样本观测结果计算得到的,并据以对原假设和备择假设做出决策的某个样本统计量检验统计量实际上是总体参数的点估计量,只有将其标准化后,才能用以度量它与原假设的参数值之间的差异程度。

      而对点估计量标准化的依据则是:a、原假设 H0为真; b、点估计量的抽样分布实际上,假设检验中所用的检验统计量都是标准化检验统计量,它反映了点估计量与假设的总体参数相比相差多少个标准差八、拒绝域面积与 ?? 大小的关系当样本容量固定时,拒绝域的面积随着α 的减小而减小 α越小,拒绝原假设所需要的检验统计量的临界值与原假设的参数值就越远拒绝域的位置取决于检验是单侧检验还是双侧检验,双侧检验的拒绝域在抽样分布的两侧,而单侧检验中,如果备择假设具有符号“<”,拒绝域位于抽样分布的左侧,故称为左侧检验如果备择假设具有符号“>”,拒绝域位于抽样分布的右侧,故称为右侧检验九、显著性水平 ?? 的局限性显著性水平 α 实在检验之前确定的,这也就意味这我们事先确定了拒绝域这样,不论检验统计量的值是大还是小,只要他的值落入拒绝域就拒绝原假设,否则不拒绝原假这种固定的显著性水平α 对检验结果的可靠性起一种度量作用但不足的是, α 是犯第Ⅰ类错误的上限控制值,它只能提供检验结论可靠性的一个大致范围,而对于一个特定的假设检验问题,却无法给出观测数据与原假设之间不一致程度的精确度量,也就是说,仅从显著性水平比较,若选择的α 值相同,所有的检验结果的可靠性都一样。

      十、 P值较小时为什么要拒绝原假设 P 值是指在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率 P值是反映实际观测到的数据与原假设H0之间不一致程度的一个概率值P值越小,说明实际观测到的数据与H0之间不一致的程度就越大,检验的结果也就越显著十一、显著性水平 ?? 与 P值得区别(1)α 的含义是当原假设正确时却被拒绝的概率或风险,即假设检验中犯弃真错误的概率,是有人们根据检验的要求确定的,通常α= 0.05 或 0.01而 P值是原假设为真时所得到的样本观察结果或更极端结果出现的概率,它是通过计算得到的, P值得大小取决于三个因素:样本数据与原假设之间的差异、样本量、被假设数据的总体分布(2)α 只能提供检验结论的可靠性地一个大致范围,而对于一个特定的假设检验为题,却无法给出观测数据与原假设之间不一致程度的精确度量即仅从显著性水平来比较,如果选择的α 值相同,所有检查结果的可靠性都一样而 P值可以测量出样本观察数据与原假设中假设的值的偏离程度十二、总体均值的检验在对总体均值进行假设检验时,采用什么检验步骤和检验统计量取决于我们所抽取的样本是大样本(n≥30)还是小样本( n≤30),此外还需要区分总体是否服从正态分布、总体方差σ2是否已知等几种情况。

      1)大样本的检验方法:样本均值经过标准化后服从正态分布,设假设的总体均值为 μ0,当总体方差 σ2已知时,总体均值检验的统计量为:当总体方差未知时,可以用样本方差s2来近似代替总体方差,此时总体均值检验的统计量为(2)小样本的检验方法:总体方差σ2已知时,即使在小样本下,检验统计量仍然服从正太分布,因此仍然按照来计算0) 1 , 0(~0NnXZ0) 1 , 0(~0NnSXZ0) 1 ,0(~0NnXZ 总体方差σ2未知时,需要用样本方差s2代替总统方差σ2,此时检验统计量服从自由度为 n-1 的 t 分布因此需要采用t 分布来检验总体均值,通常称为“t 检验”检验的统计量为:第九章方差分析与实验设计一、方差分析的概念及理解方差分析是指检验多个总体均值是否相等的统计方法所采用的方法就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响它研究的是多哥总统均值是否相等的统计方法,但本质是研究分类型自变量对数值型因变量的影响二、方差分析和回归分析的区别和联系区别:(1)方差分析中沿水平轴的自变量是分类变量;而回归分析沿水平轴的自变量是数值型变量2)方差分析中,既然自变量是分类变量,就可以把它放在水平轴的任意位置上;而回归分析的自变量是数值型变量,它在水平轴上的位置是从按小到大的数值排列的,因此只有一种方式来放这些数值,并且可以画出一条穿过这些点的直线。

      3)方差分析是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响;而回归分析是根据一组样本数据确定出变量之间的数学关系式,然后对关系式的可信程度进行各种统计检验,并找出哪些变量的影响是显著的,哪些不显著等三、方差分析中的基本原理(1)方差分析是通过对数据误差来源的分析来判断不同总体的均值是否相等,进而分析自变量对因变量是否有影响(2)数据的误差是用平方差来表示的,包括组内误差和组间误差(3)组内误差只包含随机误差,而组间误差既包括随机误差,又包括系统误差nSXt0 (4)如果组间误差只包括随机误差,而没有系统误差,这时,组间误差与组内误差经过平均后的数值就应该很接近,他们的比值就会接近1;(5)反之,如果组间误差既包括随机误差又包括系统误差,这时,组间误差与组内误差经过平均后的数值,他们的比值就会大于1;(6)当这个比值大到某种程度时,我们就可以说因素的不同水平之间存在着显著的差异,也就是自变量对因变量有影响四、方差分析中的基本假定(1)每个总体都应服从正态分布也就是说,对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本(2)各个总体的方差必须相同。

      也就是说,各组观察数据是从具有相同方差的总体中抽取的(3)观察值是独立的在上述假定成立的前提下,要分析自变量对因变量是否有影响,实际上也就是要检验自变量的各个水平(总体)的均值是否相等五、方差分析和总体均值的t 检验或 z 检验有何不同?优势是什么(1)不同:总体均值的t 检验或 z检验,只能研究两个样本,若要检验多个总体均值是否相等那么作这样的两两比较将十分繁琐,共需进行Cn2次不同的检验,如果α =0.05 ,那么每次检验犯第Ⅰ类错误的概率都是0.05 ,做多次检验会使第Ⅰ类错误的概率相应增加而方差分析方法则同时考虑所有的样本,因此除了错误累计的概率,从而避免了拒绝一个真是的原假设2)优势:方差分析不仅可以提高检验的概率,同时由于他是将所有的样本信息结合在一起,也增加了分析的可靠性六、要检验多个总体均值是否相等时,为什么不做两两比较,而用方差分析方法?方差分析不仅可以提高检验的概率,同时由于他是将所有的样本信息结合在一起,也增加了分析的可靠性检验多个总体均值是否相等时,如果做两两比较,需要进行多次的t 检验随着增加个体显著性检验的次数,偶然因素导致的差别的可能性会增加(并非均值真的存 在差别),而方差分析则是同时考虑所有的样本,因此排除了错误累积的概率,从而避免拒绝一个真实的原假设。

      七、方差分析的步骤(1)提出假设,按要求检验的k 个水平的均值是否相等,提出原假设和备择假设2)构造检验的统计量,计算各样本均值xi? ,样本总均值 x ?,误差平方和SST、SSA、SSE F=SSA k-1?SSE n-k?=MSAMSE(3)统计决策,比较统计量F 和Fα(k-1,n-k) 的值,若 F>Fα,则拒绝原假设,反之不拒绝原假设八、解释水平项误差平方和与误差平方和(1)水平项误差平方和,简称SSA,是各组平均值与总平均值的误差平方和,反映各总体的样本均值之间的差异程度,因此又称为组间平方和,其计算公式为(2)误差项平方和,简称为SSE,它是每个水平或组的各样本数据与其组平均值误差的平方和,反映了每个样本个观测值的离散状况,因此又称为组内平方和或残差平方和,该平方和实际上反映的是随机误差的大小,其计算公式为九、解释组内方差和组间方差的含义SSA的均方(组间均方)记为MSA,也称组间方差,其计算公式为MSE 的均方(组内均方)记为MSE,也称组内方差,其计算公式为十、方差分析中效应的意义 SSA 是对随机误差和系统误差的大小的度量,它反映了自变量对因变量的影响,也称自变量效应或因子效应。

      SSE 是对随机误差的大小的度量,它反映了除自变量对因变量的影响之外,其他因素对因变量的总影响,因此SSE 也称为残差变量,它所引起的误差也称为残差效应kiikinjii1112kiiikinjixxnxxSSAi12112kinjiiji112kinjiijixxSSE1121kSSAMSAknSSEknSSEMSEkiiikinjii12112kiiikinjixxnxxSSAi12112kinjiiji112kinjiijixxSSE112 SST 是全部数据总误差程度的度量,它反映了自变量和残差变量的共同影响,因此他等于自变量效应加残差效应SST = SSA + SSE 十一、多重比较方法的作用:它是通过对总体均值之间的配对比较来进一步检验到底哪些均值之间存在差异十二、交互作用:是一因素对另一因素的不同水平有不同的效果,如对于双因素方差分析,有交互作用就是两个因素搭配在一起,对应变量产生的一种新的效应十三、解释无交互作用和有交互作用的双因素方差分析在双因素方差分析中,由于有两个影响因素,若这两个因素是相互独立的,我们分别判断这两个因素对因变量的影响,这时的双因素方差分析称为无交互作用的双因素方差分析,或称为无重复因素分析。

      如果出了两个因素的单独影响外,两因素的搭配还会对因变量产生一种新的效应,这时的双因素方差分析就是有交互作用的双因素方差分析十四、 R2的含义和作用(1)单因素方差分析中,R2表示自变量平方和(SSA)及残差平方和 (SSE)占总平方和(SST)的比例大小,其平方根R就可以用来测量两个变量之间的关系强度(2)无交互作用的双因素方差分析中,行自变量平方(SSR)和和列自变量的平方和(SSC) 加在一起则度量了两个自变量对因变量的联合效应,联合效应与总平方和的比值定义为R2,其平方根R 反映了这两个自变量合起来与因变量之间的关系强度(3)有交互作用的方差分析:R2 =SSR+SSC+SSRCSST十四、为什么双因素方差分析中,误差平方和与P值明显小于单因素方差分析中的任何一个平方和?是因为在双因素方差分析中,误差平方和不包括两个自变量中的任何一个,因而减少了残差效应而在分别作单因素方差分析时,将行因素作为自变量时,列变量被kinjiji112kinjijixxSST112))2总平方和组间平方和)()(2总平方和组间平方和SSTSSAR总效应联合效应2SSTSSCSSRR总效应联合效应2 包含在残差中,同样,将列因素作为自变量是,行变量被包含在残差中。

      因此,对于两个自变量而言,进行双因素方差分析要优于分别对两个因素进行单因素方差分析十五、完全随机化设计、随机化区组设计、因子设计(1)完全随机化设计指“ 处理”被随机地指派给试验单元的一种设计、对完全随机化设计的数据采用单因素方差分析(2)随机化区组设计是指先按一定规则将试验单元划分为若干同质组,称为“区组分组后再将每个品种(处理)随机地指派给每一个区组的设计就是随机化区组设计试验数据采用无重复双因素方差分析(3)因子设计指考虑两个因素(可推广到多个因素)的搭配试验设计称为因子设计该设计主要用于分析两个因素及其交互作用对试验结果的影响试验数据采用可重复双因素方差分析第十章一元线性回归一、简述相关系数的性质相关系数是指根据数据计算的对两个变量之间线性关系强度的度量值若相关系数是根据总体全部数据计算的,称为总体相关系数,记为;若是根据样本数据计算的,则称为样本相关系数,记为r,样本相关系数的计算公式:性质:(1)r的取值范围是 [-1,1] ; |r|=1 ,为完全相关,r =1 ,表明 x 与 y 之间为完全正线性相关关系,r =-1 ,表明 x 与 y 之间为完全负线性相关关系;r = 0 ,表明 x 与y 之间不存性相关关系相关,-1r <0 ,表明 x 与 y 之间为负线性相关,0

      改变x 和 y 的数据原点和计量尺度,并不改变 r 的大小(4)r 仅仅是 x 和 y 之间的线性关系的度量,不用于描述非线性关系,这意味着,r=0 指标是两个变量之间不存性相关关系,但并说明变量之间没有任何关系,如2222y2222yynxxnyxxynr 可能存在非线性相关关系变量之间的非线性相关程度较大时,就可能会导致r=0. 因此当 r=0 或很小时,不能轻易得出两个变量之间不存在相关关系的结论,而应结合散点图作出合理的解释5)r 虽是两变量之间线性关系的度量,却并不意味着x 和 y 之间一定有因果关系二、利用相关关系如何判断变量之间相关的方向和相关的密切程度?(1)r 的取值范围是 [-1,1] ; |r|=1 ,为完全相关,r =1 ,表明 x 与 y 之间为完全正线性相关关系,r =-1 ,表明 x 与 y 之间为完全负线性相关关系;r = 0 ,表明 x 与y 之间不存性相关关系相关,-1r <0 ,表明 x 与 y 之间为负线性相关,0

      相关程度分为以下几种情况:当|r|≥0.8 时,可视为高度相关;0.5 |r|<0.8 时,可视为中度相关;当0.3 |r|<0.5 时,视为低度相关;|r|<0.3 时,说明两变量之间的相关程度极弱,可视为不线性相关但这种解释必须建立在对相关系数的显著性进行检验的基础之上三、为什么对相关系数进行显著性检验?一般情况下,总体相关系数是未知的,我们通常是根据样本相关系数r 作为的近似估计值但由于r 是根据样本数据计算出来的,他受到抽样波动的影响由于抽取的样本不同, r 的取值也不同,因此r 是一个随机变量能否根据样本相关系数说明总体的相关程度?这就需要考察样本相关系数的可靠性,即进行显著性检验四、样本容量对r 的影响及 r 与的关系当样本数据来自正态总体时,随着n 的增大, r 的抽样分布趋于正态分布,尤其是在总体相关系数更小或接近0 时,趋于正态分布的趋势就非常明显,而当远离 0时,除非 n 非常大,否则r 的抽样分布呈现一定的偏态因为当r 是围绕的周围分布的,当的数值接近1 或-1 时,如=0.96 时,两个方向变化的全距不等,因此r的抽样分布也不可能对称但当=0 时,两个方向的变化的全距接近相等,所以r 的抽样分布就接近对称了。

      总之,当为较大的正值时,r 呈现左偏分布;当为较小的负值时, r 呈现右偏分布只有当接近 0,而样本容量n 很大时,才能认为r 是接近于正态分布的随机变量五、 r 的显著性检验的步骤1.提出假设:H0:;H1: 0 2.计算检验的统计量3、进行决策确定显著性水平,并作出决策若t>t,拒绝H0,表明总体的两个变量之间存在显著的线性关系;若t

      b、相关分析只关注变量间的联系程度,不关注具体的依赖关系;而回归分析则更加关注变量间的具体依赖关系c、从研究的目的上看,相关分析时用一定的数量指标(相关系数)度量相互联系的方向和程度;而回归分析却是寻求变量间联系的具体数学形式,是要根据自变量的固定值去估计和预测因变量的平均值七、回归分析主要解决的问题:(1)从一组数据出发,确定出变量之间的数学关系式(2)对这些关系是的可信程度进行各种统计检验,并不影响某一特定变量的诸多变量中找出哪些变量的影响是显著的,哪些是不显著的(3)利用所求的关系式,根据一个或几个变量的取值来估计或预测另一个特定变量的取值,并给出这种估计或预测的置信度八、一元线性回归模型的基本假定(1)误差项ε是一个期望值为0 的随机变量,即E(ε)=0 对于一个给定的x 值,y 的期望值为E ( y ) =0+ 1 x(2)对于所有的x 值,ε的方差σ2 都相同)2(~122ntrnrt (3)误差项ε是一个服从正态分布的随机变量,且相互独立即ε~N( 0 ,σ2 ) 独立性意味着对于一个特定的x 值,它所对应的ε与其他x 值所对应的ε不相关因此,对于一个特定的x 值,它所对应的y 值与其他x 所对应的y 值也不相关(4)因变量 y 与自变量 x 之间具有线性关系(5)在重复抽样中,自变量x 的取值是固定的,即假定x 是非随机的注:前三项也即在回归分析中的误差序列ε的基本假定九、参数的最小二乘估计的基本原理对于第 i 个 x 值,估计的回归方程可表示为:对于 x 和 y 的 n 对观察值,用于描述其关系的直线有多条,究竟用哪条直线来代表两个变量之间的关系,需要有一个明确的原则。

      我们自然会想到距离各观测点最近的一条直线,用最小化观察值与估计值的离差平方和来估计参数和的方法称为最小二乘法,是使得因变量的观察值与估计值之间的离差平方和达到最小来求得和的方法十、回归分析中模型参数的最小二乘估计和具有哪些统计特性?若参数用于预测,影响预测精度的因素有哪些?(1)统计特性:a、线性,即估计量和为随机变量的y 的线性函数 b 、无偏性,和分别是和的无偏估计 c 、有效性,和是所有线性无偏估计量中具有最小方差的估计量(2)影响预测精度的因素:a、预测的信度要求,同样的情况下,要求预测的把握度越高,则相应的预测区间就越宽,精度就越低010?1?0?1?0?1?0?1?010?1?10xy10??? b、总体 y 分布的离散程度 σ2σ2越大,预测区间越宽,预测精度越低c、样本观测点的多少nn 越大,预测区间越窄,预测精度越高d、样本观测点中,解释变量x 分布的离散程度,x 分布越分散,越策精度越高e、预测点 x0离样本分布中心 x ?的距离距离越远,预测区间越宽,预测精度越低,反之越高十一、解释总平方和SST 、回归平方和SSR 、残差平方和SSE的含义,并说明它们之间的关系(1) 用实际观测值y 与其均值 y ?的离差平方和表示总平方和(SST),反映因变量的n 个观察值与其均值的总离差(2) 回归平方和 (SSR) 是回归值 y ?与均值 y ?的离差平方和,反映是由于x 与y 之间的线性关系引起的y 的取值变化部分,它是可以由回归直线来解释的y的变差部分(3) 残差平方和(SSE) 是各实际观测点与回归值的残差y-y ?的平方和 ,反映除x 以外的其他因素对y变差的作用,也称为不可由回归直线来解释的y 变差部分三个平方和的关系为:SST=SSR+SSE 十二、判定系数 ????的含义和作用(1)判定系数 R2指回归平方和占总离差平方和的比例,公式为(2)反映回归直线对观测数据的拟合程度(3)如果所有观测点都落在直线上,残差平方和SSE=0,R2=1 ,拟合是完全的;如果 y 的变化与 x 无关, x 无助于解释y 的变差,此时 y ?= y ?,则R2=0 。

      可见, R2的取值范围在 [ 0 , 1 ] 之间(4)R2 1,说明回归平方和占总平方和的比例越大,回归直线与各观测点越接近,用 x 的变化来解释y 值变差的部分就越多,回归方程拟合的越好;R20,说明回归方程拟合的越差(5)判定系数等于相关系数的平方,即R2=(r)2niiniiniinii121212122niiniiniiniiyyyyyyyySSTSSRR121212122??1? 十三、回归分析结果的评价(1)所估计的回归系数的符号 与事先预期的一致2)如果理论认为y 与 x 之间的关系不仅是正的,而且是统计上显著的,那么所建立的回归方程也应该如此3)回归模型在多大程度上解释了因变量y 取值的差异?可用判定系数来回答(4)考察关系误差项ε的正态性假定是否成立,因为在对线性关系进行F 检验和对回归系数进行t 检验时,都要求误差项ε 服从正太分布,否则,所用的检验程度将是无效的,检验ε 正态性的简单方法是画出残差直方图十四、估计标准误差估计标准误差是指均方残差(MSE)的平方根估计标准误差是对各观察点在直线周围分散程度的一个度量值,它是对误差项ε的标准差??的估计,计算公式为估计标准误差 sy可以看做是在排除了x 对 y 的线性影响后,y 随机波动大小的一个估计量。

      从估计标准误差的实际意义看,它反映了用估计的回归方差预测因变量y 时预测误差的大小若各观测点越靠近直线, sy越小,回归直线对各观测点的代表性就越好,根据估计的回归方程进行预测也就越准确;若各观测点全部落在直线上则sy=0 此时用自变量来预测因变量时是没有误差的回归直线是对n 个观测点拟合的所有直线中,估计标准误差最小的一条直线十五、回归分析中,F 检验和 t 检验各有什么作用(1)一元回归中, F 检验的作用 :线性关系的检验是检验自变量x 和因变量 y 之间的线性关系是否显著,或者说,他们之间能否用一个线性模型 y = β 0+ β1 x + ε 来表示 t 检验的作用 :回归系数的显著性检验是要检验自变量对因变量的影响是否显著的问题2)一元线性回归中,自变量只有一个,F 检验和 t 检验是等价的,也就是说,如果H0:β1=0 被 t 检验拒绝,他也将被F 检验拒绝但在多元回归分析中,这两种检验的意义是不同的,F 检验只是用来检验总体回归系数的显著性,而t 检验则是检验各个回归系数的显著性十六、线性关系的检验步骤和回归系数的检验步骤1?niiiy12MSEnSSEnyysniiiy22?12 niiyxxxxnsnty1220201)2(?niiyxxxxnSnty12202011)2(?(1)线性关系的检验步骤:第一步:提出假设,H0:1=0 线性关系不显著第二步:计算检验统计量F第三步:作出决策:确定显著性水平,并根据分子自由度1 和分母自由度n-2找出临界值F若F>F,拒绝H0;若Ft,拒绝H0;t

      预测区间要比置信区间宽一些)2,1(~21nFMSEMSRnSSESSRF1?1)2(~?1?1ntst 十八、残差分析的作用:(1)用于判断有关模型的假定是否成立(如误差项ε 的假定是否成立)(2)用于分析回归中的异常值和对模型有影响的观测值十九、影响区间宽度的因素(1)置信水平( 1- ),区间宽度随置信水平的增大而增大2)数据的离散程度(s),区间宽度随s的增大而增大(3)样本容量,区间宽度随样本容量的增大而减小(4)用于预测的 x0与x ?的差异程度,区间宽度随x0与x ?的差异程度的增大而增大第十一章多元线性回归一、解释多元线性回归模型、回归方程、和估计的多元回归方程的含义(1)多元线性回归模型:描述因变量y 如何依赖于自变量x1, x2,⋯, xp和误差项的方程,称为多元回归模型涉及p 个自变量的多元回归模型可表示为y= β0 + β1x1 + β2x2 + ⋯+ βpxp+ ε?其中, β0、β1、β2、βp是参数,是误差项(2)回归方程:描述因变量 y 的平均值或期望值如何依赖于自变量x1、x2、xp的方程 ; 多元线性回归方程的形式为 E( y ) = β0+ β1x1+ β2x2+ ? + βpxp(3)估计的多元回归方程:由于回归方程中的β0、β1、β2。

      βp是不知道的,需要利用样本数据去估计它们,当我们用用样本统计量β0?、β1?、β2?βp?估计回归方程中的参数β0、β1、β2βp时就得到了估计的多元线性回归方程,其一般形式为:y ?= β0? + β1?x1 + β2?x2 + ⋯+ βp?xpβ0?、β1?、β2?βp?被称为偏回归系数二、多元线性回归模型中,对误差项?? 有三个基本假定:(1)误差项ε是一个期望值为0 的随机变量,即E(ε)=0 对于一个给定的x1、x2、xp的值,y 的期望值为 E( y ) = β0+ β1x1+ β2x2+ ? + βpxp(2)对于所有的 x1、x2、xp值,ε的方差σ2 都相同 (3)误差项ε是一个服从正态分布的随机变量,且相互独立即ε~N( 0 ,σ2 ) 独立性意味着对于自变量x1、x2、xp的值,它所对应的ε与其他 x1、x2、xp的任意一组其他值所对应的ε不相关正态性意味着对于给定的x1、x2、xp的值,因变量y 也是一个服从正态分布的随机变量三、多元线性回归模型中的基本假定(1)误差项ε是一个期望值为0 的随机变量,即E(ε)=0 对于一个给定的x1、x2、xp的值,y 的期望值为 E( y ) = β0+ β1x1+ β2x2+ ? + βpxp(2)对于所有的 x1、x2、xp值,ε的方差σ2 都相同(3)误差项ε是一个服从正态分布的随机变量,且相互独立。

      即ε~N( 0 ,σ2 ) 独立性意味着对于自变量x1、x2、xp的值,它所对应的ε与其他 x1、x2、xp的任意一组其他值所对应的ε不相关正态性意味着对于给定的x1、x2、xp的值,因变量y 也是一个服从正态分布的随机变量(4)自变量 x1、x2、xp是非随机的,固定的且相互之间互不相关(无多重共线性)四、若这些假定不成立的应对方法?(1)若模型中存在多重共线性,解决的方法是:第一、将一个或多个相关的自变量从模型中剔除,使保留的自变量尽可能不相关;第二、如果要在模型中保留所有的自变量,则应避免根据t 统计量对单个参数进行检验;对因变量值的推断(估计或预测)的限定在自变量样本值的范围内(2)若模型中存在序列相关时,解决的方法有:如果误差项ε 不是相互独立的,则说明回归模型存在序列相关性,这时首先要查明序列相关产生的原因,如果是回归模型选用不当,则应改用适当的模型;如果是缺少重要的自变量,则应增加自变量;如果以上两种方法都不能消除序列相关性,则需要采用迭代法,差分法等方法处理3)若模型中存在异方差时,解决的方法有:当存在异方差时,普通最小二乘估计不再具有最小方差线性估计的性质,而加权最小二乘估计则可以改进估计的性质。

      加权最小二乘估计对误差项方差小的项加一个大的权数,对误差项方差大的项加一个小的权数,因此加强了小方差性的地位,使离差平方和中各项的作用相同五、多元回归中为什么需要用修正的判定系数来比较方程的拟合程度?如何计算由于自变量个数的增加,将影响到因变量中被估计的回归方程所解释的变差数量当增加自变量时,会使得预测误差变得比较小,从而减少残差平方和SSE,由于回归 平方和 SSR=SST-SSE,当 SSE变小时, SSR就会变大,从而使R 2变大如果模型中增加一个自变量,即使这个自变量在统计上并不显著,R2也会变大因此,为避免增加自变量而高估R2,统计学家提出用样本容量n 和自变量p去修正R2,计算出修正的多重判定系数修正后的判定系数不会由于模型中自变量个数的增加而越来越接近于1其计算公式为:六、解释多重判定系数R2和调整的多重判定系数的含义和作用?(1)多重判定系数:是指回归平方和占总平方和的比例多重判定系数是估计多元线性回归方程拟合程度的度量,反映了在因变量取值的变差中,能被估计的多元回归方程所解释的比例,计算公式为R2=SSRSST=1-SSESST(2) 修正的多重判定系数:是指用样本容量n和自变量的个数p修正的多重判定系数。

      它同时考虑了样本容量和模型中参数的个数p 的影响,这就使得Ra2的值永远小于R2,而且 Ra2的值不会由于模型中自变量个数的增加而越来越接近1七、多元线性回归中,为什么对整个回归方程进行检验后,还要对每个回归系数进行检验?线性关系的检验主要是检验因变量同多个自变量的线性关系是否显著,在p 个自变量中,只要有一个自变量同因变量的线性关系显著,F 检验就通过,但这不一定意味着每个自变量同因变量的关系都显著回归系数检验则是对每个回归系数分别进行单独的检验,它主要用于检验每个自变量对因变量的影响是否显著如果某个自变量没有通过检验,这就意味着这个自变量对因变量的影响不显著,也许就没有必要将这个自变量放入回归模型中了八、 F 检验和 t 检验的区别:在一元线性回归中,线性关系的检验(F 检验)和回归系数的检验(t 检验)的等价的,但在多元回归中,这两种检验就不再等价线性关系的检验主要是检验因变量同多个自变量的线性关系是否显著,在p 个自变量中,只要有一个自变量同因变量的线性关系显著, F 检验就通过,但这不一定意味着每个自变量同因变量的关系都显著回归系数检验则是对每个回归系数分别进行单独的检验,它主要用于检验每个自变量对因变量的影响是否显著。

      如果某个自变量没有通过检验,这就意味着这个自变量对因变量的影响不显著,也许就没有必要将这个自变量放入回归模型中了 九、多重共线性及产生的问题(即多重共线性对回归分析的影响)(1)含义:指回归模型中两个或两个以上的自变量彼此相关时,称回归模型中存在多重共线性(2)存在的问题:首先、可能会使回归的结果造成混乱,甚至会把分析引入歧途;其次、可能对参数估计值的正负号产生影响,特别是各回归系数的正负号有可能同我们与其的正负号相反十、如何识别多重共线性:检测多重共线性的方法很多,其中最简单的一种方法是计算模型中各自变量之间的相关系数,并对各相关系数进行显著性检验,如果有一个或多个相关系数是显著的,就表示模型中所使用的自变量之间相关,因而存在多重共线性问题具体的说,如果出现下列情况,暗示存在多重共线性:( 1)模型中各对自变量之间显著相关2)当模型的线性关系检验(F检验)显著时,几乎所有回归系数的t检验却不显著(3)回归系数的正负号与其的相反十一、多元线性回归中选择自变量的方法有哪些:在多元线性回归中,变量选择的方法主要有:向前选择、向后删除、逐步回归、最优子集(1)向前选择是从模型中没有自变量开始,不停的向模型中增加自变量,直至增加自变量不能导致SSE显著增加(这个过程通过F 检验来完成)为止(2)向后删除是与向前选择相反,一直将自变量从模型中删除,直至删除一个自变量不会使SSE显著减小为止,这时,模型中所剩的自变量都是显著的。

      3)逐步回归是向前选择和向后回归的结合,不停的增加变量并开了剔除以前增加的变量的可能性,直至增加变量已经不能导致SSE显著减少 第十一章事件序列分析和预测一、时间序列预测的程序在对时间序列进行预测时,通常包括以下步骤:(1)确定时间序列所包含的成分,也就是确定时间序列的结果(2)找出适合此类时间序列的预测方法(3)对可能的预测方法进行评估,以确定最佳预测方案(4)利用最佳预测方案进行预测二、简述平稳序列和非平稳序列的含义(1)平稳序列是指基本上不存在趋势的序列平稳序列中的各观察值基本上在某个固定的水平上波动,虽然在不同时间段波动的程度不同,但并不存在某种规律,而其波动可以看成是随机的2)非平稳序列是指包含趋势性、季节性或周期性的序列,它可以是只含有其中的一种成分,也可能是几种成分的组合非平稳序列又可以分为有趋势的序列,有趋势、季节性和周期性的序列,即复合型序列三、时间序列的构成要素(1)时间序列在长时期内呈现出来的某种持续向上或持续下降的变动,称为趋势,也称长期趋势时间序列在一年内重复出现的周期性波动,称为季节变动(2)时间序列中呈现出来的围绕长期趋势的一种波浪形或震荡式变动,称为周期性,或称循环波动(3)时间序列中除去趋势、周期性和季节变动之后的偶然性变动,称为随机性,也称不规则变动这样,可以将时间序列的构成要素分为四种,即趋势(T)、季节性或季节变动(S)、周期性或循环波动(C)、随机性或不规则变动(I)四、增长率分析中应注意的问题 对于大多数时间序列,特别是有关社会经济现象的时间序列,我们经常利用增长率来描述其增长状况。

      尽管增长的计算与分析都比较简单,但实际应用中,有时也会出现误用乃至滥用的情况因此,在应用增长率分析实际问题时,应注意以下几点:首先,当时间序列中的观察值出现0 或负数时,不宜计算增长率对这一序列计算增长率,要么不符合数学公理,要么无法解释其实际意义,在这种情况下,适宜直接用绝对数进行分析其次,在有些情况下,不能单纯的就增长率论增长率,要注意增长率与绝对水平的结合分析五、简述指数平滑法的基本含义(1)指数平滑法是对过去的观察值加权平均进行预测的一种方法,该方法使得第t期的指数平滑值等于第t 期的实际观察值与第t+1 期指数平滑值的加权平均值2)指数平滑法是加权平均的一种特殊形式,观察值时间越远,其权数也就跟着呈现指数的下降,因而成为指数平滑指数平滑有一次指数平滑,二次指数平滑、三次指数平滑3)使用指数平滑法时,关键的问题是确定一个合适的平滑系数α 因为不同的 α会对预测结果产生不同的影响一般而言,当时间序列有较大的随机波动时,宜选较大的α ,以便能很快地跟上近期的变化,当时间序列比较平稳时,宜选较小的α 但实际应用时,还应考虑预测误差的大小,确定α 时,可选择几个 α 进行预测,然后找出预测误差最小的作为最后的α 值。

      六、复合型时间序列的预测步骤复合型序列是指含有趋势性、季节性和周期性的序列,对这类序列进行分析的传统方法就是将时间序列的各个因素依次分解出来,并分别进行分析分解法预测通常按照下面的步骤进行:(1)确定并分离季节成分计算季节指数,以确定时间序列中的季节成分,然后将季节成分从时间序列中分离出去,即用每一个时间序列观测值除以相应的季节指数,以消除季节性2)建立预测模型并进行预测,对消除了季节成分的时间序列建立适当的预测模型,并根据这一模型进行预测(3)计算出最后的预测值,用预测值乘以相应的季节指数,得到最终的预测值七、季节指数的计算方法—平均趋势剔除法的基本步骤 无季节性资料ICTSICST无季节性资料(1)计算移动平均值(季度数据采用4 项移动平均,月份数据采用12 项移动平均 ),并将其结果进行“中心化”处理,将移动平均的结果再进行一次二项的移动平均,即得出“中心化移动平均值”(CMA) (2)计算移动平均的比值也成为季节比率,即将序列的各观察值除以相应的中心化移动平均值,然后再计算出各比值的季度(或月份 )平均值,即季节指数(3)季节指数调整各季节指数的平均数应等于1 或 100% ,若根据第二步计算的季节比率的平均值不等于1 时,则需要进行调整。

      具体方法是:将第二步计算的每个季节比率的平均值除以它们的总平均值八、周期性分析的常用方法剩余法的具体计算步骤:1.先消去季节变动,求得无季节性资料2.再将结果除以由分离季节性因素后的数据计算得到的趋势值,求得含有周期性及随机波动的序列3.将结果进行移动平均(MA) ,以消除不规则波动,即得循环波动值 C = MA ( C ×I ) 第十三章指数一、指数的含义与性质指数,或称统计指数,是分析社会经济现象数量变化的一种重要统计方法,有如下一些性质:(1)相对性指数是总体各变量在不同场合下对比形成的相对数,它可以度量一个变量在不同时间或不同空间的相对变化,如一种商品的价格指数或数量指数它也可以反映一组变量的综合变动,比如综合物价指数是根据一组商品价格的相对变化并给每种商品的相对数定以不同权数计算出来的,这种指数称为综合指数,另外根据变化对比两变量所处的是不同时间还是不同空间,他们计算出来的指数分时间性指数和区域性指数(2)综合性综合性说明指数是一种特殊的相对数,它由一组变量或项目综合对比形成的,比如,由若干种商品和服务构成的一组消费项目,通过综合后计算价格指数,以反映消费价格的综合变动水平。

      周期与随机波动ICTICT周期与随机波动 (3)平均性平均线含义有二,一是指数进行比较的综合数量是作为个别量的一个代表,这本身就具有平均的性质;二是两个综合量对比形成的指数反映了个别量的平均变动水平比如物价指数反映了多种商品和服务项目价格的平均变动水平二、同度量因素?在编制加权综合指数中的作用?(1)在统计学中,一般把相乘以后使得不能相加的指标过渡到可以直接相加的指标的那个因素,称为同度量因素或同度量系数2)在编制指数时,对于不能直接相加的指标,可通过同度量因素把指标过渡到具有可加性三、拉氏指数和帕氏指数各有什么特点?(1)拉氏指数是1864 年德国学者拉斯贝尔斯提出的一种指数计算方法,它用基期消费量为权数,可以消除全数变动对对指数的影响,从而使不同时期的指数具有可比性但拉氏指数也存在一定的缺陷比如,物价指数实在假定销售量不变情况下报告期价格的变动水平,这一指数尽管可以单纯反映价格的变动水平,但不能反映出消费量的变化从实际生活角度看,人们更关心在报告期销售量条件下,由于价格变动对实际生活的影响因此,拉氏价格指数实际中应用的很少而拉氏数量指数,是在假定价格不变的条件下报告期销售量的综合变动,它不仅可以单纯反映出销售量的综合变动水平,也符合计算销售量指数的实际要求,因此,拉氏数量指数实际中应用的较多。

      2)帕氏指数是1874 年德国学者帕煦提出的一种指数计算方法,帕氏指数因以报告期变量值为权数,不能消除权数变动对指数的影响,因而不同时期的指数缺乏可比性但帕氏指数可以同时反映出价格和消费结构的变化,具有比较明确的经济意义在实际应用中,常采用帕氏公式计算价格、成本等质量指数而帕氏指数由于包含了价格的变动,这就意味着按调整后的价格来测定数量的综合变动,这本身不符合计算物量指数的要求,因此帕氏数量指数在实际中应用较少四、加权平数指数和加权综合指数有何区别于联系(1)两者区别:a、两者在所使用的权数和计算形式上不同综合指数是以某一时期的变量值作为权数对另一个变量进行加权,然后采用综合的形式计算出来的;而加权平均指数则是采用某一总量为权数对个体指数加权计算出来的b、二者所依据的计算资料不同加权综合指数的计算通常需要掌握全面的资料;加权平均指数既可以依据全面资料计算,也可以依据非全面资料计算 (2)两者联系:当使用p0q0为权数时,加权算术平均指数可以变形为加权综合指数;当使用 p1q1作为权数时,加权调和指数可以变形为加权综合指数五、指数体系的含义与作用(1)由总量指数及其若干个因素指数构成的数量关系式称为指数体系。

      它一般保持两个对等关系,一是从相对水平看,总量指数等于各因素指数的乘积;二是从绝对量来看,总量的变动差额等于各因素指数变动差额之和(2)指数体系主要有三方面的作用a、指数体系是进行因素分析的根据,即利用指数体系可以分析复杂经济现象总变动中各因素变动影响方向和程度b、利用各指数之间的联系进行指数间的相互推算例如我国的商品销售量总指数往往就是根据商品销售额总指数进行推算的,即商品销售量指数= 销售量额指数 /价格指数c、用综合指数法编制总指数时,指数体系也是确定同度量因素时期的根据之一因为,指数体系是进行因素分析的根据,要求各个指数之间在数量上要保持一定的关系因此,编制产品产量指数时,如用基期价格做同度量因素,那么编制产品价格指数时必须用报告期的产品产量作为同度量因素;如果编制产品产量指数用报告期价格作为同度量因素,那么编制产品价格指数时就必须用基期的产品产量作为同度量因素六、几种常见的价格指数的含义(1)零售价格指数:反映城乡商品零售价格变动趋势的一种经济指数它的变动直接影响到城乡居民的生活支出和国家财政收入,影响居民购买力和市场供需平衡以及消费和积累的比例是观察和分析经济活动的重要工具之一;零售价格指数资料是采用分层抽样的方法取得(2)消费价格指数:反映一定时期内城乡居民所购买的生活消费品价格和服务项目价格的变动趋势和程度;作用:a、反映通货膨胀状况100基期消费价格指数基期消费价格指数报告期消费价格指数通货膨胀率%100基期消费价格指数基期消费价格指数报告期消费价格指数通货膨胀率 b、反映货币购买力变动c、反映对职工实际工资的影响d、用于缩减经济序列(3)生产价格指数:测量在初级市场上出售的货物(即在非零售市场上首次购买某种商品时 ) 的价格变动的一种价格指数(4)股票价格指数:反映某一股票市场上多种股票价格变动趋势的一种相对数,简称股价指数;其单位一般用“点”表示。

      计算时一般以发行量为权数 进行加权综合其公式为七、多指标综合评价指数的构建(1)多指标综合评价指数是利用指数的思想与方法,将所选择的有代表性的若干个指标综合成一个指数,从而对事物发展的状况作出综合的评判(2)构建指数的一般问题?进行理论研究,其中包括统计指标理论以及指标体系的理论研究,以便为确定所需的评价指标提供一定的理论依据?建立科学的评价指标体系所建立的指标体系是否科学和合理,直接关系到评价结果的科学性和准确性评价方法研究,主要包括综合评价指数的构造方法、指标的赋权方法以及各种评价方法的比较等统计学重要公式组距分组中的组数:组距= ( 最大值 - 最小值 ) ÷组数茎叶图最大行数不超过:L = [ 10 × lg(n) ]中位数:原始数据:顺序数据:%100居民消费价格指数货币购买力指数%1001居民消费价格指数货币购买力指数消费价格指数名义工资实际工资消费价格指数名义工资实际工资iiiip01iiiipqpqpI01lg(lg()2lg()lg(1nK21n中位数位置21n中位数位置2n中位数位置2n中位数位置 四分位数 :原始数据:顺序数据:均值: 简单均值 :加权均值:调和平均数:几何平均数异种比率 :四分位差 :QD= QU –QL 极差: R = max(xi) - min(xi) 平均差 :分组数据:未分组数据:方差 :分组数据:未分组数据:标准差: 分组数据:未分组数据:标准分数 :离散系数 :偏态系数: 未分组数据:分组数据:4) 1( 341nQnQUL位置位置4)1(341nQnQUL位置位置434nQnQUL位置位置434nQnQUL位置位置nxniin121nxnxxxxniin121kiikkk1212211nfMffffMfMfMxkiiikkk1212211iiiiiiiimiiiiiiiimffMMfMfMHnniinnm121nniinnmxxxxG121imimirimimirfffffv1kiiid1nfxMMkiiid1nid1nxxMniid1122nii1)(122nxxsnii122kiii1)(122nfxMskiii1nii1)(12nxxsnii12kii1)(12nfxMskiiiiisxxziisxsvs3i33)2)(1(snnxxnSKi313kiii313)(nsfxMSKkiii4224) 1(nii4224)3)(2)(1()1()(3)() 1(snnnnxxxxnnKii 峰态系数 : 未分组数据:分组数据 : 概率密度函数:f(x) = 随机变量X 的频数 ; = 总体方差; =3.14159; e = 2.71828 ;x = 随机变量的取值 (- < x < ); = 总体均值标准正态分布的概率密度函数:时间序列的分解模型:乘法模型:Yi=Ti×Si×Ci×Ii;加法模型:Yi=Ti+Si+Ci+Ii环比增长率 :报告期水平与前一期水平之比减1 定基增长率 :报告期水平与某一固定时期水平之比减1 平均增长率 :年度化增长率?m 为一年中的时期个数;n 为所跨的时期总数?季度增长率被年度化时,m =4 ?月增长率被年度化时,m =12 ?当m =n 时,上述公式就是年增长率简单移动平均 :设移动间隔为K(1

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.