第五章比率估计与回归估计.ppt
35页第五章第五章 比率估计与回归估计比率估计与回归估计2本章要点本章要点 本章讨论了简单随机抽样和分层随机抽样下比率估计量本章讨论了简单随机抽样和分层随机抽样下比率估计量和回归估计量的构造及性质要求:和回归估计量的构造及性质要求: ①①掌握总体比率、比率估计量及回归估计量的概念掌握总体比率、比率估计量及回归估计量的概念 ②②了解比率估计量、回归估计量的偏倚、方差及方差的了解比率估计量、回归估计量的偏倚、方差及方差的估计量 ③③掌握应用比率估计量及回归估计量的条件掌握应用比率估计量及回归估计量的条件3第一节第一节 问题的提出问题的提出n 在许多实际问题中常常涉及两个调查变量(指标)在许多实际问题中常常涉及两个调查变量(指标)Y 和和X 对于包含个抽样单元的总体除了对总体信息进行估计外,对于包含个抽样单元的总体除了对总体信息进行估计外,常常要估计总体比率常常要估计总体比率R总体比率在形式上总是表现为两个总体比率在形式上总是表现为两个变量总值或均值之比变量总值或均值之比 在涉及两个变量的抽样调查中,有两种情况需要应用比率在涉及两个变量的抽样调查中,有两种情况需要应用比率估计量。
一种情况是利用双变量样本对总体比率进行估计需估计量一种情况是利用双变量样本对总体比率进行估计需应用比率估计量,此时两个变量均为调查变量另一种情况应用比率估计量,此时两个变量均为调查变量另一种情况是一个变量为调查变量,另一个变量表现为与调查变量有密是一个变量为调查变量,另一个变量表现为与调查变量有密切关系的辅助变量,在对调查变量总体总值、总体均值等目切关系的辅助变量,在对调查变量总体总值、总体均值等目标量进行估计时,利用已知的辅助变量信息构造比率估计量标量进行估计时,利用已知的辅助变量信息构造比率估计量可以改进估计的精度可以改进估计的精度n 基于这种考虑利用已知的辅助变量信息构造比率估计量就基于这种考虑利用已知的辅助变量信息构造比率估计量就可使估计精度加以改进可使估计精度加以改进4 第二节第二节 比率估计比率估计n 一、比率估计量一、比率估计量 设对有两个调查变量设对有两个调查变量Y 和和X 的总体进行简单随机抽样的总体进行简单随机抽样 ,分别以,分别以y,,x表示样本总值表示样本总值 ,以,以 表示样本均值,以表示样本均值,以 为样为样本比率本比率 ,用,用 作为总体比率作为总体比率R的估计称为的比率估计的估计称为的比率估计 。
比率估计量除了使用调查变量样本信息外,还要使用辅助变量比率估计量除了使用调查变量样本信息外,还要使用辅助变量总体信息与样本信息,而且是非线性估计量这类估计量称为复杂总体信息与样本信息,而且是非线性估计量这类估计量称为复杂估计量由于比率估计量使用的信息比简单估计量多,因而有可能估计量由于比率估计量使用的信息比简单估计量多,因而有可能比简单估计量有更高的精度同时由于比率估计量是非线性估计量,比简单估计量有更高的精度同时由于比率估计量是非线性估计量,因而对其性质的研究比对简单估计量要复杂得多因而对其性质的研究比对简单估计量要复杂得多5n二、二、比率估计量的偏倚与均方误差比率估计量的偏倚与均方误差 比率估计量是有偏估计量,但当样本量增大时其偏倚比率估计量是有偏估计量,但当样本量增大时其偏倚将趋于零将趋于零 理论上可以证明,理论上可以证明, 分别为分别为 的近似无的近似无偏估计量偏估计量,而且对于比率估计量,其方差主要取决于而且对于比率估计量,其方差主要取决于 与与 之间的差异,当之间的差异,当 时,估计量方差将很小。
时,估计量方差将很小换言之,比率估计量将有很高的精度这告诉我们,只换言之,比率估计量将有很高的精度这告诉我们,只有当两个变量大致成正比例关系时,应用比率有当两个变量大致成正比例关系时,应用比率 估计量才能使估计精度有较大改进估计量才能使估计精度有较大改进6n三、三、 比率估计量方差的估计与置信区间比率估计量方差的估计与置信区间 对于一般的对于一般的n,比率估计量呈右偏分布,只有,比率估计量呈右偏分布,只有当当n>>30, <<0.1, <<0.1这些条件同时满足时才这些条件同时满足时才能直接用正态分布构造置信区间能直接用正态分布构造置信区间R的置信区间为的置信区间为 [ ] 其中其中 是标准正态分布的上是标准正态分布的上αα/2/2分位点,分位点,0<<αα<<1类似可得类似可得 、、Y的置信区间的置信区间7案例一案例一8解解 答过程答过程9案例二案例二n 10解答过程解答过程11n四、四、 比率估计量优于简单估计量的条件比率估计量优于简单估计量的条件 定量分析计算表明,并非任何情况下比率估计量都优于简单估计量,定量分析计算表明,并非任何情况下比率估计量都优于简单估计量,只有当调查变量与辅助变量有较高的正相关性时比率估计量才能使估计只有当调查变量与辅助变量有较高的正相关性时比率估计量才能使估计精度有较大提高。
若精度有较大提高若 ≈ ,则只需当,则只需当ρρ>> 0.5 时比率估计量就比时比率估计量就比简单估计量精度高简单估计量精度高12n五、多元比率估计五、多元比率估计 对于调查变量对于调查变量Y ,若有,若有p个具有正相关性的辅助变量个具有正相关性的辅助变量 则则可构造多元比率估计可构造多元比率估计 设设 是是 的基于第的基于第k个辅助变量的比率估计,则个辅助变量的比率估计,则 的多元比率的多元比率估计量为:估计量为: 其中其中 是相应变量的样本总值,是相应变量的样本总值, 是辅助是辅助变量总体均值,变量总体均值, 是适当选取的权,满足是适当选取的权,满足 利用拉格朗日乘数法可计算得利用拉格朗日乘数法可计算得 此时最小方差为此时最小方差为 13案例三案例三14解答过程解答过程15n六、乘积估计六、乘积估计 当辅助变量当辅助变量X 与调查变量与调查变量Y 呈负相关关系时,不能应用比率估计呈负相关关系时,不能应用比率估计而应改用乘积估计而应改用乘积估计 乘积估计优于简单估计的条件是乘积估计优于简单估计的条件是 << 此时此时 << 在实际问题中与调查变量呈负相关的变量很少见,因此乘积估计在实际问题中与调查变量呈负相关的变量很少见,因此乘积估计应用极为有限。
应用极为有限16 第三节第三节 回归估计回归估计n 一、定义一、定义 在简单随机抽样下,总体均值在简单随机抽样下,总体均值 和总体和总体总值总值Y的回归估计量定义为:的回归估计量定义为: 其中其中 ,, 分别为调查变量、辅助变量的分别为调查变量、辅助变量的样本均值,样本均值, 是辅助变量的总体均值,是辅助变量的总体均值, 称为回归系数称为回归系数 17n二、二、ββ为设定常数情形为设定常数情形 设设 是设定常数,取是设定常数,取ββ== ,则回归估计量,则回归估计量是是 的无偏估计量的无偏估计量 其方差为其方差为当当 时时 达最小值达最小值18n 三、三、 ββ取样本回归系数情形取样本回归系数情形 若若ββ需根据样本确定,一个合理的选择是取需根据样本确定,一个合理的选择是取ββ为样本为样本回归系数回归系数此时此时 的回归估计量的回归估计量为一复杂估计量,不再具有无偏性为一复杂估计量,不再具有无偏性 19n四、回归估计与比率估计及简单估计的大样本比较四、回归估计与比率估计及简单估计的大样本比较 对于大的样本量,总有对于大的样本量,总有 这就是说在大样本下回归估计总是优于简单估计,仅在这就是说在大样本下回归估计总是优于简单估计,仅在ρρ==0时两时两者效果相同。
者效果相同 的充分必要条件为的充分必要条件为 这等价于这等价于 因此除非因此除非Y 关于关于X 的总体回归系数的总体回归系数B==R,否则回归估计总是优于比,否则回归估计总是优于比率估计,仅在率估计,仅在B==R时两者效果相同时两者效果相同20案例四案例四 21解答过程(解答过程(1))22解答过程(解答过程(2))23解答过程(解答过程(3))24第四节第四节 分层比率估计与分层回归估计分层比率估计与分层回归估计n一、分别比率估计与联合比率估计一、分别比率估计与联合比率估计n(一一)分别比率估计分别比率估计25n (二二)联合比率估计联合比率估计 26n二二 分别回归估计与联合回归估计分别回归估计与联合回归估计 (一)分别回归估计(一)分别回归估计27n(二)联合回归估计(二)联合回归估计28三、各种估计量的比较三、各种估计量的比较n 对分层随机抽样在有辅助变量可利用时,为提高估计精度可以采用分别比对分层随机抽样在有辅助变量可利用时,为提高估计精度可以采用分别比率估计、联合比率估计、分别回归估计、联合回归估计等多种形式的估计量,率估计、联合比率估计、分别回归估计、联合回归估计等多种形式的估计量,因此自然存在一个问题,即如何对这些估计量进行比较。
因此自然存在一个问题,即如何对这些估计量进行比较n 由以上各种估计量的构造可以知道,分别比率估计和分别回归估计必须由以上各种估计量的构造可以知道,分别比率估计和分别回归估计必须使用总体各层的辅助变量均值使用总体各层的辅助变量均值 或总值或总值 的信息,而联合比率估计和联合的信息,而联合比率估计和联合回归估计不要求使用总体各层的辅助变量信息,只要求使用总体的辅助变量回归估计不要求使用总体各层的辅助变量信息,只要求使用总体的辅助变量均值均值 或总值或总值X的信息,分别估计量比联合估计量对总体信息的使用更详细的信息,分别估计量比联合估计量对总体信息的使用更详细一些,因此,当各层样本量一些,因此,当各层样本量 都比较大时,分别比率估计精度比联合比率估都比较大时,分别比率估计精度比联合比率估计高,分别回归估计精度比联合回归估计高计高,分别回归估计精度比联合回归估计高n 但是各层样本量但是各层样本量 较小时,分别比率估计、分别回归估计将有较大偏倚,较小时,分别比率估计、分别回归估计将有较大偏倚,从而均方误差比较大此时如果总样本量比较大,则采用联合比率估计、联从而均方误差比较大。
此时如果总样本量比较大,则采用联合比率估计、联合回归估计更好一些合回归估计更好一些 29案例五案例五30解答过程(解答过程(1))n 相邻两年产量之间存在较高的正相关性,因此对今年平均亩产进行估计时相邻两年产量之间存在较高的正相关性,因此对今年平均亩产进行估计时以去年产量为辅助变量构造分层比率估计和分层回归估计是适宜的,此处以去年产量为辅助变量构造分层比率估计和分层回归估计是适宜的,此处 n ((1)) 分别比率估计分别比率估计31解答过程(解答过程(2))n((2)) 联合比率估计联合比率估计 32解答过程(解答过程(3))n((3)) 分别回归估计分别回归估计33解答过程(解答过程(4))n(4) 联合回归估计联合回归估计 以上结果表明不论是比率估计还是回归估计,总有分别估计量优于联合以上结果表明不论是比率估计还是回归估计,总有分别估计量优于联合估计量;不论是分别估计量还是联合估计量,总有回归估计优于比率估计估计量;不论是分别估计量还是联合估计量,总有回归估计优于比率估计 34编号为奇数的习题答案编号为奇数的习题答案5.15.1 ==2000, 2000, ==36, 136, 1-- ==0.95, t0.95, t==1.96, 1.96, ==0.0180.018,, 0.0000153590.000015359,, =0.00392 置信区间为 。
5.35.3当当 时时用第一种方法,用第一种方法,当当 时用第二种时用第二种方法,当方法,当 时两种方法都可使用这是因为:时两种方法都可使用这是因为: ,, ,, 若若 则则 0 0 < ﹥0355.55.5 证明:由(证明:由(5.65.6)得:)得: 5.75.7解:解: 故估计量 虽然与 一样都是 的无偏估计,但方差不小于 的方差,当 时 ,故 不优于 。

卡西欧5800p使用说明书资料.ppt
锂金属电池界面稳定化-全面剖析.docx
SG3525斩控式单相交流调压电路设计要点.doc
话剧《枕头人》剧本.docx
重视家风建设全面从严治党治家应成为领导干部必修课PPT模板.pptx
黄渤海区拖网渔具综合调查分析.docx
2024年一级造价工程师考试《建设工程技术与计量(交通运输工程)-公路篇》真题及答案.docx
【课件】Unit+3+Reading+and+Thinking公开课课件人教版(2019)必修第一册.pptx
嵌入式软件开发流程566841551.doc
生命密码PPT课件.ppt
爱与责任-师德之魂.ppt
制冷空调装置自动控制技术讲义.ppt


