
影响评估术语表.pdf
7页1影响评估术语表影响评估术语表 第一版第一版 日期:日期:2009年年12月月 如对本术语表有任何意见或建议,请发送至3ie@3ieimpact.org. 推荐引用:3ie (2009) 3ie影响评估术语表 影响评估国际动议组织:印度新德里 归因归因(Attribution) 在已考虑了其他因素对研究对象的影响的前提下, 在结果中观察到的变化在多大 程度上是干预引起的 损耗损耗(Attrition) 或是在干预期间有参与者从处理组中退出, 或是在面板数据的收集过程中, 在第 一轮之后的几轮调查中未能获得其中某组数据 这两种形式的损耗都可能会使影 响评估的结果产生偏误 平均处理效应平均处理效应(Average treatment effect) 对受益组(或处理组)影响的平均值见意向处理和处理后的处理 基线调查和基线数据基线调查和基线数据(Baseline survey and baseline data) 在开始干预之前收集数据的调查 基线数据对于进行双差分析是必要的, 应该同 时从处理组和控制组都收集数据 前后对照前后对照(Before versus after) 见单差分分析。
受益者或者受益者群体受益者或者受益者群体( Beneficiary or beneficiaries) 受益者群体是指直接或间接从干预中获益的个人、公司、机构或者村落等 偏误偏误(Bias) 因评估方法或者抽样设计(例:不是由于抽样错误)中的问题引起的影响评估的 结果与真实值相异的程度 影响评估术语表 2盲法盲法(Blinding) 隐藏哪些对象属于处理组, 哪些属于对照组的过程叫做单盲法 在采用双盲法时, 不论是对象还是试验者都不知道哪些对象属于哪个组而在采用三盲法的试验 中,数据分析者也不知道对象是属于哪个组一般而言,盲法对于社会经济发展 干预是不太可行的,因此可能会产生偏误 整群抽样整群抽样(Cluster sample) 一种多阶段的抽样方法在这一过程中,一个样本首先从某个地理区域(例如片 区或者村庄)中选取,然后从选定区域中选取某些家庭、企业、机构等作为研究 样本与简单随机抽样相比,这种抽样方式将造成更大的标准误差,但是出于降 低成本的考虑,这种方法经常被采用 对照组对照组(Comparison Group) 一组与处理组(或者参与者)的特点类似却未受到干预的个体。
在试验环境中, 评估者能够确保没有混杂因素影响对照组, 那么这个组也被称为控制组 置信度置信度(Confidence level) 对影响的真实值 (或者其他统计估计量) 被包含在在某个特定范围内的确信程度 混杂因素混杂因素(Confounding factors) 影响相关结果的其他变量或者决定因素 污染污染(Contamination) 指控制组的成员受到干预(见 溢出效应) 或者其他影响相关结果的干预的影响 由于大部分社区都有多个发展干预措施,污染是一个常见的问题 控制组控制组(Control Group) 对照组的一个特例,指的是评估者能够控制环境,因而能限制混杂因素 成本效益分析成本效益分析(Cost-benefit analysis, CBA) 对于干预发生的所有成本和效益的比较, 其中, 所有的成本和效益均以货币来度 量 成本效益分析优于成本效率分析的原因在于, 成本效益分析能够分析多种结 果, 可以对不同领域的成本和收益进行比较 (因此有助于对发展资源进行合理分 配) 成本效率成本效率(Cost-effectiveness) 对达成结果发生单位变化所需成本的分析。
相比于成本效益分析, 该方法的优点 在于避免了对结果进行往往存在争议的价值估算 成本效率可用来比较不同项目 在实现相关结果方面的效率 反事实反事实(Counterfactual) 在未受干预的情况下,处理组应该出现的结果的值 因变量因变量(Dependent variable) 能被另一个或者另一些变量(自变量)预测或者引起的变量这一术语通常用于 回归分析 3二分变量二分变量(Dichotomous variable) 一种只可能有两种值的变量,例如,“性别”(男性=0,女性=1)在用于估 计倾向得分的Probit参与模型中,因变量是一个二分变量,参加=1, 不参加 =0 倍差法倍差法(Difference-in-difference) 见双差 双差双差(Double difference) 在处理组中观察到的结果的变化与控制组观察到的变化的差分或者,相应的, 处理组与控制组在研究结果之间的差别的变化 双差分能够避免由时间上不变的 不可观测的因素造成的选择偏误也叫倍差法与单差和三差相区别 虚变量虚变量(Dummy Variables) 在回归分析中常用的二分变量影响评估常以用虚变量表示项目参与(参与=1, 不参与=0)作为自变量,以结果变量作为因变量。
效应值效应值(Effect Size) 两个变量之间的关系的大小(尤其指项目变量与结果之间)见最小效应规模 合格人群合格人群(Eligible population) 那些符合标准,能够成为干预的受益者的人这些群体可能是个人,机构(比如 学校或者诊所),企业等等 事前影响评估设计事前影响评估设计(Ex ante evaluation design) 在干预开始前准备的一个影响评估设计方案 考虑到对样本是否接受干预进行随 机分配的可能性, 以及对基期数据的收集,事前影响评估设计比事后影响评估设 计更具优势也称为前瞻评估 事后影响评估设计事后影响评估设计(Ex post evaluation design) 在干预开始之后准备的一个影响评估设计方案, 此时干预可能已经完成 除非是 否接受干预采用了随机分配的方法,否则必须使用准实验设计 实验设计实验设计(Experimental Design) 见随机控制试验 外部有效性外部有效性(External Validity) 影响评估的结果适用于其他时间或者地点的程度 机构调查机构调查(Facility survey) 对于机构样本(通常是卫生或教育机构,但是也适用于警察局,培训机构等)的 调查, 该类调查旨在评估提供服务所需要的所有要素的水平与质量。
虽然也可以 通过一个单独的机构员工调查收集关于员工的数据(例如:教师调查),但观察 的基本单位是这个机构 如果某个机构调查是与家庭调查并列进行的, 那么很重 要的一点就是调查工具中要包含一些信息将将家庭与他们利用的这个机构联系 起来,从而便于数据分析 4析因设计析因设计(Factorial design) 在一项受到多种处理的随机控制试验中, 其中一部分接受甲处理, 一部分接受乙 处理,一部分同时接受甲和乙处理可能还有一部分是未受任何处理的控制组 假说假说(Hypothesis) 关于两个变量之间关系的一种特定陈述 在影响评估中, 假说特指干预对结果造 成的预期影响 影响影响(Impact) 干预对于受益者群体产生结果的效力 影响评估影响评估(Impact evaluation) 对造成干预结果变化的归因的研究影响评估有实验性的或者准实验性的设计 影响异质性影响异质性(Impact heterogeneity) 由于环境、受益者特征以及干预实施过程的不同造成的影响的变化 自变量自变量(Independent Variable) 能引起因变量变化的变量,通常用于回归分析中。
意向处理估计量意向处理估计量(Intention to treat estimate) 对整个处理组的平均处理效应, 不论这些处理组的个体是否真正接受了干预 与 处理后的处理相对应 内在有效性内在有效性(Internal Validity) 评估设计的有效性,即,是否充分考虑并处理了诸如样本选择,溢出效应,样本 污染和影响异质性等问题 干预干预(Intervention) 影响评估的对象,包括工程、项目和政策 逻辑模型逻辑模型(Logic model) 描述一个项目是如何运行的, 展现从输入到活动和输出, 最后到结果的因果关系 链 尽管逻辑模型展现了一种关于项目预期结果的理论, 但并不能显示是否是该 项目导致了观察到的结果 基于理论的方法是用来检验逻辑模型相关关系背后的 假设 匹配匹配(Matching) 用来创建控制组的办法, 根据与干预结果相关的特征, 使其与处理组中的群体和 个人相匹配 荟萃分析荟萃分析(Meta-analysis) 对类似项目的一系列现有评估进行系统分析, 其目的旨在得出一般的结论, 支持 某种假说,以及/或者得到项目总体效应的估计量 5最小效应规模最小效应规模(Minimum effect size) 研究者认为能够用影响评估检测出的最小的效应规模。
用来进行评估效力计算时 以决定所需的样本规模 混合法混合法(Mixed methods) 在一个影响评估方案中同时采用定量分析和定性分析的方法有时称为Q平方法 N(N) 案例的数量大写的“N”指的是总体中的案例数量小写的“n”指的是样本 中的案例数量 结果结果(Outcome) 一个或者数个变量,可以衡量干预所产生的影响 面板数据和面板调查面板数据和面板调查(Panel data and panel survey) 通过连续调查而收集的数据,其中,每轮调查都是从同一组样本收集观测数据 面板数据可能会受到损耗,因而产生偏误 参加者参加者(Participant) 接受干预的个人、机构、企业或村落等也称为处理组 “流水线流水线”方法方法(Pipeline approach) 指的是在一种影响评估方案中,控制组的人还没有接受干预, 但是按计划他们也 将接受干预由于处理组和控制组都要接受干预,可以假设不存在选择偏误但 是匹配的质量必须经过检验,因为后来的参加者可能与之前的参加者不一样 评估效力计算评估效力计算(Power calculation) 对影响评估所需样本规模进行的计算,这取决于最小效应规模和所需的置信度。
首要数据首要数据(Primary Data) 由调查者专门为研究项目所收集的数据 倾向得分匹配(倾向得分匹配(Propensity Score Matching, PSM)) 一种用来评估干预的影响的准实验方法 把处理组的结果和控制组的结果进行比 较, 而控制组是基于倾向评分进行匹配后构建出来的 倾向得分是指参与干预的 可能性,它可以由Probit模型对观测到的特征进行回归得到这些特征必须不受 干预的影响因此,倾向得分匹配法能基于多个特征进行匹配,并能将将这些特 征概括到一个数字(倾向评分)中 前瞻性评估前瞻性评估(Prospective evaluation) 见事前影响评价设计 准实验设计准实验设计(Quasi-Experimental Design) 用统计方法创建一个对照组的影响评估设计方法 该方法旨在确保处理组和对照 组在除了干预之外的所有方面都是相同的, 好比一个实验设计 见倾向得分匹配 和断点回归设计 6随机分配随机分配(Random assignment) 将合格群体中的成员被随机分配到处理组或者对照组中(即,随机分配)的一种 干预设计方法也就是说,某人在处理组还是在对照组完全是偶然决定的,与他 们的任何特点(观察到的或者未观察到的)毫无关系。
随机控制试验随机控制试验(Randomized Controlled Trial, RCT) 利用随机分配在合格群体中分配干预的一种影响力评估设计 由于参与者特征和 结果之间不存在任何联系,处理组和控制组在结果上的差异可以完全归因于干 预,或者说,不存在选择偏误然而,随机控制试。
