
章数据的收集.ppt
128页第二章第二章 数据的搜集数据的搜集授课教师:杨卫华授课教师:杨卫华 博士博士主要内容主要内容1 总体、样本、参数和统计量总体、样本、参数和统计量2 数据类型数据类型★★3 获得数据的抽样调查方法获得数据的抽样调查方法★★4 问卷与问卷设计问卷与问卷设计5 获得数据的信度获得数据的信度2第一节第一节总体、样本、参数和总体、样本、参数和统计量统计量3总体和样本总体和样本ØØ总体总体(population)ØØ包含所研究的全部个体(数据)的集合包含所研究的全部个体(数据)的集合包含所研究的全部个体(数据)的集合包含所研究的全部个体(数据)的集合;;;;ØØ总体中的每一个元素称为总体中的每一个元素称为总体中的每一个元素称为总体中的每一个元素称为个体个体个体个体 ;;;;ØØ分为有限总体和无限总体分为有限总体和无限总体分为有限总体和无限总体分为有限总体和无限总体;;;;l l有限总体的范围能够明确确定,且元素的数目是有限的有限总体的范围能够明确确定,且元素的数目是有限的有限总体的范围能够明确确定,且元素的数目是有限的有限总体的范围能够明确确定,且元素的数目是有限的l l无限总体所包括的元素是无限的,不可数的无限总体所包括的元素是无限的,不可数的无限总体所包括的元素是无限的,不可数的无限总体所包括的元素是无限的,不可数的ØØ样本样本 (sample)ØØ从总体中抽取的一部分元素的集合从总体中抽取的一部分元素的集合从总体中抽取的一部分元素的集合从总体中抽取的一部分元素的集合;;;;ØØ构成样本的元素的数目称为构成样本的元素的数目称为构成样本的元素的数目称为构成样本的元素的数目称为样本容量样本容量样本容量样本容量;;;; 总体总体样样本本抽抽取取4参数参数Parametern n参数是用来描述总体特征的概括性数字参数是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某度量,它是研究者想要了解的总体的某种特征值。
种特征值n n研究者所关心的参数通常有总体平均数、研究者所关心的参数通常有总体平均数、总体标淮差、总体比例等总体标淮差、总体比例等n n实际应用中总体的参数一般是未知的实际应用中总体的参数一般是未知的5统计量统计量Statisticn n用来描述样本特征的概括性数字度量用来描述样本特征的概括性数字度量n n根据样本数据计算统计量,统计量是样根据样本数据计算统计量,统计量是样本的函数本的函数n n研究者关心的统计量主要有样本平均数、研究者关心的统计量主要有样本平均数、样本标准差、样本比例等样本标准差、样本比例等n n统计量是已知的,用于推断总体参数统计量是已知的,用于推断总体参数6指标或变量指标或变量(Variable) n n表征个体特征(信息)的量表征个体特征(信息)的量大学生大学生看法成绩专业年级性别身高……总体/个体变量变量(成绩,专业,年级,性别,身高,看法,(成绩,专业,年级,性别,身高,看法,(成绩,专业,年级,性别,身高,看法,(成绩,专业,年级,性别,身高,看法,……))))张同学张同学张同学张同学一条记录(一条记录(一条记录(一条记录(CaseCase))))或一个数据向量或一个数据向量或一个数据向量或一个数据向量7变量值或数据变量值或数据Datan n对个体特征的具体描述(数字或字符)对个体特征的具体描述(数字或字符)定量型(定量型(定量型(定量型(QuantitativeQuantitative))))定性型(定性型(定性型(定性型(QualitativeQualitative))))半定量型(半定量型(半定量型(半定量型(Semi-QuantitativeSemi-Quantitative)年收入年收入年收入年收入性别性别性别性别受教育程度受教育程度受教育程度受教育程度数据8第二节第二节数数 据据 类类 型型9统计数据的分类统计数据的分类按测量尺度按测量尺度刻刻刻刻度度度度级级级级数数数数据据据据序序序序次次次次级级级级数数数数据据据据名名名名义义义义级级级级数数数数据据据据按时间状况按时间状况截截截截面面面面的的的的数数数数据据据据时时时时序序序序的的的的数数数数据据据据按收集方法按收集方法观观观观察察察察的的的的数数数数据据据据实实实实验验验验的的的的数数数数据据据据10统计数据的分类统计数据的分类 (按测量尺度分按测量尺度分)n n名义级数据(名义级数据(Nominal Level))l是一种标志,区分变量的不同值,没有次序关系;l对事物进行分类的结果,例如,人口按性别分为男、女两类 ;n n序次级数据序次级数据(Ordinal Level) l只能够比较大小,不能加减乘除运算;l采用数字编码或字母表示不同类别,如1=文盲,2=小学,3=初中,4=高中,5=大学本科,6=硕士研究生,7=博士研究生;也叫定序或也叫定序或也叫定序或也叫定序或顺序数据顺序数据顺序数据顺序数据也叫定类或也叫定类或也叫定类或也叫定类或分类数据分类数据分类数据分类数据11统计数据的分类统计数据的分类 (按测量尺度分按测量尺度分)n n刻度级(数值型)数据刻度级(数值型)数据((Scale Level)Ø比率级数据(比率级数据(Ratio Level))l具有一定单位的实际测量值,其0值不是人为制定,如尺、公斤、元等;l可以加减乘除等运算;Ø间距级数据(间距级数据(Interval Level))l数据中的0是人为设定的,如0℃;l只能加减运算,不能乘除运算;l管理科学中的评分值,如把消费满意度定义为1~5;也叫定距级也叫定距级也叫定距级也叫定距级数据数据数据数据也叫定比级也叫定比级也叫定比级也叫定比级数据数据数据数据12测度级别测度级别((Measurement Level))低高名义级数据序次级数据刻度级数据分类、分组、频次、众数、卡方检验相关系数、描述统计所有描述统计和推断统计13选择数选择数据类型据类型切换到变量切换到变量察看窗口察看窗口14统计数据的分类统计数据的分类(按收集方法分按收集方法分)n观察数据观察数据(observational data) Ø通过调查或观测而收集到的数据;Ø在没有对事物人为控制的条件下而得到的;Ø有关社会经济现象的统计数据几乎都是观察数据;n实验数据实验数据(experimental data) Ø在实验中控制实验对象而收集到的数据;Ø比如,对一种新药疗效的实验,对一种新的农作物品种的实验等;Ø自然科学领域的数据大多数都为实验数据;15统计数据的分类统计数据的分类(按时间状况分按时间状况分)n截面数据(cross-sectional data) Ø在相同或近似相同的时间点上收集的数据;Ø描述现象在某一时刻的变化情况;Ø比如,2002年我国各地区的国内生产总值数据;n时间序列数据(time series data) Ø在不同时间上收集到的数据;Ø描述现象随时间变化的情况;Ø比如,1996年至2002年国内生产总值数据;16第三节第三节数据的来源数据的来源17n 数据的间接来源(二手数据)数据的间接来源(二手数据)Ø系统外部的数据Ø系统内部的数据n 数据的直接来源(原始数据)数据的直接来源(原始数据)Ø观察(调查)获得的数据Ø实验获得的数据数据的来源数据的来源18系统外部的数据系统外部的数据中国统中国统中国统中国统计年鉴计年鉴计年鉴计年鉴20012001中中中中国国国国人人人人口口口口统统统统计计计计年年年年鉴鉴鉴鉴中中中中国国国国市市市市场场场场统统统统计计计计年年年年鉴鉴鉴鉴世世世世界界界界发发发发展展展展报报报报告告告告世世世世界界界界经经经经济济济济年年年年检检检检工工工工业业业业普普普普查查查查数数数数据据据据中国统计出版社Ø统计部门和政府部门公布的有关资料,如各类统计年鉴;Ø各类经济信息中心、信息咨询机构、专业调查机构等提供的数据;Ø各类专业期刊、报纸、书籍所提供的资料;Ø从互联网或图书馆查阅到的相关资料; 二二二二〇〇〇〇一一一一〇〇〇〇年年年年中中中中国国国国城城城城市市市市统统统统计计计计年年年年鉴鉴鉴鉴反映哪反映哪反映哪反映哪一年的一年的一年的一年的情况?情况?情况?情况?19中国主要政府统计网站和中国主要政府统计网站和统计出版物统计出版物:中华人民共和国国家统计局中华人民共和国国家统计局 http:// /:北京统计信息网北京统计信息网 http:// /:上海统计网上海统计网 http://www.stats-http://www.stats- /:天津统计信息网天津统计信息网 http://www.stats-http://www.stats- /:中国信息报中国信息报 http:// /:《《中国统计年鉴中国统计年鉴》》:《《中国城市统计年鉴中国城市统计年鉴 》》 :《《中国物价统计年鉴中国物价统计年鉴》》:《《中国工业经济统计年鉴中国工业经济统计年鉴》》20系统内部的数据系统内部的数据Ø业务资料,如与业务经营活动有关的各种单据、记录;Ø经营活动过程中的各种统计报表;Ø各种财务、会计核算和分析资料等;挖掘挖掘21二手数据的特点二手数据的特点Ø搜集容易,采集成本低;Ø作用广泛;Ø分析所要研究的问题Ø提供研究问题的背景Ø帮助研究者更好地定义问题Ø检验和回答某些疑问和假设Ø寻找研究问题的思路和途径Ø搜集二手资料在研究中应优先考虑;22二手数据的评估二手数据的评估Ø数据是谁搜集的?Ø可信度评估Ø为什么目的而搜集的?Ø数据是怎样搜集的? Ø什么时候搜集的? 23数据的直接来源数据的直接来源(原始数据原始数据)Ø调查数据调查数据Ø通过调查方法获得的数据;Ø通常是对社会现象而言;Ø通常取自有限总体 ;Ø实验数据实验数据Ø通过实验方法得到的数据;Ø通常是对自然现象而言 ;Ø也被广泛运用到社会科学中;l如心理学、教育学、社会学、经济学、管理学等 24第四节第四节获得数据的抽样调查获得数据的抽样调查方法方法25调查数据获得的两种方法调查数据获得的两种方法普查与抽样普查与抽样n普查(普查(Census))Ø收集有限总体中每个个体的有关指标值,如人口普查等;n抽样调查(抽样调查(Sampling)Ø在总体中选择一部分个体进行调查,以了解总体的情况;26简单随机抽样简单随机抽样分层抽样分层抽样整群抽样整群抽样系统抽样系统抽样多阶段抽样多阶段抽样概率抽样概率抽样判断抽样判断抽样方便抽样方便抽样滚雪球滚雪球抽样抽样配额抽样配额抽样非概率抽样非概率抽样抽样方法抽样方法27概率抽样概率抽样(probability sampling)n n也称随机抽样也称随机抽样n n特点特点ØØ按一定的概率以随机原则抽取样本;按一定的概率以随机原则抽取样本;按一定的概率以随机原则抽取样本;按一定的概率以随机原则抽取样本;l l抽取样本时使每个单位都有一定的机会被抽中抽取样本时使每个单位都有一定的机会被抽中抽取样本时使每个单位都有一定的机会被抽中抽取样本时使每个单位都有一定的机会被抽中ØØ每每每每个个个个单单单单位位位位被被被被抽抽抽抽中中中中的的的的概概概概率率率率是是是是已已已已知知知知的的的的,,,,或或或或是是是是可可可可以计算出来的;以计算出来的;以计算出来的;以计算出来的; ØØ当当当当用用用用样样样样本本本本对对对对总总总总体体体体目目目目标标标标量量量量进进进进行行行行估估估估计计计计时时时时,,,,要要要要考考考考虑到每个样本单位被抽中的概率。
虑到每个样本单位被抽中的概率虑到每个样本单位被抽中的概率虑到每个样本单位被抽中的概率28简单随机抽样简单随机抽样(simple random sampling)n n从从从从总总总总体体体体N N个个个个单单单单位位位位中中中中随随随随机机机机地地地地抽抽抽抽取取取取n n个个个个单单单单位位位位作作作作为为为为样样样样本本本本,,,,每个单位入抽样本的概率是相等的每个单位入抽样本的概率是相等的每个单位入抽样本的概率是相等的每个单位入抽样本的概率是相等的n n最最最最基基基基本本本本的的的的随随随随机机机机抽抽抽抽样样样样方方方方法法法法,,,,是是是是其其其其它它它它抽抽抽抽样样样样方方方方法法法法的的的的基基基基础n n特点特点特点特点ØØ简简简简单单单单、、、、直直直直观观观观,,,,在在在在抽抽抽抽样样样样框框框框完完完完整整整整时时时时,,,,可可可可直直直直接接接接从从从从中中中中抽抽抽抽取取取取样样样样本;本;本;本;ØØ用样本统计量对目标量进行估计比较方便;用样本统计量对目标量进行估计比较方便;用样本统计量对目标量进行估计比较方便;用样本统计量对目标量进行估计比较方便;n n局限性局限性局限性局限性ØØ当当当当N N很大时,不易构造抽样框;很大时,不易构造抽样框;很大时,不易构造抽样框;很大时,不易构造抽样框;ØØ抽出的单位很分散,给实施调查增加了困难;抽出的单位很分散,给实施调查增加了困难;抽出的单位很分散,给实施调查增加了困难;抽出的单位很分散,给实施调查增加了困难;ØØ没有利用其它辅助信息以提高估计的效率。
没有利用其它辅助信息以提高估计的效率没有利用其它辅助信息以提高估计的效率没有利用其它辅助信息以提高估计的效率2930层层层层层层层层层层层层层层层层层层层层分层抽样分层抽样(stratified sampling)n n将将总总体体按按某某种种特特征征或或某某种种规规则则划划分分为为不不同同的的层层,,然然后后从从不不同同的的层层中中独独立立、、随随机机地地抽抽取样本也叫分类抽样也叫分类抽样也叫分类抽样也叫分类抽样总体总体总体总体按某种特征按某种特征按某种特征按某种特征划分划分划分划分简单随机简单随机简单随机简单随机抽样抽样抽样抽样样样本本31如何确定抽取的个体个数?如何确定抽取的个体个数?n n等数分配法:每一层抽取同样的个数;等数分配法:每一层抽取同样的个数;n n等比分配法:按照同一比例,从各个层等比分配法:按照同一比例,从各个层抽取样本抽取样本n n最优分配法:最优分配法:各个层的方差各个层的方差各个层的方差各个层的方差32n n特点:层内的差距小,层间的差距大特点:层内的差距小,层间的差距大n n优点优点ØØ保保保保证证证证样样样样本本本本的的的的结结结结构构构构与与与与总总总总体体体体的的的的结结结结构构构构比比比比较较较较相相相相近近近近,,,,从从从从而提高估计的精度;而提高估计的精度;而提高估计的精度;而提高估计的精度;ØØ组织实施调查方便;组织实施调查方便;组织实施调查方便;组织实施调查方便;ØØ既既既既可可可可以以以以对对对对总总总总体体体体参参参参数数数数进进进进行行行行估估估估计计计计,,,,也也也也可可可可以以以以对对对对各各各各层层层层的目标量进行估计。
的目标量进行估计的目标量进行估计的目标量进行估计对总体对总体而言而言33分层抽样的适用条件分层抽样的适用条件n n适用条件:适用条件:ØØ总体在某些特征上存在显著差异;总体在某些特征上存在显著差异;总体在某些特征上存在显著差异;总体在某些特征上存在显著差异;ØØ同时这些特征对所研究问题可能有影响;同时这些特征对所研究问题可能有影响;同时这些特征对所研究问题可能有影响;同时这些特征对所研究问题可能有影响;34整群抽样整群抽样(cluster sampling)n n将将总总体体中中各各个个个个体体按按照照某某一一标标志志量量分分为为若若干干群群,,然然后后以以群群为为单单位位,,对对群群进进行行随随机机抽抽样,只对抽出来的群实施样,只对抽出来的群实施普查普查总体总体总体总体群群群群群随机抽取随机抽取随机抽取随机抽取随机抽取随机抽取随机抽取随机抽取随机抽取随机抽取随机抽取随机抽取普查普查普查普查群群群35n n特点:群内差异大,群间差异小特点:群内差异大,群间差异小n n优点:优点:ØØ抽样时只需群的抽样框,可简化工作量;抽样时只需群的抽样框,可简化工作量;抽样时只需群的抽样框,可简化工作量;抽样时只需群的抽样框,可简化工作量;ØØ群群群群通通通通常常常常由由由由地地地地理理理理位位位位置置置置邻邻邻邻近近近近或或或或隶隶隶隶属属属属于于于于同同同同一一一一系系系系统统统统的的的的单单单单位位位位组组组组成成成成,,,,调调调调查查查查的的的的地地地地点点点点相相相相对对对对集集集集中中中中,,,,节节节节省省省省调调调调查查查查费用,方便调查的实施;费用,方便调查的实施;费用,方便调查的实施;费用,方便调查的实施;n n缺缺点点::样样本本在在总总体体中中不不是是均均匀匀分分配配,,估估计的精度较差。
计的精度较差对总体对总体而言而言36整群抽样的适用条件整群抽样的适用条件n n适用条件适用条件ØØ每个群都可以代表总体;每个群都可以代表总体;ØØ根据行政、地域或自然形成的群体;根据行政、地域或自然形成的群体;37系统抽样系统抽样(systematic sampling)n n将将总总体体中中的的个个体体按按一一定定顺顺序序排排列列,,在在规规定定的的范范围围内内随随机机地地抽抽取取一一个个单单位位作作为为初初始始单单位,然后按一定的间隔抽取其它样本单位位,然后按一定的间隔抽取其它样本单位也叫等距抽样也叫等距抽样也叫等距抽样也叫等距抽样……② 从数字1到k之间随机抽取一个数字r作为初始单位,例如取r=3① 先排序,例如身高排序第一个样本③依次取r+k,r+2k…等单位,例如k=3第二个样本第三个样本……38排序标志问题排序标志问题n按照与调查问题无关的标志排队按照与调查问题无关的标志排队Ø例如:在城市居民家庭生活水平调查中,按照居例如:在城市居民家庭生活水平调查中,按照居民居住的街道门牌号排序;民居住的街道门牌号排序;Ø相当于简单随机抽样;相当于简单随机抽样;n按照与调查问题相关的标志排队按照与调查问题相关的标志排队Ø职工工资水平调查中,按照职工工资高低排序;职工工资水平调查中,按照职工工资高低排序;39n n优优点点::操操作作简简便便,,样样本本均均匀匀分分布布在在总总体体中,抽样误差比简单随机抽样小。
中,抽样误差比简单随机抽样小n n缺点:对统计量方差的估计比较困难缺点:对统计量方差的估计比较困难40多阶段抽样多阶段抽样(multi-stage sampling)4①①先抽大单位先抽大单位(可以用分层抽样或系统抽样可以用分层抽样或系统抽样),, ②②再在大单位中抽小单位再在大单位中抽小单位(可用整群抽样或简单可用整群抽样或简单随机抽样随机抽样),,③③小单位中再抽更小的单位不是小单位中再抽更小的单位不是一次就直接抽取基层的调查单位一次就直接抽取基层的调查单位随机抽样随机抽样随机抽样随机抽样选取州选取州选取州选取州选出的州划选出的州划选出的州划选出的州划分成选举区域分成选举区域分成选举区域分成选举区域 选出的区域选出的区域选出的区域选出的区域分成选举站分成选举站分成选举站分成选举站按选举人列表按选举人列表按选举人列表按选举人列表调查调查调查调查第一阶段第二阶段第三阶段第四阶段41n具具有有整整群群抽抽样样的的优优点点,,保保证证样样本本相相对集中,节约调查费用;对集中,节约调查费用;n在在大大规规模模的的抽抽样样调调查查中中,,经经常常被被采采用的方法用的方法 ;;42概念区别n分层抽样:选择全部的群,从各群中随分层抽样:选择全部的群,从各群中随机抽取样本;机抽取样本;n整群抽样:随机抽取群,对被抽到的群整群抽样:随机抽取群,对被抽到的群普查;普查;n两阶段抽样:随机抽取群,对被抽到的两阶段抽样:随机抽取群,对被抽到的群随机抽样。
群随机抽样两阶段抽样是分层抽样和整群抽样的结合两阶段抽样是分层抽样和整群抽样的结合43非概率抽样非概率抽样(non-probability sampling)n n相对于概率抽样而言相对于概率抽样而言n n抽抽取取样样本本时时不不是是依依据据随随机机原原则则,,而而是是根根据据研研究究目目的的对对数数据据的的要要求求,,依依据据对对总总体体特特征征的判断的判断,从总体中抽取个体从总体中抽取个体n n有有方方便便抽抽样样、、典典型型抽抽样样、、滚滚雪雪球球抽抽样样、、配配额抽样等方式额抽样等方式 44方便抽样方便抽样((Convenience Sampling)n n调调查查过过程程中中由由调调查查员员依依据据方方便便的的原原则则,,自自行行确定入抽样本的单位确定入抽样本的单位ØØ调调调调查查查查员员员员在在在在街街街街头头头头、、、、公公公公园园园园、、、、商商商商店店店店等等等等公公公公共共共共场场场场所所所所进进进进行行行行拦拦拦拦截调查;截调查;截调查;截调查;ØØ厂家在出售产品柜台前对路过顾客进行的调查;厂家在出售产品柜台前对路过顾客进行的调查;厂家在出售产品柜台前对路过顾客进行的调查;厂家在出售产品柜台前对路过顾客进行的调查;n n优点:优点:容易实施,调查的成本低。
容易实施,调查的成本低n n缺缺点点::样样本本单单位位的的确确定定带带有有随随意意性性,,样样本本无无法法代代表表有有明明确确定定义义的的总总体体,,调调查查结结果果不不宜宜推推断总体45判断抽样判断抽样((Judgmental Sampling))n n研研究究人人员员根根据据经经验验、、判判断断和和对对研研究究对对象象的的了了解解,,有有意意识识地地选选择择具具有有代代表表性性的的个个体ØØ有重点抽样、典型抽样、代表抽样等;有重点抽样、典型抽样、代表抽样等;ØØ判判断断抽抽样样是是主主观观的的,,样样本本选选择择的的好好坏坏取取决决于于调调研研者者的的判判断断、、经经验验、、专专业业程程度度和和创造性;创造性;ØØ抽样成本比较低,容易操作;抽样成本比较低,容易操作;ØØ样样本本是是人人为为确确定定的的,,没没有有依依据据随随机机的的原原则,调查结果则,调查结果不能用于推断总体不能用于推断总体46滚雪球抽样滚雪球抽样((Snowball Sampling))n n先先选选择择一一组组调调查查单单位位,,对对其其实实施施调调查查之之后后,,再再请请他他们们提提供供另另外外一一些些属属于于研研究究总总体体的的调调查查对对象象,,调调查查人人员员根根据据所所提提供供的的线线索索,,进进行行此此后后的的调调查查。
这这个个过过程程持持续续下下去去,,就就会会形形成成滚滚雪球效应雪球效应ØØ适合于对稀少群体和特定群体研究适合于对稀少群体和特定群体研究适合于对稀少群体和特定群体研究适合于对稀少群体和特定群体研究ØØ优优优优点点点点::::容容容容易易易易找找找找到到到到那那那那些些些些属属属属于于于于特特特特定定定定群群群群体体体体的的的的被被被被调调调调查查查查者者者者,,,,调查的成本也比较低调查的成本也比较低调查的成本也比较低调查的成本也比较低47配额抽样配额抽样n n先先将将总总体体中中的的所所有有单单位位按按一一定定的的标标志志(变变量量)分分为为若若干干类类,,然然后后在在每每个个类类中中采采用用方方便抽样或判断抽样便抽样或判断抽样的方式选取样本单位的方式选取样本单位n n操操作作简简单单,,可可以以保保证证总总体体中中不不同同类类别别的的单单位位都都能能包包括括在在所所抽抽的的样样本本之之中中,,使使得得样样本本的结构和总体的结构类似的结构和总体的结构类似n n抽抽取取具具体体样样本本单单位位时时,,不不是是依依据据随随机机原原则则,,属于非概率抽样属于非概率抽样48抽样方法适用范围误差调查难度判断抽样不适于作推断统计抽样误差很大容易方便抽样容易滚雪球抽样适中简单随机抽样适于作推断统计适中分层抽样抽样误差小稍难整群抽样抽样误差大稍难等距抽样抽样误差小稍难多阶段抽样抽样误差小复杂49样本容量的确定样本容量的确定n n最小样本容量:最小样本容量:ØØ样本容量必须不少于模型中解释变量的数目样本容量必须不少于模型中解释变量的数目样本容量必须不少于模型中解释变量的数目样本容量必须不少于模型中解释变量的数目k k(包括常数项)。
包括常数项)包括常数项)包括常数项)n n满足基本要求的样本容量:满足基本要求的样本容量:ØØ当样本容量当样本容量当样本容量当样本容量n n大于等于大于等于大于等于大于等于3030,或者,或者,或者,或者n≥3n≥3((((k+1k+1),),),),才能满足统计模型的基本要求才能满足统计模型的基本要求才能满足统计模型的基本要求才能满足统计模型的基本要求小样本小样本3030时时当当n n大样本大样本3030时时当当n n îíìÞ£Þ>50常用的调查方法常用的调查方法((Survey Methods))n访谈法(Telephone Interview)n邮件访谈法(Mail Interview)n人员访谈法(Personal Interview)n电子邮件访谈法(E-mail Interview)n借助网站设置调查问卷51第五节第五节问卷与问卷设计问卷与问卷设计Questionnaire52问卷的基本结构问卷的基本结构n开头部分Ø问候语(说明调查者的单位和目的、保证保密、激发参与、感谢)Ø问卷编号Ø填写说明(如何答题、如何返回问卷)Ø基本信息(也可以放在问卷结尾)n主体部分(调查的问题、备选答案)n最后致谢语气亲切、诚恳礼貌文字简洁53引自:浙江大学 候璘 《网络消费行为对生活方式影响的实证研究》可以加入调查者的单位,例如可以加入调查者的单位,例如“我们是我们是工业大学管理学院工业大学管理学院……课题调查小组课题调查小组”问卷编号: 54引自:浙江大学 候璘 《网络消费行为对生活方式影响的实证研究》55引自:浙江大学 候璘 《网络消费行为对生活方式影响的实证研究》56引自:浙江大学 候璘 《网络消费行为对生活方式影响的实证研究》5758引自:浙江大学 候璘 《网络消费行为对生活方式影响的实证研究》5960构成问卷的问题类型构成问卷的问题类型n开放型与封闭型问题n回忆型与非回忆型问题n封闭型问题中的单选和多选问题n排序型和非排序型的单选问题61n n开放型问题开放型问题Ø没有事先准备答案;Ø结果不易统计,在问卷形成阶段使用。
n n封闭型问题封闭型问题Ø事先准备好若干答案供选择;Ø在最终问卷中大量使用例例:您经常访问的网上书店是:62n n半封闭型问题半封闭型问题Ø封闭型问题最后的答案设置为“ “其他其他其他其他” ”您认为村委会所起的主要作用应该是()A 调解村民之间的纠纷和矛盾, B 组织村民致富;C 传达上级部门的指示;D 帮助村民搞好农业生产;E 向上级领导反映村民的要求和愿望;F 其他( 请说明 ) 63n n回忆型问题回忆型问题Ø要求应答者把自己的有关记忆表达出来;Ø可以是开放型或封闭型问题;n n非回忆型问题非回忆型问题Ø包括建议型、观点型、感受型问题;Ø可以是开放型或封闭型问题;64n n单选问题单选问题Ø备选答案必须具有互斥性;Ø答案必须具有完备性;Ø每个单选问题设计成为一个变量;n n多选问题多选问题Ø备选答案可以相容;Ø答案尽可能完备;Ø每一个备选答案设计成为0-1变量65按照你的志愿,请按顺序依次选择你打算报考的按照你的志愿,请按顺序依次选择你打算报考的按照你的志愿,请按顺序依次选择你打算报考的按照你的志愿,请按顺序依次选择你打算报考的三所北京的高校:三所北京的高校:三所北京的高校:三所北京的高校:(1)北京大学;(2)清华大学;(3)中国人民大学;(4)北京理工大学;(5)北京师范大学;(6)北京科技大学。
变量变量含义变量值V1报考北京大学么?0/1V2报考清华大学么?0/1V3报考中国人民大学么?0/1V4报考北京理工大学么?0/1V5报考北京师范大学么?0/1V6报考北京科技大学么?0/166要素非常重要(5分)重要(4分)一般(3分)不重要(2分)几乎无影响(1分)企业文化的近似性企业技术的互补性市场的互补性n n排序型问题排序型问题排序型问题排序型问题【例】你认为在企业合并中如下三个要素,哪一个更重要?A.企业文化的近似性 B.企业技术的互补性 C.市场的互补性n n非排序型问题非排序型问题非排序型问题非排序型问题67问卷中量表的主要类型问卷中量表的主要类型n n量表的概念量表的概念Ø测量应答者对某个问题的反应强度的工具单问题量表单问题量表单问题量表单问题量表连续评分量表连续评分量表连续评分量表连续评分量表LiketLiket量表量表量表量表比较型量表比较型量表比较型量表比较型量表排序量表排序量表排序量表排序量表量量表表类类型型68n n单问题量表单问题量表单问题量表单问题量表Ø你认为企业文化差异对企业合并的影响是:n n连续评分量表连续评分量表连续评分量表连续评分量表非常大大 一般 不大几乎无影响54321010069Likert 量表(里克特量表)量表(里克特量表)n又称分项评分量表(Itemized Rating Scale);Ø一个总项分解为若干关联的单选问题;Ø由美国社会心理学家Likert在1932年提出;Ø度量级别可以为5级、7级、9级;Ø分项的得分加总就是总项的得分;Ø也可以分项的平均得分作为总项的得分;Ø注意每个分项陈述的同向性(要么正向,要么反向)70Likert量表举例量表举例分项问题很赞同赞同中立 不赞同很不赞同合并重组对我国创一流大学起到很大作用54321合并重建多科综合性大学,迅速提高了办学实力54321合并重组有效提高了我国高校办学的规模效益54321合并重组有力地促进了高校内部体制的改革54321高校合并的效果总项,设为变量C1√√√√C1=5+3+4+1=13或C1=13/4=3.2571正反题的处理正反题的处理分项问题非常同意同意中立不同意非常不同意该商场服务人员专业知识较精通54321该商场商品类别较齐全54321该商场计算机系统偶尔有故障54321该商场售后服务较好5432172Likert量表的用途量表的用途n测量总括性的问题,例如消费者满意度、对服务质量的看法等;n适合测量态度、看法、观念、反应、思想倾向等;题项题项题项题项非常非常非常非常满意满意满意满意满意满意满意满意一般一般一般一般不满意不满意不满意不满意非常非常非常非常不满意不满意不满意不满意产品外观产品外观产品外观产品外观√√质量稳定性质量稳定性质量稳定性质量稳定性√√使用性能使用性能使用性能使用性能√√安全性安全性安全性安全性√√73量表题数奇偶的选择量表题数奇偶的选择奇数题项奇数题项奇数题项奇数题项AA非常同意非常同意非常同意非常同意 BB同意同意同意同意C.C.中立中立中立中立D.D.不同意不同意不同意不同意E.E.非常不同意非常不同意非常不同意非常不同意偶数题项偶数题项偶数题项偶数题项AA非常满意非常满意非常满意非常满意 BB满意满意满意满意C C不满意不满意不满意不满意D.D.非常不满意非常不满意非常不满意非常不满意74比较型量表比较型量表1.历史传统2.物质环境3.学科特点4.办学理念5.领导能力1.历史传统01102.物质环境10113.学科特点01014.办学理念00105.领导能力1001请两两对比,如果i比j重要,则在表格内填入1,否则填入0ij表表1 影响学校文化差异的主要因素影响学校文化差异的主要因素两两比较量表或配对比较量表Paired Comparison Scaling75排序量表排序量表1~5级重要性等级学校历史传统1学校物质环境5学校学科特点3学校办学理念2学校领导能力45个要素对学校文化差异影响的重要性个要素对学校文化差异影响的重要性1为最重要,5为最不重要等级顺序量表Rank-order Scaling76问卷问题的来源问卷问题的来源n从研究的目标出发Ø问题的不断分解n基于对变量关系的猜想Ø例如变量之间的相关关系n从文献阅读中产生Ø借鉴别人的成熟问卷或者某个理论n从数据处理的角度考虑77问卷设计的原则问卷设计的原则n n能够获得诚实的回答能够获得诚实的回答Ø不能获得诚实回答的问题,都不应设置在问卷中;Ø对怀疑得不到诚实回答的问题,可在问卷不同位置设置相同、相反的问题 ,相互验证;78不能获得诚实回答的问题不能获得诚实回答的问题n某大学想了解报考学生的情商,设计如下问题:当你受到挫折后,你的反应是:当你受到挫折后,你的反应是:( )A. 非常沮丧,长时间不能恢复正常情绪;B. 很沮丧,较长时间不能恢复正常情绪;C. 沮丧,但很快能恢复正常情绪;D. 无明显情绪变化,放弃就是了;E. 越失败,越受挫折,越想再干。
79问卷引自:哈尔滨工程大学 刘宏鹤 《大学生诚信认知及行为的调查与思考》凡答案与应答者利益密切相关的问题,都可能得不到诚实回答!凡答案与应答者利益密切相关的问题,都可能得不到诚实回答!凡答案与应答者利益密切相关的问题,都可能得不到诚实回答!凡答案与应答者利益密切相关的问题,都可能得不到诚实回答!80对怀疑得不到诚实回答对怀疑得不到诚实回答问题的验证问题的验证n在调查社会各个阶层对官本位的态度时,设置如下问题:你最尊重的人是(只能选一) A.有知识的人 B.有钱的人 C.有权的人设置验证问题81验证问题一:验证问题一:假如你正在忙于一件对于你个人而言非常重要的事情,这时你的同事告诉你,市长来访问,希望你去介绍情况,你会( )A立即放下手头的事情,与市长会面;B请同事转告市长稍等一会儿,把手头的事情处理到一个段落后再去;C请同事转告市长,现在很忙,办完手头的事情再去验证问题二:验证问题二:假如你正在忙于一件对于你个人而言非常重要的事情,这时你的同事告诉你,有位著名教授来访问,希望你去介绍情况,你会( )A立即放下手头的事情,与教授会面;B请同事转告教授稍等一会儿,把手头的事情处理到一个段落后再去;C请同事转告教授,现在很忙,办完手头的事情再去。
82Think about it!!n n得不到诚实回答的问题主要有哪些?得不到诚实回答的问题主要有哪些?ØØ与应答者利益密切相关的问题;与应答者利益密切相关的问题;与应答者利益密切相关的问题;与应答者利益密切相关的问题;ØØ有明显社会舆论倾向的问题;有明显社会舆论倾向的问题;有明显社会舆论倾向的问题;有明显社会舆论倾向的问题;ØØ涉及到个人隐私的问题;涉及到个人隐私的问题;涉及到个人隐私的问题;涉及到个人隐私的问题;???83对于得不到诚实回答问题的对于得不到诚实回答问题的变通设计方法变通设计方法n n变换问题的提法;变换问题的提法;n n设计相对性的问题;设计相对性的问题;例:在调查企业的逃税情况时,设计问题例:在调查企业的逃税情况时,设计问题你对同行业同行业中逃税情况的判断是( )A 逃税企业的比例低于5%;B 逃税企业的比例在6%~10%;C 逃税企业的比例在11%~20%;D ……例:与本行业的例:与本行业的×企业相比,贵企业的产品成本(企业相比,贵企业的产品成本( ))A 是×企业产品成本的80%以下;B 是×企业产品成本的81%~85%之间;C 是×企业产品成本的86%~90%之间;D ……84对于得不到诚实回答问题的对于得不到诚实回答问题的转移法转移法对于一些人的高消费现象,人们有不同的看法,对于一些人的高消费现象,人们有不同的看法,对于一些人的高消费现象,人们有不同的看法,对于一些人的高消费现象,人们有不同的看法,您同意哪一种?您同意哪一种?您同意哪一种?您同意哪一种?A.A.是不客观的是不客观的是不客观的是不客观的 B.B.无所谓无所谓无所谓无所谓 C.C.在现代社会可以理解在现代社会可以理解在现代社会可以理解在现代社会可以理解D.D.要具体情况具体分析要具体情况具体分析要具体情况具体分析要具体情况具体分析85对于得不到诚实回答问题的对于得不到诚实回答问题的假定法假定法假如对人口生育不加限制,您认为多子女和独生子女假如对人口生育不加限制,您认为多子女和独生子女假如对人口生育不加限制,您认为多子女和独生子女假如对人口生育不加限制,您认为多子女和独生子女哪一种情况更有利于培养子女?哪一种情况更有利于培养子女?哪一种情况更有利于培养子女?哪一种情况更有利于培养子女?86对于得不到诚实回答问题的对于得不到诚实回答问题的情境法情境法某女工在工厂实行的优化组合中失去了工作。
某女工在工厂实行的优化组合中失去了工作某女工在工厂实行的优化组合中失去了工作某女工在工厂实行的优化组合中失去了工作您能否猜猜是什么原因使她失去了工作您能否猜猜是什么原因使她失去了工作您能否猜猜是什么原因使她失去了工作您能否猜猜是什么原因使她失去了工作? ?A A 人际关系不好人际关系不好人际关系不好人际关系不好 B B工作不努力工作不努力工作不努力工作不努力C C 技术水平不高技术水平不高技术水平不高技术水平不高 D D身体不好,常请病假身体不好,常请病假身体不好,常请病假身体不好,常请病假E E 没有什么特殊原因,只因她是女性没有什么特殊原因,只因她是女性没有什么特殊原因,只因她是女性没有什么特殊原因,只因她是女性87n n单选问题的备选答案应当是一个答案空单选问题的备选答案应当是一个答案空间的完整划分间的完整划分Ø备选答案要穷尽;Ø备选答案之间不能有交集;问卷设计的原则问卷设计的原则88正例:正例:在所有行业(如科、教、文、卫等)设立行政等级制,是( )A 有益无害的;B 利大弊小的;C 利弊相当的;D 利小弊大的;E 有害无益的反例:反例:您的年收入在( )A 5000元以下;B 5000元至10000元;C 10000元至20000元; D 20000元至40000元;反例修正后:反例修正后:您的年收入在( )A 5000元以下;B 5000元至10000元(含10000);C 10000元至20000元(含20000); D 20000元至40000元(含40000);E 40000元以上89n n多选题的备选答案必须是互不排斥的。
多选题的备选答案必须是互不排斥的Ø答案分布在两个以上的纬度上;Ø一个备选答案同时分布在两个纬度上;问卷设计的原则问卷设计的原则例:例:影响项目成功的关键因素包括( )þ资金维度上的一系列备选答案;þ质量维度上的一系列备选答案;þ时间维度上的一系列备选答案;þ人员维度上的一系列备选答案90限定答案个数的多选题限定答案个数的多选题您购房时主要关注的您购房时主要关注的3个信息渠道是:个信息渠道是: A.亲友介绍亲友介绍 B.户外广告户外广告 C.报纸杂志报纸杂志 D.电视电台电视电台 E.现场售楼处现场售楼处 F.购房网站购房网站 91n n问题的陈述及备选答案不能有多重含义问题的陈述及备选答案不能有多重含义问卷设计的原则问卷设计的原则例:在调查农民对土地使用权转让的态度时,设计问题例:在调查农民对土地使用权转让的态度时,设计问题你家耕作土地,是因为( )A 收入稳定,自己喜欢;收入稳定,自己喜欢;B 没有别的收入途径;C……例:你认为某品牌矿泉水是例:你认为某品牌矿泉水是可口、清甜、富含微量元素可口、清甜、富含微量元素的吗?的吗? ( )A 是;B 不是92避免答非所问避免答非所问您认为中国的社会保障制度改革是否有您认为中国的社会保障制度改革是否有您认为中国的社会保障制度改革是否有您认为中国的社会保障制度改革是否有可能获得成功可能获得成功可能获得成功可能获得成功? ?(((( ))))A A不可能不可能不可能不可能;;;;B B非常非常非常非常困难困难困难困难;;;;C C有可能有可能有可能有可能;;;; D D很困难很困难很困难很困难;;;;93问题与答案联起来问题与答案联起来不通顺或不合理不通顺或不合理您认为当前大学生的您认为当前大学生的社会形象是什么社会形象是什么? A A 祖国的希望祖国的希望祖国的希望祖国的希望 B B 名声虽好,但无用武之地名声虽好,但无用武之地名声虽好,但无用武之地名声虽好,但无用武之地C C 并无特殊之处并无特殊之处并无特殊之处并无特殊之处 D D 形象不佳,自身毛病较多形象不佳,自身毛病较多形象不佳,自身毛病较多形象不佳,自身毛病较多94避免类别和程度交织避免类别和程度交织您平时您平时愿意愿意喝喝什么啤酒什么啤酒?95n n问题设计的用语要含义明确问题设计的用语要含义明确。
Ø概念、术语要明确界定;Ø特别是专业性很强的术语;问卷设计的原则问卷设计的原则例:您是例:您是网民网民吗?吗?( ) A 是;是;B 不是例:您在一周上网的次数例:您在一周上网的次数( ) A 0次;;B 1~2次;C 3~4次; D 5~6次;E 7次以上96避玄虚求具体避玄虚求具体例:例:您认为您认为x x奶粉好吗奶粉好吗?(( )) A 好;好;B 不好不好改为分别询问营养、口味、溶解性等改为分别询问营养、口味、溶解性等97化意见为事实化意见为事实例:例:您喜欢跳舞吗您喜欢跳舞吗?(( )) A.喜欢;喜欢;B 不喜欢不喜欢过去的三个月里您跳过几次舞过去的三个月里您跳过几次舞?限定多少次属非常爱好,多少次属一般爱好限定多少次属非常爱好,多少次属一般爱好98n n在问题的陈述中,要对所询问行为的时在问题的陈述中,要对所询问行为的时间做必要的限定间做必要的限定问卷设计的原则问卷设计的原则例:如果您没有电脑的话,您准备购买吗?例:如果您没有电脑的话,您准备购买吗?( ) A 肯定会;肯定会;B 可能会;C 不确定; D 不会例:如果您没有电脑的话,您准备在例:如果您没有电脑的话,您准备在一年内一年内一年内一年内购买吗?购买吗?( ) A 肯定会;肯定会;B 可能会;C 不确定; D 不会99 您第一次购买皮鞋是在什么商店?您第一次购买皮鞋是在什么商店?您去年家庭的生活费开支是多少?您去年家庭的生活费开支是多少?时间过久的问题人们会想不起来。
您家上月生活费支出是多少?您家上月生活费支出是多少?100问卷设计的原则问卷设计的原则n避免诱导性提问避免诱导性提问Ø问题要保持中立(避免贬义或褒义词),不问题要保持中立(避免贬义或褒义词),不能有倾向性;能有倾向性;Ø题干要避免出现判断性语句;题干要避免出现判断性语句;例:很多人认为购买国债是最保险的投资方式,例:很多人认为购买国债是最保险的投资方式,例:很多人认为购买国债是最保险的投资方式,例:很多人认为购买国债是最保险的投资方式, 你认为怎么样?(你认为怎么样?(你认为怎么样?(你认为怎么样?( ))))101n n问句中要避免使用类似的词语:问句中要避免使用类似的词语:ØØ普遍认为普遍认为普遍认为普遍认为ØØ权威机构或人士认为权威机构或人士认为权威机构或人士认为权威机构或人士认为ØØ很多人认为很多人认为很多人认为很多人认为…………,您的看法呢,您的看法呢,您的看法呢,您的看法呢ØØ科学家们认为科学家们认为科学家们认为科学家们认为102调查问句要有亲切感,并要考虑到调查问句要有亲切感,并要考虑到答卷人的自尊答卷人的自尊例:您没有买音响的原因是:例:您没有买音响的原因是:A买不起买不起 B式样不好式样不好 C住房拥挤住房拥挤 D不会使用不会使用例:您没有买音响的原因是:例:您没有买音响的原因是: A用处不大用处不大 B价格不满意价格不满意 C住房不允许住房不允许 D式样不合意式样不合意 103避免提出断定性问题避免提出断定性问题例:您一天抽多少支烟(例:您一天抽多少支烟( ))A. 1支支 B. 2支支……您抽烟吗?(您抽烟吗?( ))A. 是是 B. 否否回答是,再调查抽多少支回答是,再调查抽多少支104避免使用否定句避免使用否定句(否定词容易被忽略)(否定词容易被忽略)例:您例:您不赞成不赞成在公共场合吸烟,是吗在公共场合吸烟,是吗?(( ))A.是是 B.不是不是105n n在问卷问题中,凡是能够限定数量范围的在问卷问题中,凡是能够限定数量范围的要尽量限定。
要尽量限定Ø避免使用模糊语言表示数量问题,例如频率;问卷设计的原则问卷设计的原则例:在日常生活中,您一个月在餐馆吃饭的频率是?例:在日常生活中,您一个月在餐馆吃饭的频率是?( ) A 从不;从不;B 偶尔;C 有时; D 经常例:在日常生活中,您一个月在餐馆吃饭的频率是?例:在日常生活中,您一个月在餐馆吃饭的频率是?( ) A 不到不到1次;次;B 1~2次;C 3~4次; D 5次以上106n n问题的不同提法,可能导致不同的回答问题的不同提法,可能导致不同的回答结果Ø同一个问题正面提出或反面提出,回答的结果不同问卷设计的原则问卷设计的原则例:调查人们对某一问题的满意程度满意程度时,回答满意的人占70%;当调查同一问题的不满意程度不满意程度时,回答不满意的人占50%.同时从正反两个方面提问,同时从正反两个方面提问,求应答比例的平均值求应答比例的平均值解决方法107n问卷的长度不能太长Ø设计问卷的长度要考虑应答者的回答耐心;Ø避免使用冗长复杂晦涩的语句;Ø一般问卷应答时间在20分左右为宜;ØA4的版面不要超过3页;Ø便利抽样的问卷应答时间控制在3~5分钟问卷设计的原则问卷设计的原则108问卷设计的原则问卷设计的原则n合理安排不同难度的问题的前后顺序Ø容易、有趣的问题放在问卷前面;Ø较难、不愿回答的问题放在问卷后面。
109n n问卷设计一定要通过小规模访谈来修改问卷设计一定要通过小规模访谈来修改Ø预试问卷要小规模试调;Ø可以设计开放型问题;Ø问卷题项的增删,用语的调整;Ø最终确定正式问卷问卷设计的原则问卷设计的原则110问卷的回收率问卷的回收率111问卷的回收率要求问卷的回收率要求n成功的问卷回收率应达到70%以上;n50%的回收率是发送问卷调查的最低要求;n如果回收率不到50%,那么该问卷调查就已失败,此调查就应终止112思考题思考题找出错误找出错误n n您所居住的地区饮食、文化服务方面条件怎您所居住的地区饮食、文化服务方面条件怎样?样?n n您近年的食品消费和衣着消费水平具体有多您近年的食品消费和衣着消费水平具体有多大提高大提高?n n您认为当前农村的情况怎样您认为当前农村的情况怎样?n n您家的生活消费结构是怎样的?您家的生活消费结构是怎样的?n n各国医学界已确认吸烟对人体危害很大,您各国医学界已确认吸烟对人体危害很大,您准备戒烟吗?准备戒烟吗?n n您今年以来看过几次我们的广告您今年以来看过几次我们的广告?113思考题思考题找出错误找出错误n n您觉得您家用于生产的资金和生产资料够用吗您觉得您家用于生产的资金和生产资料够用吗您觉得您家用于生产的资金和生产资料够用吗您觉得您家用于生产的资金和生产资料够用吗? ?n n很多人认为,绩效工资改革有利于我国事业的很多人认为,绩效工资改革有利于我国事业的很多人认为,绩效工资改革有利于我国事业的很多人认为,绩效工资改革有利于我国事业的单位的发展,您的看法呢单位的发展,您的看法呢单位的发展,您的看法呢单位的发展,您的看法呢? ?n n计划生育是一项基本国策,您认为一对夫妇最计划生育是一项基本国策,您认为一对夫妇最计划生育是一项基本国策,您认为一对夫妇最计划生育是一项基本国策,您认为一对夫妇最理想的子女数是多少理想的子女数是多少理想的子女数是多少理想的子女数是多少? ?n n科学家们认为,建设该电站是安全可靠的。
您科学家们认为,建设该电站是安全可靠的您科学家们认为,建设该电站是安全可靠的您科学家们认为,建设该电站是安全可靠的您认为我国是否应该加快核电站建设认为我国是否应该加快核电站建设认为我国是否应该加快核电站建设认为我国是否应该加快核电站建设? ?n n您是否认为使用电脑数字技术制作的广告更具您是否认为使用电脑数字技术制作的广告更具您是否认为使用电脑数字技术制作的广告更具您是否认为使用电脑数字技术制作的广告更具有吸引力?有吸引力?有吸引力?有吸引力?114思考题思考题找出错误找出错误n n若有一份工作,几个人竞争,您也想做,若有一份工作,几个人竞争,您也想做,您会怎样您会怎样?A.施展自己的才华,超过对手B.打通各种关系,轻取对手C.顺其自然、听凭命运D.从舆论上贬低对手115n您的婚姻状况?A未婚 B已婚n您认为我国农村目前出现辍学率上升现象的主要原因是什么?A.受社会上“读书无用论”的影响B.农村孩子读了书也不能帮助家庭发家致富C.农村教育水平低下,教学水平不高D.受“经商热”的影响,想早点挣钱养家116第六节第六节获得数据的信度获得数据的信度117测量值X=T+S+RT为真实值数据误差数据误差系统误差系统误差S随机误差随机误差R测量工具的偏误评价者的偏向应答者的偏向各种随机因素数据误差数据误差非抽样误差非抽样误差S抽样误差抽样误差R测量工具的偏误评价者的偏向应答者的偏向各种随机因素118测量的信度测量的信度n信度(Reliability)的含义Ø测量结果的稳定性稳定性或一致性一致性;Ø只受到随机误差R的影响;重测信度重测信度先后测量的一致性1复本信度复本信度2相似测量的一致性内部一致内部一致信度信度3关联测量的一致性评分者信度评分者信度测量主体的稳定性4119n重测信度(Test-retest Reliability)Ø在尽可能相同的条件下测量两次;Ø信度用两次测量的相关程度相关程度来衡量;Ø两次测量之间要适当间隔一段时间;120n复本信度(Alternate-form Reliability)Ø用相似的两套量表的测量结果之间的相似性来衡量问卷信度;Ø改变题项顺序或者问题陈述用语,就可产生复本问卷;Ø两套问卷的应答差异不大,具有较好的信度。
问卷一问卷一问卷二问卷二...….………………...….………………121n内部一致信度(Inter-item Reliability)Ø各个子问题之间的一致性;在过去一周中,你的反应是:从不有时会大多数时间会总是如此胃口差到不想吃东西1234感到很疲劳1234感到沮丧1234对未来的生活很悲观1234对未来充满焦虑1234感到孤独1234测量情绪低落程度高度关联122内部一致信度的内部一致信度的SPSS计算计算nCronbach α系数(克朗巴哈系数)α系数≥0.90.9>α ≥0.80.8>α ≥0.7α<0.7含义内在信度很高内在信度可以接受量表设计有问题,但仍有参考价值量表设计存在很大问题SPSS的实现:Analyze→Scale → Reliability Analysis123分析实例分析实例n心理评价问题由6个子问题来测量:Ø支配性;Ø稳定性;Ø社会性;Ø激动性;Ø活动性;Ø深思性124125126127n评分者信度(Inter-observer Reliability)Ø衡量评价人的稳定性;Ø测量工具本身规范,则不同评价人的评价结果不应相差太大128。












