
考研实验心理学笔记.pdf
53页一、心理学实验研究的一般程序(-)课题选择与文献查阅1 . 课题选择选择研究课题包括选择研究方向和选择具体研究课题两个方面的内容确定研究方向,就是就是研究者在一个较长的时期内研究活动的工作方向1 .1 研究课题的类型按照研究目的的区分, 可以分为理论性课题和应用性课题 理论性课题是指以揭示心理现象本质及其发展变化规律的课题 应用性课题是指直接为社会实践服务,以提出解决某种社会实践问题的具体方案或对策为主要目的的课题按照研究的深度区分,可以分为描述性课题、因果性课题和预测性课题1 .2 课题选择的原则课题选择既是研究的起点,也是决定整个研究工作成败的关键课题选择一般遵循如下原则:a 需要性原则,即根据社会需要和心理学自身发展的需要选择研究课题b 创造性原则,即研究必须有创新,有独到之处c 科学性原则,即研究选题应在一定的科学理论的指导下进行,必须有一定的事实根据和科学根据,以保证研究最大可能地保持成功d 可行性原则,即研究者具备完成研究课题的主客观条件C课题选择的程序一般遵循,a 初步选出研究课题;b 对选题进行初步探索;c 将选题具体化;d 攥写研究报告;e 征求意见,反复修订2 . 文献查阅2. 1 文献查阅的作用。
a 有助于研究者对有关领域的研究情况有一个系统全面的认识和了解;b 有助于研究者选择研究课题,形成研究假设:c 有助于研究者搞好研究设计;d 有助于研究者解释研究结果撰写研究论文2. 2 文献查阅的原则a 在时间上应当从现在到过去,采用倒查法b 在范围、数量上应有所限制,应以一些学术性强、影响大、质量高的学术杂志为主要对象c 应注意多收集第一手资料d 应注意收集代表各种各样观点、得出不同甚至矛盾结论的文献e 不仅要搜集与自己研究课题有关的资料,还应注意跨学科跨领域的搜集资料C文献搜集的方法第一种方法检索工具查找法,第二种是参考文献查找法(-)提出问题与研究假设1 . 提出问题研究问题通常是在阅读文献的基础上提出的, 应是非常具体的问题问题提出时应明确变量之间关系, 即研究的自变量和因变量之间的关系以及不同自变量之间可能存在的交互作用通常情况下, 可以从理论、实践应用和研究方法等方面提出具体的研究问题研究问题一般具有以下特征:a 研究问题通常涉及两个或两个以上的变量,并询问其关系如何;b 研究问题应该以问题的形式出现;c 研究问题应具有可解性,即研究者通过各种研究方法能够回答研究问题;d 研究问题的陈述不应该带有任何主观好恶等情感色彩。
对研究问题的评价可以从这样几个方面考虑:研究意义、研究的创造性和创新性、研究的可行性2 . 研究假设研究假设是对研究问题可能的结论的一种预期假设具有两个特点:第一,有一定的科学依据;第二,有一定的推测性提出研究假设的基本方法有演绎法和归纳法两种从研究假设内容的性质分类,假设一般可以分为:a 预测性假设,即对客观事物存在的某些情况, 特别是差异情况做出推测判断b 相关性假设, 即对事物相互联系的性质、方向、密切程度做出推测判断c 因果性假设,即对事物间因果关系的推测判断根据假设陈述的概括性性质,假设可以分为:a 一般假设,即对客观事物的状态、性质、相互联系的本质和运动变化规律具有较普遍适用性假设b 特定假设,即对某一特定事物的特定状态、性质和联系提出的假设,它预测的是事物间的特定联系根据建立假设的目的不同,可以把假设分为:a 析因性假设,即为了解释、控制行为的起因而建立的假设这类假设的自变量和因变量之间是•种因果关系b 描述性假设,即为了描述和预测行为而建立的假设,条件和行为之间是种相关关系,不 定 是 因 果 关 系 评价研究假设的标准:a 是否有一定的科学依据;b 是否对两个或两个以上的变量之间的关系作出推测;c 是否表述清楚;d 是否具有可检验性e 陈述是否简单明了。
三) 实验设计与实施1.实验设计实验设计一般包括以下步骤:a 考察行为的内容,即研究者要考察假设中含有的行为指标的内容通常一个研究不可能对一个行为指标中包含的所有内容都进行探讨, 而只是选择其中某个或某几个关心的变量进行探讨b 定义总体和样本一个实验不可能对所有符合条件的人群总体进行研究,只能从总体中抽取特定的、 具有代表性的人群作为一个样本进行研究, 然后再把样本研究的结果推广到总体中去C 变量选择 个行为指标中往往含有很多内容, 每项内容都可以构成一个特定的变量,研究者要从中选择那些具有代表性的变量作为研究变量d 建立操作性定义 操作定义是指用事物的可观察的、 可测量的特征把研究变量具体化操作定义的作用: ( 1 )有助于提高研究的客观性; ( 2 )有利于学术交流; ( 3 )为重复研究提供保证 预期变量的关系,也就是研究假设2 . 实验的实施A被试的取样与分配取样的重要原则是样本要有代表性,样本要能够代表研究规定的总体常见的取样方法有:a 简单随机取样,即从总体中随机抽取个体,直到满足样本数量为止b 系统随机抽样,即从总体人群中每隔恒定的个体数选取一个被试c 分层随机抽样,即先把总体按照被试某个或某几个特点分层, 然后在每一层次中随机取样。
d 等组匹配取样,即在分组匹配的基础上一进行取样e 方便取样,即选取那些最方便得到的被试f 个案样本取样,即在不具备获得足够数量样本的情况下,选取个案进行研究样本容量是山统计抽样的基本原理、 研究内容、 研究方法以及课题本身的客观条件等因素决定的统计抽样的基本原理是确定样本容量的基本前提一般情况下,样本容量的确定主要应该考虑实验设计、各因素的水平等问题实验设计的因素和因素的水平越多, 抽取的样本数量就会越大B 创建实验材料包括正式的实验材料、知情同意书、练习材料和实验指导语等C执行实验获取数据这是正式实验阶段研究者在先前准备的基础匕按照一定的程序,对被试实施实验处理,获取实验数据 四)数据处理与统计分析通过各种方法收集到的数据, 必须经过分析处理才能得出合适的结论 对数据的处理首先应该对数据进行整理、审核、剔除无效数据然后,将数据编码、录入计算机最后,通过适当的统计分析方法,得出恰当的结论统计方法包括两大部分:描述统计和推断统计 五)研究报告的撰写研究报告是对研究成果的总结报告 一篇完整的心理学研究报告包括: 题目、关键词、摘要、前言、方法、结果、讨论、结论以及参考文献等二、实验心理学中的变量变量指在数量上或质量上可以变化、操纵或测量的条件、现象、事物或事物特征。
可以分为作业变量、环境变量、被试变量和暂时的被试变量作业变量( t a s k v a r i a b l e ) 是指在实验中所呈现的、和被试任务有关的某种刺激环境变量( e n v i r o n m e n t a l i n d e p e n d e n t v a r i a b l e ) 是当被试在进行某种作业时,如果改变环境中的任何特性,那么改变了的环境特性就是环境自变量被试变量( s u b j e c t v a r i a b l e ) 时在外界条件一致的情况下, 可能影响对某种刺激的反应的被试的特性因素 暂时的被试变量即通过主试的言语、态度以及用某些方法使被试的特性、机能状态等方面产生一时的变化,这类自变量就是暂时的被试变量被试的暂时差别通常是由主试给予不同的指示语造成的 一 ) 自变量及其操纵,11单选自变量( i n d e p e n d e n t v a r i a b l e ) 是在实验中山实验者操纵和控制的、 对被试的反应产生影响的变量1 .自变量的种类根据自变量是否可以操纵可以分为:可操纵的自变量和不可操纵的自变量可操纵的自变量是指研究者可以直接操纵的自变量, 对它定义的不同水平属于不同的实验条件。
不可操纵的自变量也称被试变量,是研究者不可以直接操纵,由被试的一些特性所构成的变量,它只能基于被试固有的特性来选择不同类型的被试,对它定义的不同水平是指不同的被试组区分方法,考虑该变量是否可以将被试随机分配到该变量的各个水平,可操纵变量是可以对被试随机分配的 另外, 有时候同一变量既可以是可操纵变量, 也可以是不可操纵变量根据刺激的来源不同,自变量可以分为外部刺激和内部刺激 外部刺激包括物理成绩和社会性刺激, 这类刺激一般比较容易操作化内部刺激来自被试本身的特性, 如年龄、 性别、民族、文化程度、婚姻状况等另外也可以通过某种测量对被试进行分类来获得自变量的不同水平,比如被试的智力、身高等 被试暂时特性是指由研究者操纵外部刺激引起并影响被试的行为的中介心理变量,如动机、疲劳等这类自变量的操作化比较困难,研究者需要对引起被试暂时特性的方法详细定义2 .自变量的操纵对变量下操作定义的三个优点:A可以使研究者的思考具体清晰B 可以增进科学研究者之间沟通的正确性C 可以减少一门学科所用概念或变量的数目建立操作性定义的方法:A 建立合适的操作定义操作定义要敏感的反应出自变量的变化,能够真正揭示自变量的本质。
建立操作定义的方法:a使用现有的信息来定义;b 通过操纵创建情景状态来定义;c 利用评定获得的信息来定义B 确定处理水平确定自变量的处理水平包括确定数量、间距和范围C 校准测量自变量的仪器这是获得可靠自变量数值的保证D 控制呈现刺激的方式包括控制刺激呈现的时间、时间间隔、呈现顺序和呈现的空间方位控制自变量时应注意三个问题:A 所规定的自变量是否是真正的自变量,要注意防止虚假自变量 B 自变量的选择是否存在单一性偏差( 取样的代表性问题) " 自变量的层次性( 要考虑不同自变量的层次对不同因变量层次的实验效应)操纵/ 控制自变量的7 个方法:A采用明确、统一可以量化的术语对对自变量下操作定义( o p e r a t i o n a l d e f i n i t i o n ) (,B自变量各水平/ 检查点的确定( 水平是指自变量的一个取值) : a因素型实验的自变量一般不超过4个水平, 并尽量使自变量变化的范围( 全距) 较大, 各个水平在全距上分布平均b 线性函数型实验的自变量可以取3〜5个水平 c 复杂函数型实验的自变量至少要取5 个水平C自变量的范围 a自变量的变化范围不应过小, 可以通过查阅文献来确定全距的大小。
b自变量的各水平在全距上的分布应根据实际情况确定D自变量的间距确定的原则是,两个不同的检查点能引起被试不同的反应,即间距不能小于差别阀限E 对呈现仪器的控制( 这是一个重要的环节,但是很容易被忽视)F 控制呈现刺激的方式G充分控制无关变量 二)因变量及其观测因变量( d e p e n d e n t v a r i a b l e ) 是指在实验中山实验者操纵自变量而引起的被试的某种特定反应常见的因变量类型有:反应的正确性、反应的速度、反应的概率、反应的难度、反应的次数、反应的强度以及量表分数和评定分数等此外,因变量还可以是被试的口语记录,在心理学实验中口语记录是重要的参考费料, 其有助于我们分析被试的内部心理活动因变量要能灵活地反映出自变量变化所造成的影响 一个好的因变量要满足以下要求:第一,要具有有效性、客观性、敏感性和可靠性有效性实验中观测的因变量正是实验者欲研究的心理或行为反应 可信性是指因变量观测的信度,即对同一被试重复观测的结果应是相同或相近的当自变量的变化不能引起相应的因变量的变化时, 这样的因变量是不敏感的典型代表是天花板效应和地板效应天花板效应( ce i l i n g e f f e ct ) / 高限效应是指当要求被试完成的任务过于容易, 所有不同水平的自变量都获得了很好的结果, 并且没有什么差别时, 我们就说实验中出现了天花板效应。
地板效应( f l o o r e f f e ct ) / 低限效应是指当要求被试完成的任务过于困难,所有不同水平的自变量都获得了很差的结果,并且没有什么差别时,我们就说实验中出现了地板效应以上两种效应影响指标有效性的原因是, 两种效应的反应指标量程不够大, 会造成反应停留在指标量表的最顶端或最低端,从而使指标有效性遭受损失避免两种效应的方法是, 先尝试着通过实验设计去避免极端的反应, 然后再试着通过少量的先期被试来考察他们对任务操作的反应情况 如果被试的反应接近指标量程的顶端或低端, 那么实验任务就需要修正 设计实验任务和反应指标的指导思想是使被试的反应情况分布在指标量程的中等范围内第二,观测因变量的方式要适当常见的因变量观测方式有:生理测试、行为测试、言语测试第三,观测值应是连续的数值因此,因变量的选择及其观测方式的确定应注意:首先,参考前人有关研究中所用的因变量及原因,建立合适的操作定义其次,考虑实验中的被试情况、自变量、任务、所用仪器等.再次,考虑因变量的有效性、敏感性和可信性又次,因变量应是连续数据最后,注意实验反应指标间的相互制约,彼此联系的关系控制因变量的6 种方法:A规定好反应的操作定义。
B反应控制C 选择恰当的因变量指标D避免量程限制E 控制被试的态度F反应指标的平衡反应控制的目的: 让被试的反应确实发生在实验者感兴趣的因变量维度上 在以人作为被试的实验中,对反应的控制往往是通过指导语实现的当指导语不能充分地控制反应时,就要很好地考虑刺激条件和实验装置使刺激条件、实验装置和指导语配合起来,使被试只能作出主试所要求的反应规范的指导语应具备的4个要求:A内容确定,即主试要严格确定给被试什么样的指导语B完全,即在指导语中要把被试应当知道的事交代完全C简单明确,即要保证被试真正懂得指导语的要求D标准化,最好能用录音机给出指导语 三) 额外变量及其控制自变量的混淆是指研究者选定的自变量与一些未控制好的因素共同造成了因变量变化的现象因此,也可以说额外变量就是潜在的自变量控制变量(controlled variable)/额外变量(extraneous variable)指实验中除了自变量以外的影响实验变化和结果的潜在因素或条件 可以用实验结果的误差分散大小来表示额外变量的控制成功与否当实验结果的误差分散小时,表明额外变量控制得好;反之,则表明有意外的无关变量的混入1 .额外变量的主要类别额外变量通常包含两大类,即随机的额外变量和系统的额外变量。
随机的额外变量是指在实验中偶然起作用的额外变量系统额外变量是指经常地、稳定地起作用的额外变量从误差的来源划分,可以分为:A来自被试方面的额外变量主要涉及:参与研究的动机、焦虑、有关经验、 性格特点、当时的生理状态、被试的反作用等B来自主试方面的额外变量研究者的年龄、性别、外表、言谈举止、态度、暗示等都有可能影响研究结果另外, “ 实验者效应”也会对研究结果产生干扰C来自实验设计方面的额外变量主要包括:研究方法本身不完善;测量仪器、设备的安排、布置、调整不当;测量工具不完善;被试选取、研究时间和环境选取等方面的不足;研究程序安排不当等D来自研究实施环境条件方面的额外变量研究实施过程中的许多因素,如:温度、光线、声音、布置、熟悉性、空间大小等,都可能影响被试的行为另外,研究实施过程中的意外事件如停电、仪器故障等,也会影响研究E来自数据处理方面的额外变量如,数据分类不当、评价标准不同一统计方法不恰当等2 .额外变量的控制方法( 1 )排除法(elimination method)消除法就是通过一定的手段或措施,将影响研究结果的额外变量消除掉它是消除无关变量最简单的方法,也是控制额外变量的最主要、最理想、最基本的方法。
排除法虽然有效但所得到的研究结果却难以推广消除额外变量的方法很多,要根据额外变量产生的原因选择具体的方法比如,为了消除 “ 实验者效应”和 “ 霍桑效应”,可以采用“ 双盲程序”,即主试和被试都不知道实验目的和意图; 为了消除被试的焦虑紧张不合作以及不认真的态度等, 可设法与被试建立良好的合作关系等2 )恒定法(constant method)恒定法是使额外变量在实验过程中保持恒定不变,这主要体现在保持实验条件恒定方面,是控制无关变量最基本的方法恒定法虽然不能把额外变量带来的影响消除掉, 但是, 它可以使这些影响处于一个恒定的水平但恒定法会降低实验结果的可推广性 3 )平衡法(counterbalancing method) 平衡法用于额外变量的消除或保持恒定有困难的情况,通过某些综合平衡的方式使其效果平衡的方法其具体方法很多控制组法是常用的平衡法之一a对比组法对比组法的基本思想是,按照随机原则抽取两个被试组这样,两个组之间除了研究变量差异外,在其他额外变量的效果方面都是相等的b循环法( 抵消平衡法) 用于消除在实验中由实验顺序所造成的练习、适应、疲劳以及由于刺激的空间位置不同、 反应的动作方式不同等对实验结果发生影响的方法, 这种方法也称为循环法。
常见的抵消法有ABBA法和拉丁方设计法c匹配法(matching method)将实验组和控制组被试除自变量之外的其他条件尽量保持相等,并将被试依据某些特质两两配对当被试数目较少时,对比组法很难保证不同组被试之间是同质的 匹配法则是根据被试某些方面的行为特征或行为表现, 将被试人为地划分为具有相同特质的若干组,以保证被试在可能影响研究结果的特质上严格地平衡匹配法的缺点:在理论上可取,但难以进行实际操作因此在实际应用中,匹配法常常结合其他技术共同使用d兼作组法e纳入因素法4 )统计控制法(statistical control) ,,统计控制法主要用于实验前难以完全控制额外变量影响的情况, 统计控制法对于实验前控制只是起到补充的手段, 而不可能取代实验前控制的重要地位常用的统计控制法有协方差分析、剔除极端数据和分别加权法等 ( 实验后控制)( 5 )随机化法(randomization)依据数学上的概率原理,将被试按相等的原则分组这一方法在理论上可以使不同组的被试除实验处理外, 其他额外变量保持相等, 因此可以弥补匹配法的不足并且随机化法不会导致系统性的偏差,能够控制难以观察的中介变量随机法不仅可以应用于被试, 也可以应用于刺激呈现和实验顺序的安排。
主要有随机抽取样本和随机分组等方法随机分组是指被试或实验单元是随机分配给实验中各处理条件的鉴别无关变量控制成功与否的方法是当实验结果的误差分散小时, 可以认为无关变量得到了较好地控制;反之则表明无关变量的控制失败此时应当认真分析无关的因素是什么如果经过认真的分析, 有些无关还是难以被控制就终止, 从别的角度设计实验或等找到控制这些变量的方法和技术时再实验两个典型的额外变量:a实验者效应b要求特征实验者效应( e x p e r i m e n t e r e f f e c t ) :主试在实验中可能以某种方式( 如表情、手势、语气等) 有意无意地影响被试,使他们的反应附和主试的期望实验者的性别、种族和伦理观念也是潜在的实验者效应,即使在用动物做实验时也有可能出现实验者效应 可采用双盲实验来克服这一效应要求特征( d e m a n d c h a r a c t e r i s t i c s ) 是指在实验中被试可能会自发地对实验的目的产生一个假想,然后再以一种自以为能满足假想的方式进行反应要求特征是一个潜在的、强有力的,也是社会科学独有的偏差来源美国心理学家奥恩首次提出了这个问题, 其典型例子是霍桑效应( H a w th o rn e e f f e c t) 和安慰剂效应( p l a c e b o e f f e c t) »控制要求特征的3 个方法:a 以录音或录象等自动化的方式呈现指导语;b 双盲实验;c增加被试的数量。
要注意, 在某些实验中尽管己经通过实验设计对要求特征加以控制, 但要求特征对实验结果仍有较大的影响,此时应在实验设计中有意识地加以鉴别鉴别的方法是a 实验后的询问( 如让被试填写有关的调查表或直接谈话) ;b 采用控制组双盲实验( d o ub l e - b l i n d e x p e ri m e n t) :在实验中让实验的操作者和实验被试都不知道实验的内容和目的,由于实验者和参加者都不知道哪些被试接受哪种实验条件, 从而避免了主、 被试双方因为主观期望所引发的额外变量 在有效消除源自实验者效应和被试效应的额外变量的干扰方面,双盲实验就很好到利用了排除法三、实验设计与统计方法( 一) 实验设计1 . 实验设计及评价标准实验设计( e x p e ri m e n ta l d e si g n ) 是指实验进程的计划,其中包括实验对象的选择、实验因素的控制和实验程序的编排等实验设计的目的是减少额外变量的干扰实验设计是指研究者针对需要验证的实验假设, 为有计划地搜集观察资料而预先建立和依据的工作模式 心理学的实验设计是一门心理学与统计学相结合实验技术科学 广义地讲,实验设计包括几个方面:形成统计假设,并为检验假设、搜集和分析数据制定有效的计戈IJ;阐明检验假设所遵循的决策;按计划搜集资料:按计划分析数据;对统计假设的真伪作出归纳性推断。
良好的实验设计不仅是实验过程的依据和处理结果的先决条件, 也是科学研究获得预期结果的一个重要保证评价一个实验的良好性,首先是获得总体信息和代表性高信息的程度其次,这种设计测量出的信息正是要测的包含在样本中的信息可见,良好的实验设计必须满足两个标准,第一是内部效度,第二是外部效度内部效度是指实验变量能被精确估计的程度如果排除对实验结果产生干扰的无关因素,能够使研究者相信实验结果确实是山实验变量引起的,则说明这个研究具有内部效度0外部效度是指实验研究的结果能被概括到实验情景条件意外的程度实验设计的功能:a使因变量的变化最大b能控制好各种影响实验结果的额外变量c使实验中的误差变异最小评价实验设计的标准:a能够恰当地解决所欲解决的问题b恰当地控制实验中的额外变量c使实验结果有很高的可靠性实验设计的类型:a真实验设计( 多变量设计; 被试间设计和被试内设计;小样本设计)b准实验设计c非实验设计2 .前实验设计与事后设计这两种实验设计都属于非实验设计 非实验设计是一种对现象的自然描述, 一般用于识别和发现自然存在的临界变量及其关系,它可以为进一步实施更严格的实验设计积累资料在使用这种设计时往往不易采取随机化的原则分配被试, 而且也不易主动地控制自变量和其他无关变量。
但是许多有效的实验研究都是在非实验设计的基础上取得成功并得到发展的2. 1单组后测设计只有一个实验组,,没有控制组,对这一实验组只给予一次实验处理,然后通过测量得到一个后测成绩但是这一后测成绩很难说明是由实验处理X引起了实验结果0,a设计模式: X 0b缺点:第一,没有对照组,研究者只能描述他所观察到的结果,而不能与对等控制组进行比较第二,这一研究没有前测,因此失去了与前测成绩进行比较的依据第三,没有控制机体变量、自变量及其他无关变量第四,不能排除历史、选择和成熟等因素的影响2. 2单组前测后测设计这种实验设计是对单组后测设计的一种改进, 它增加了在实验处理前的测验, 但还是仅有一个实验组是一种有用的非实验设计a 设计模式: 01 X 02b 优点:首先,由于增加了前侧,该种设计可以提供被试的基线数据及某些有关信息其次,控制选择变量,便于估计被试的个体态度对实验效果的影响( 只有一个实验组,这一实验组又是控制组)缺点:第一,历史因素常与实验处理的效应相混淆,使研究者很难判断在01与 02之间出现的差异是由处理引起的,还是由无关因素引起的第二,成熟影响实验的内部效度第三,前测验可能会对后测的内容或形式产生威胁,从而影响实验处理的效果。
第四,仪器、统计回归以及测验与处理的交互作用等也都可能会对实验的内部效度造成影响c 设计的显著性检验可以使用3 种统计分析方法即相关样本的t- 检验; 非参数的符号检验法;非参数的符号秩次检验法2. 3 固定组/ 静态组/ 整组比较设计采用实验组和控制组两组被试, 但不使用随机化的原则来选择被试, 这两组被试在实验处理前就已经形成了a 设计模式: 实验组 X 01控制组 02b 优点:首先,控制了历史因素其次,控制测验效应和仪器因素的干扰( 无前测验)最后,控制成熟因素( 使用了控制组)缺点:第一,对选择因素缺乏控制( 即被试不是随机选择的)第二,选择与成熟的交互作用,以及选择与处理的交互作用常常会影响实验的效度c 设计的显著性检验:可以使用4 种统计分析方法, 包括独立样本的L检验;非参数检验中的U-检验法;非参数检验中的中位数检验法;X-检验法2. 4 事后回溯设计事后设计是指所研究的现象已经发生之后对其发生原因进行追溯 其研究对象是已经发生过的事件 在研究的过程中, 研究者不需要设计实验处理或操纵自变量,只需通过观察存在的条件或事实,将这种已自然发生的处理或自变量与某种结果或因变量联系起来加以分析,以便从中发现某种可能的简单关系。
事后回溯设计主要包括两种类型,相关研究设计和准则组设计a 设计模式一:X 0b 优点:首先,事后实验设计特别适用于对自然条件下出现的事件或各种学习现象进行时间上的追溯,以了解产生这些现象的信息 其次,事后回溯设计特别适用于研究简单的因果关系问题再次,可以为提出的假设提供充足的论据又次,事后回溯设计不需要人为作用的参与,在某些环境或特殊的条件下比其他的实验设计更有用因此, 研究者在不能采用严格的实验设计进行研究时,可考虑采用该设计方法缺点:第一,在设计中缺乏控制,研究者不能操纵自变量或随机分配被试第二,研究中所追溯的原因可能有多个, 在不同的情况下, 一个特定的结果可能是由不同的原因引起的第三,两个相关的因素可能并不存在因果关系,它们可能都是第三个因素的原因或结果改进方法: 将调节变量引入事后回溯设计, 利用方差分析的统计分析方法就可以达到对调查中的测量进行必要的控制设计模式: XI Y1 01X2 Y1 02X3 Y2 03X4 Y2 042. 4. 1相关研究设计相关研究设计是在•个被试组内收集两个集合的数据, 其中•个数据集合是观察到的结果, 另一个则是被追溯的数据集合, 研究的目的是确定这两个数据集合之间的关系( 正相关、负相关和无关)。
a 设计模式: 01 02b 使用相关研究设计的目的在于借助所测量的变量之间的相关系数来确定变量之间存在的某种关系, 并为提出变量间的因果关系奠定基础 通常某些研究的主要目的是要确立所研究的结果与追溯的原因存在着某种关系而不是进一步证实哪一个是原因,哪一个是结果注意: 两变量之间存在相关关系并不一定意味着就是存在因果关系 关于两变量间的相关关系有3 种解释,第一,01是 02的原因或一部分原因第二,02是 01 的原因或一部分原因第三,01和 02是未被测量的第三个变量的原因或一部分原因c 设计的显著性检验可使用3 种统计方法第一,当所研究的两个集合中的数据都是连续数据时,可采用皮尔逊积差相关系数第二,当所研究的两个集合中的数据一个是连续变量,另一个是二分变量时,可采用点二列相关系数第三,当所研究的两个集合中的数据都是等级变量时,可采用斯皮尔曼等级相关系数2. 4. 2 准则组设计:与相关研究设计类似,是对已经发生的事件进行研究的•种非实验设计它要求研究者通过对所研究现象的被试的比较,确定某些被试( 准则组)具有一种状态的特征,而另一些( 非准则组)不具有这种状态的特征,然后去追溯可能存在的原因。
a 设计模式: X 0102b 准则组设计的两个用途:第一,通过准则组与非准则组的对比,追溯与准则组相联系的特征有哪些 第二,比较准则组与非准则组对学习效果产生的影响有哪些这里应该考虑准则组在智力发展、成熟等方面是否优于非准则组c 设计的显著性检验可使用4 种统计方法:t - 检验、z-检验、非参数的曼- 惠特尼U-检验和中位数检验法2. 4. 3 相关研究设计与准则组设计的关系前者的主要用途是辨认两个变量或两种现象间是否存在•定的关系以及存在什么形式的关系, 后者的主要用途是通过准则组与非准则组的对比, 研究存在一定关系的两变量之间具有什么样的状态特征3 . 准实验设计准实验设计( quasi-experiment design) 是指未对自变量实施充分的控制,但使用真正实验的某些方法搜集、 整理以及统计分析数据的研究方法 准实验设计用于严格实验无法进行的情况该设计常采用被试变量作为自变量,其本质是一种相关研究,其实验结果只能说明变量之间是相关的, 而不能说是一个变量的变化引起了另一个变量的变化 准实验设计介于非实验设计和真实验设计之间, 它对无关变量的控制比非实验设计要严格, 但不如真实验设计控制得充分和广泛。
通常准实验设计不易对被试进行随机抽样、随机分配,这时虽然可以设立控制组, 但实验组和控制组的背景条件不可能保证一定相同与前实验相比,准实验力图通过程序的改变,尤其是对测量的调整来提高对无关变量的控制优点: 弥补了严格意义上的实验研究的不足; 可以使研究者在道德和能力许可的范围内尽可能多地关注其所感兴趣的问题缺点:在该实验中实验者的自由度小,对额外变量的控制力弱;只能得到自变量和结果变量间的相关3. 1单组准实验设计适用于因条件限制和问题的性质而使研究者无法采用控制组的情况3. 1. 1 时间序列设计时间序列设计是指对一组非随机取样的被试实施实验处理, 并在实验处理前后周期性地作一系列测量,然后分析设计结果是否具有非连续性,从而推断实验处理的效果实验处理的一系列测量结果反映出被试被试的最初水平或状态, 这种状态下的测量分数为基线 在分析时间序列设计结果时, 要注意实验处理前后的测量分数的总趋势和变化的连贯性时间序列设计多用于小样本实验,其结果采用t 检验进行考察a 设计模式: 01 02 03 04 X 05 06 07 08b优点:可以为研究者提供许多方便,并能较好地控制无关变量与处理效应。
山于时间序列设计可以多次测量被试在处理前后的数据,因此通过观察处理X前后的变化趋势, 就可以判断处理X前后在整个实验过程中的作用也可以较好地控制“ 成熟”因素对内部效度的影 响 ( 在 0〜0 的系列测量过程中,其间隔时间基本相同,在每个时间间隔内成熟的发展基本是相同的)还可以控制测验因素的干扰和控制统计回归的因素缺点:第 - ,不能控制与实验处理同时发生的偶然事件的影响, 不能排除那些与自变量同时出现的附加变量的影响( 该设计研究是在没有控制组的情况下进行的)第二,测验与处理X的交互作用在该设计中不容受到充分控制, 因而会对实验的外部效度产生影响 第三,多次实施前测验往往会降低或增加被试对实验处理的敏感性, 从而在被试身上产生作用而影响其在实验后的成绩c 设计的显著性检验:考察实验处理X前(0〜0 对应点)的回归直线与实验处理X ( 0~0 对应点)后的回归直线是否有显著差异进行的显著性检验包括3 个组成部分,即剩余标准差、截距和斜率3. 1 .2 相等时间样本设计在这一设计中只有一组被试和两个相等的时间样本, 在其中的一个时间样本中不出现实验变量,而采用常规安排X0该设计被广泛地应用在研究学生的学习中,它早期的典型应用是研究不同条件下学生学习的效应。
采用在没有控制组的情况下, 对两种实验条件( 变量)进行比较的方法,即对XI和 X0产生的效应进行比较a 设计模式: XI ( 01) X0 ( 02) XI ( 03) X0 ( 04)其中,X0:控制条件或无实验处理,XI:实验处理,0:观测值b优点:在控制影响内部效度的因素方面是完全有效的,能较好地控制“ 历史”因素缺点:在控制外部效度的因素方面并不理想,首先, 测验的反作用效果会影响该设计的外部效度( 从而使实验结果的推广受到限制)其次,实验安排的反作用效果会影响该设计的外部效度( 因而该实验结果很难推论到无这种反作用效果的群体)• 再次,选择偏差与实验变量的交互作用可能会影响该设计的外部效度( 所得到的实验结果只适用于与参加实验的被试同性质的群体)最后,重复实验处理的干扰也会影响该设计的外部效度( 该设计得到的结果不易被直接推广到无重复处理的情境中)c 设计的显著性检验可以从3 个方面做出统计分析第」对两种实验条件进行比较,以确定实验处理XI与控制条件X0的不同效应第二,进行简单效应的比较,即比较在实验处理XI条件下的顺序效应,以及在控制X0条件下的顺序效应,以确定时间效应。
第三,通过对实施变量与实施顺序之间交互作用的分析来考察在时间序列中不同处理效果的不同变化3. 2 多组准实验设计( 包括有实验组和控制组)适用于使实验结果尽量少受无关因素干扰、具有较高的可靠性并且条件允许的情况3. 2 .1 不相等实验组控制组前测后测设计( 非等组前后测设计)非等组前后测设计中设置了控制组和前后测, 但是控制组和实验组不是通过随机抽样或得的a 设计模式: 01 X 0203 04b 优点:第一,基本上控制了历史、成熟、测验等因素对实验的干扰( 增添了控制组)第二, 研究者可以了解实验处理实施前的初始状态,从而对选择因素有了初步的控制( 两组都有前测验)缺点:第一,由于两组被试不是随机抽取、随机分配的,实验组和控制组之间就可能存在选择偏差第二,选择与成熟、选择与实验处理的交互作用可能会降低该设计的效度( 该设计没有使用随机化方法来分配被试或实验处理,实验组与控制组是不对等的)第三,实验结果不能被直接推广到无前测的情境中( 两组都使用了前测验安排)c 设计的显著性检验:可以采用t- 检 验 ( 参数统计)、曼- 惠特尼U-检验或中位数检验( 非参数检验)来对分别求出的两组增值分数的平均数进行检验。
3. 2. 2 不相等实验组控制组前测后测时间序列设计这一设计是在单组时间序列设计和不相等实验组控制组前测后测设计的基础上, 组合而成的一种多组准实验设计a 设计模式: 实 验 组 01 02 03 04 X 05 06 07 08控制组 01 02 03 04 05 06 07 08b 优点:该设计具有时间序列设计的特点,也具有不相等实验组控制组前测后测设计的特点,基本上有效的控制了影响该设计内部效度的因素( 即成熟、历史因素和练习效应)缺点: 测验的反作用效果,以及选择偏差与实验处理的交互作用则可能会成为影响该设计外部效度的因素C实验设计的显著性检验可以使用两种统计分析方法来进行检验,第一种,求出实验处理 X前的4个平均数的共同平均数, 并求出控制组相应的4个平均数的共同平均数 接着求出实验组和控制组的各自后4个平均数的共同平均数 然后将实验组的前测、 后测的增益与控制组的前测、后测的增益用独立的t - 检验或独立的z - 检验来进行比较第二种,对实验组的4 个前测成绩( 1 1 ) 、4个后测成绩( 1 2 ) 以及控制组的8个 成 绩 ( 1 3 ) 求出各自的回归直线方程。
检验直线( 1 1 ) 与 ( 1 2 ) 是否差异显著,以确定两组在选择上是否存在偏差;检验直线( 1 1 ) 与 ( 1 2 ) 或者直线( 1 2 ) 与 ( 1 3 ) 是否存在显著差异,以确定接受实验处理所产生的效果3 . 3 修补设计修补设计是将两个非实验设计相结合而构成•种准实验设计3 . 3 . 1 分解样本前后测设计从形式上看,这种设计是将前实验设计的单组前后测设计重复进行,其基本形式如下:A 组:0 1 X 0 2B 组: 0 3 X 0 4分解样木前后测设计常用于被试量大,条件又不允许同时施测的情况3 . 3 . 2两个不同模式的非实验设计相结合的设计模式其基本形式如下:A 组: X 0 1B 组: 0 2 X 0 34 .真实验设计真实验设计的本质特征在于对影响实验内部效度的无关变量采取严格的控制并有效的操纵研究变量实验设计中综合运用了随机取样、前测和控制组等手段独立组实验设计是在一个团体中随机抽取一部分对象作为被试, 对这些被试给予一定的实验处理以求取一定的观测值, 从中了解被试在某种实验条件下所出现的心理效应 并根据实验结果,推断出整个团体对于该实验条件的心理效应。
另种常见的独立组实验设计是,从一个或几个团体中随机抽取一部分被试对象, 把他们分为几个互不牵连的独立组, 把其中的一组被试安排在一种实验条件下接受实验, 把另一组被试安排在另一种实验条件下接受实验 然后对两组实验的结果进行比较, 并根据实验结果上的差异推断出两种实验条件所引起的心理效应是否有显著差异无论哪种独立组实验设计都要遵守随机性原则完全随机化设计/ 简单随机化设计是用随机化的方法将被试随机分成几组,然后依据实验的目的对各组被试实施不同的处理4. 1单因素完全随机实验设计也叫被试间设计它的基本特点是,研究中只有一个自变量,自变量有两个或多个水平用随机化方法抽取被试,然后将被试随机分配给自变量的各个水平每个被试只接受一个水平的处理单因素完全随机实验设计可分为几种类型:4. 1. 1随机实验组控制组后测设计a设计模式: R X 01R 02R表示随机抽取的被试b优点:该设计儿乎具有随机实验组控制组前测后测设计的所有优点首先,可以控制历史和成熟因素对内部效度的影响( 实验组接受实验处理, 控制组不接受实验处理) 其次,可以控制选择和被试亡失等影响内部效度的因素( 实验是在同等的条件下进行的)。
再次,两组被试均未进行前测验,因此可以控制测验与实验处理交互作用对实验外部效度的影响( 这一点优于随机实验组控制组前测后测设计)最后,研究者可以控制所有选择变量可能产生的偏向( 在实验处理前,采用了随机化的原则)缺点:无法进行实验处理的前后比较c该设计的显著性检验有两类方法:大部分研究者使用L检验对两组的后测成绩进行比较研究;非参数检验常使用曼- 惠特尼U-检验或中位数检验法4. 1 .2随机实验组控制组的前测后测设计这种研究中只有研究者在实验前采用随机分配的方法将被试分成两组, 并随机选择一组为实验组,另一组为控制组实验组接受实验处理,控制组不接受实验处理a设计模式: R 01 X 02R 03 04其中R表示随机抽取被试b优点:基本控制了绝大多数影响内部效度的因素:首先,将被试随机分为两组,从而控制了选择、 被试的亡失以及选择与成熟交互作用等因素对实验结果的干扰其次,安排了实验组和控制组, 在实验的过程中发生在前测到后测这段时间内的事件对两组的影响基本相同,因此控制了历史、成熟、测验、仪器使用等影响内部效度的因素对实验结果的影响缺点:首先,不能控制所有影响内部效度的因素在实验的过程中,研究者的某些失误也可能会对实验的内部效度产生影响。
其次,该设计使用了前测验,被试由于前测验而获得的经验( 即练习效应)可能会导致对后测验产生敏感性,出现测验的反作用效果,影响了实验设计的外部效度C 这种设计的显著性检验有两类方法:第 一, 对增值分数进行统计分析用每一名被试的后测成绩减去前测成绩( 0 2 - 0 1 , 0 4 - 0 3 ),分别求出两组增值分数的平均数对两组增值分数进行显著性检验的方法:5检 验 ( 参数统计);曼- 惠特尼U - 检验;中位数检验( 非参数检验)第二,协方差分析d 注意两种不正确的统计分析方法:第一,分别对实验组、控制组的前后测成绩进行差数的显著性检验, 认为如果实验组前后测成绩差异显著, 而控制组前后测成绩差异不显著时,则将差异归因于实验处理的作用第二,分别对实验组、控制组前测成绩,以及实验组、控制组后测成绩进行差数显著性检验,如果两组前测成绩无显著性差异而两组的后测成绩差异显著,则认为这就是实验处理有效性的证明4 . 1 . 3随机多组后测设计有时研究者要进行的实验处理的个数有3 个或以上, 此时可采用随机多组后测设计 该设计通过随机化的方式分配被试和实验处理到不同的组别中, 然后对几个组的被试进行后测验, 获得各组被试的后测成绩。
随机多组后测设计与随机实验组控制组后测设计的不同之处仅在于实验处理的个数以及相应的被试组数增加了两种实验设计在控制实验内部效度和外部效度的因素上是相同的a设计模式: R X I 01以 3 个实验处理为特例R X 2 0 2R X 3 0 3b该设计的显著性检验时, 研究者需要了解3 种或以上实验处理的实验结果是否有显著差异, 还要了解其中任意两种实验处理的实验结果之间是否有显著性差异: 单因素方差分析法 ( 了解3 种或以上实验处理的实验结果是否有显著差异)和纽曼- 丘尔斯( N - K )检 验 ( 了解其中任意两种实验处理的实验结果之间是否有显著性差异)4 . 1 . 4 所罗门四组实验设计所罗门四组实验设计也叫重叠实验设计,分别有两个实验组和两个控制组其基本模式为:实验组1 R 1 0 1 X 0 2控制组1 R 2 0 3 0 4实验组2 R 3 X 0 5控制组2 R 4 0 6所罗门四组实验设计除了具有前面两种实验设计的优点之外, 对实验处理的效果进行了两次检验,既可以确认实验处理的效果,还可以检验测验与实验处理的交互作用4 . 1 . 5单因子多水平实验设计就是把被试随机地安排在几个水平上接受实验, 以便考察实验因子的各个水平效应是否存在着差异。
多水平实验设计的显著性考验采用F检验I 检验每次只能检验•对平均数的差数,F检验可以同时检验多个平均数的差数多水平设计的方差分析表变 差 来 源平方和自由度均方F处 理 间 ( 组间)S S ta - 1M S t = S S t / ( a - l )M S t/M S e误 差 ( 组内)S S e = S S T O -S S tN -aM S e = S S e /( N -a )当 F > F a 时, 差异显著总计S S T O4 . 2 完全随机多因素实验设计多因素实验设计/完全随机析因设计( m ul ti p l e v a ri a b l e ) 的特点是指在实验中包括两个或以上的因素( 自变量) , 并且各因素都有两个或以上的水平 各因素的各水平互相结合,构成多种组合处理的一种实验设计 研究者用随机抽取的办法将被试分为若干同质的组, 然后将每一组被试随机分配接受一种实验处理如果实验设计中有三个因素( A 、B 、C ), 其中 A因素有2 个水平,B因素有3 个水平,C因素有2 个水平,则实验中含有2 X 3 X 2 个处理水平结合,相应的也就需要12组被试在该设计中,研究者可以考察各个自变量交互作用对因变量的主要影响效应( 交互作用);并同时考察各自变量对同-因变量的主要影响效应( 主效应);以及考察一个因素的各个水平在另一个因素的某个水平上的效应( 简单效应) 。
根据实验中包含的因素进行分类,可以将这类设计分成完全随机双因素设计( AXB因素设计)、完全随机三因素设计( A X BXC因素设计)等完全随机双因素设计: 研究者用随机分配的方法将被试分成若干同质组( 分组的个数等于实验处理的个数),同时用随机的方法分配每•组被试接受一种实验处理的实验设计主效应:由每个单独因素所引起的因变量的变化交互作用的效应: 是指当一个因素对因变量影响的大小因其他因素的水平或安排的不同而有所不同时,所产生的交互作用影响因变量的结果简单效应:以及考察一个因素的各个水平在另一个因素的某个水平上的效应多自变量实验( m ul ti p l e i n d e p e n d e n t v a ri a b l e ) 有三个优点,即效率高;实验控制好;可以获得交互作用多因子设计的方差分析表变 差 来 源平方和自由度均 方FA处理S S Aa -lM S A = S S A /( a -l )M S A /M S EB处理S S Bb -1M S B = S S B /( b -l )M S B /M S E交互作用A X BS S A B( a -l ) ( b -1)M S A B = S S A B /( a -l ) ( b -1)M S A B /M S E误 差S S E = S S T O - S S A -a b ( n -l )M S E = S S E /a b ( n -l )S S B - S S A B总 计S S T Oa b n -14 . 3 随机区组设计随机区组设计的目的在于使区组内的差异尽量小,而组间的差异则依据设计要求而定。
当研究中存在一个研究者不感兴趣的无关变量,而且这个无关变量与自变量之间没有交互作用,研究者希望分离出这个无关变量,这种情况下就可以采用随机区组实验设计随机区组设计的基本方法是: 首先将被试在无关变量上进行匹配, 然后将选择好的每组同质被试随机分配, 每个被试接收一个实验处理的结合可以看出, 每一区组应该接收全部实验处理,每一种实验处理在不同区组中重复的次数应该完全相同随机区组设计考虑到了个别差异对实验结果的影响, 而把被试区分为几个区组, 并在统计计算上将这种影响从组内误差中分离出来, 从而进一步反映出实验处理的作用, 这方面比完全随机设计更完善但是区组的划分是一个关键,如果同一区组内被试的差异过大,则会产生较大的误差4 . 3. 1 随机化区组单因素设计将被试分成不同的区组, 并且每组被试随机接受所有不同的处理 然后观察实验处理后每个区组中的被试对不同处理的反应, 并作为后测成绩 其目的是缩减来自被试间的差别而造成的误差4 . 3 . 2随机化区组多因素设计将被试分成不同的区组, 每个区组都随机接受多因素各个水平组合的全部处理, 然后观测每个区组对不同处理的反应,并将反应值作为后测成绩o区组设计的方差分析表变差来源平方和自由度均 方F处理SSTa- lMST= SST/ (a- l )MST/ MSe区组SSBb- 1MSB = SSB / (b- l )MSB / MSe误差SSe= SSTO- SST- SSB(a- l )(b- 1 )MSe= SSe/ (a- l )(b- 1 )总计SSTOab- l5 . 被试间设计与被试内设计5 . 1 被试间设计被试间设计(bet w een - s u bject s des ign )指要求每个被试只接受- - 个自变量水平的处理, 对另一个被试进行另一种自变量水平处理的情况。
优点是不会出现实验间相互污染的现象,又避免了练习效应和疲劳效应缺点是所需被试的数量巨大,而且无法排除个体差异对实验结果的影响使接受该设计的被试等组的方法:匹配法,随机设计5 . 1 . 1 匹配设计匹配设计是将被试按某一个或几个特征上水平的相同或相似加以配对, 然后再把每一对中的每个被试随机分配到各个组别 这样就可以保证各组被试在这一个或这几个特征上是同质的 按被试的某些特点平均相等的分组方法是平均分配组法: 把被试按照有关特点两两配对,然后把每一对被试分别编入两组的分组方法是对偶配组法优点是通过这一方法所得的各组被试在平均数和标准差上都很接近 在对动物进行被试间设计的实验研究时, ,项重要的匹配技术是拆窝技术(s p l it - l it t er t echn iq u e)它是把同胎生的动物随机地分配到不同的组中缺点是无法对被试每一个特征都进行匹配, 需要耗费大量的工作量, 进行匹配的各特征之间也可能发生交互作用,匹配法需要防止回归假象地介入回归假象是指在许多测量情形中, 第一次测验时的高分组和低分组这两个极端组的分数在第二次测验时向平均数回归了即高分组的得分比第一次低些,而低分组则高些。
随机法(r an do m iz at io n )的统计学前提是各随机被试组在未经受不同处理之前是相等的,即使有差异也是在统计允许的限度之内的随机误差5 . 2被试内设计被试内设计(w it hin - s u bject s des ign )是指每一个被试都接受自变量所有水平处理的情况优点是节省被试的人数,也可以很好地控制被试间的个体差异缺点是实验处理间会出现相互污染的现象,例如会出现练习效应和疲劳效应解决方法:A B B A 法和拉丁方设计平衡设计技术是指在实验中为了消除或减少实验的顺序效应而采用一些系统地改变实验处理顺序呈现技术的设计常用的两种平衡设计技术是A B B A 法和拉丁方设计5 . 2. 1 A B B A 法适用于只有两个自变量的情况( A 利 B),可以平衡成线性变化的时间顺序误差当时间顺序误差不成线性变化时,解决的方法有,在实验正式开始前,让被试接受一些练习同时使用几种平衡设计,如一半被试按A B B A 设计,另一半被试按B A A B 设计5 . 2. 2 拉丁方设计( ba l a n c ed L a t i n s q u a r e des i g n ) 适用于2 个以上的自变量, 是- - 个二维矩阵。
建立拉丁方的步骤取决于自变量的水平是奇数还是偶数六个自变量水平的平衡拉丁方设计测试条件的顺序被试第 1第 2第 3第 4第 5第 6A126354B231465C342516D453621E564132F615243建立平衡的拉丁方的第一行公式为:1、2 、n、3 、n - 1 、4、n - 2 ,如此类推在这里,n代表实验条件的总数当第一行明确以后,对于每一列,只要按顺序从小到大写出既可,当遇到n时,再按字母顺序重新从1开始五个自变量水平的平衡拉丁方设计拉丁方1测试顺序拉丁方2被 试 第 1第 2 第 3第 4 第 5第 1 第 2 第 3 第 4 第 5A 12 53 4 43 5 2 1B2314554132C3425115243D4531221354E5142332415当有5个自变量水平时,必须使用两个方阵,第二个方阵与第一个方阵正好相反使用拉丁方设计时, 每个被试必须在每个变量上测验两次. 一般说来,第一个方阵是按偶数个变量时构建方阵的方法建起来的,在奇数个实验条件下第二个方阵则与第一个方阵正相反拉丁方设计的特点是每一种实验处理都是在练习的同一阶段出现, 而且每一种自变量水平在其他自变量水平之前和之后出现的频率都相同, 即任何两个自变量水平之间的顺序误差都被抵消。
因此,拉丁方设计是多自变量水平时的理想平衡方法5 . 3其他类型的实验设计混合设计( m i x ed des i g n ) 是在一项实验中有些自变量是被试内的而有些自变量是被试间的实验设计小样本设计( s m a l l - s a m p l e des i g n ) 是被试内设计的一种变式是向较少或单个被试呈现自变量的不同水平, 需要在相当经济且可以进行高度控制的实验中对每一个被试进行大量的观察小样本设计分成两种,A B A 设计和多基线设计小样本设计的使用本身就能够得出强有力的实验结论 A B A 设计的前提是B阶段的治疗效果不持久但实际上治疗痕迹是难以消失的A B A 设计的优点:是可以较好地区分实验自变量的效果和时间顺序等其他因素的效果,从而进一步解决了以往A B A 设计中常常会发生的混淆问题多基线设计的内在逻辑: 当一种行为或••个被试正在接受处理时, 另一种行为或另一个被试仍处于基线条件下 如果这种未受处理的行为在自变量引进之前保持稳定, 然后随着自变量的变化而变化 那么我们就可以认为是自变量导致了该行为的改变, 而不是一些碰巧在观察期内发生变化的其他因素被试内的多基线设计:在几个不同的基线阶段比较同一被试的不同行为的基线设计。
被试间的多基线设计■ :在几个不同的基线阶段比较不同被试的同一行为的基线设计 二 ) 统计方法数据类型与统计方法数 据 类 型 单 样 本 问 题 独 立 样 本 比 相 关 样 本 比 多组样本的比较相关问题独立样本重复测量等总体单样本t/z独立样本相关样本t独立样本重复测量Pearson距 正 态型 分 布检验t/z检验检验方差分析方差分析积差相关分布形态未知大样本下的相应的t/z检验大样本下的相应的t/z检验大样本下的相应的t 检验转化为顺序型转化为顺序型顺序型符号检验法曼- 惠特尼U检验维尔克松T 检验克- 瓦氏单向方差分析弗里德曼双向等级方差分析Spearman等级相关命名型X?匹配度检验X?独立性检验符号检验法X 2独立性检验X ,独立性检验四、实验心理学的基本理论( 一)反应时1 . 反应时概述1 .1 反应时的含义反应时是指从刺激作用发生到引起机体外部反应开始动作之间的时距 反应时一般包括几部分时间的总和,即刺激引起感官的活动、神经冲动的传递、大脑的加工活动以及效应器官接受冲动作出反应等所耗费的时间, 其中以大脑活动占时最多, 故反应时间又称为反应潜伏期反应时的测量具有灵敏度高、应用性广又便于进行测定的若干特点。
奥地利生理学家埃克斯纳首先使用了 “ 反应时间”的概念反应时的两个先驱人物: 首先, 对反应时的研究最先始于天文学家贝塞尔对“ 人差方程”的研究而后,最早将反应时的测量用于心理实验的是荷兰生理学家唐德斯( 第一次系统地研究反应时)1. 2 反应时的种类反应时分3 类:A反 应 时 ( 简单反应时,也称为基线时间);C反应时( 辨别反应时);B反 应 时 ( 选择反应时)2 .反应时的影响因素反应时会受到刺激变量和机体变量的影响2. 1 外部因素2. 1. 1刺激强度与反应时一般而言,当刺激强度较弱时,反应时间较长;随着刺激强度的增加,反应时间会逐渐缩短刺激强度增加之初,反应时间缩短的快些;当刺激强度增加到一定程度时,反应时间的缩短速度减小甚至停留在某一水平上,好像反应时间渐近于一个极限2. 1. 2 刺激的时间特性和空间特性与反应时当物理刺激的强度本身保持不变,而作用于感官的时间增加,即造成时间的积累作用,这样便会增加刺激的心理强度, 于是, 反应时间缩短当然, 反应时间的缩短也是有极限的同样,如果物理刺激强度和时间保持不变,而刺激的面积增加,由于感受器神经兴奋的空间积累作用,刺激的心理强度也会增加,从而引起反应时间的缩短。
2. 1. 3 简单一复杂反应时任务的区别和速度一准确性权衡也会影响反应时的快慢2. 2 机体因素2. 2. 1刺激的感觉器官与反应时接受刺激的感觉器官不同,反应时也不同许多研究表明,不同感觉通道的反应时间从短到长依次为:触觉、听觉、视觉、冷觉、温觉、嗅觉、痛觉、味觉同一感觉器官接受不同的刺激, 反应时间也不尽相同, 甚至同一刺激作用于同一感觉器官的不同部位,其反应时间也是不同的例如味觉刺激作用于舌尖时,反应时从短到长的刺激类型依次为:咸甜酸苦另外,复合刺激同时作用于不同感觉通道时,也会引起反应时间的不同2. 2. 2 被试的机体状态与反应时( 1 ) 机体的适应水平与反应时适 应 (ad ap tatio n )在此处意指在刺激物的持续作用下,感受器发生的变化感受器的适应水平对反应时间有着明显的影响眼睛对明暗适应水平不同,反应时间也就不同 2 ) 被试的准备状态与反应时准备状态(readiness)是指机体对于某种行为作出的准备情况从预备信号的发出到刺激的呈现称为预备时间预备时间过长或过短都会对反应时间的测量造成不利的影响3 ) 额外动机与反应时动 机 (m otive)是由于人的某种需要所引起的有意识或无意识的行为指向。
奖励和惩罚的条件都会造成被试的额外动机,从而引起反应时的变化约翰逊(Johnson, 1922)的实验发现主试者所设计的一些附加动机能使听觉反应加快 4 ) 被试的年龄与反应时 一般来说,25岁之前,个体的反应时是逐渐变快的戈茨达 克(Gottsdamker, 1968)在对一组年龄为18〜93岁的成人被试者的研究中注意到,随着年龄的增长,感觉一运动反应时间逐渐延长进入成人阶段,反应时的变化就很少了; 60岁之后,反应时开始缓慢下来( 5 ) 练习与反应时在心理实验中,练 习 (e x e rc ise )是一个控制变量,即一个潜在的自变量练习与反应时间的关系相当密切在一定范围内,练习次数越多( 上百次) ,反应会越快,反应时间减少的趋势是逼近一个极限而稳定下来 •般而言, 练习越多反应时越短但是,这种缩短也是有极限的6 ) 个体差异与反应时个体 差 异 ( 或个别差 异 ) 指不同个体之间在品质和属性上存在的任何差别不仅不同被试之间存在反应时的差异,而且同一被试,在同一条件下,其每时每刻的反应时也会因其心理和生理的某些变化而不同菲萨尔(Fessard, 1926)曾对1000名男性成人被试者作听觉简单反应时间的测定,结果发现反应时间的均数分配大致上呈常态。
但是老年组的变异系数较显著地高于青年和中年组,说明老年组在感觉一运动反应速度方面存在着较大的个别差异 7 ) 酒精及药物的作用酒精在脑神经系统达到一定浓度时. , 中枢神经系统逐渐迟钝, 对周围情况变化的反应速度大大下降如果是酗酒,其反应时间将延长2〜3 倍,甚至更长,往往紧急情况已到眼前,还未发现或采取任何措施便已肇事例如车速每小时40公里,未饮酒的驾驶员对道路复杂情况作出反应只需0. 6 秒,而饮酒后的驾驶员却要1. 8 秒这样,汽车在反应时间内所行驶的距离就从0. 6 秒 的 7 公尺增加 到 1. 8 秒的21公尺,所需的安全距离增加了 14公尺,即从27公尺增加到41公尺目前,刺激中枢神经的心理杀伤性药剂,大致分三类,即镇静剂、兴奋剂和致幻剂镇静剂虽能消除情绪紧张、焦躁、恐惧感,但会使驾驶员肌肉活动能力下降,并出现睡意,以致反应迟钝 兴奋剂对中枢神经系统的作用与镇静剂作用相反, 它可以消除疲劳, 驱逐睡意,改善思维活动力,提高反应速度,但会使各类职业人员思想麻痹,过高估计自己的能力• 致幻剂会使人有时产生幻觉伤风感冒服用过量解热镇痛剂,会使人的注意力、精力、反应能力下降3 .反应时技术3. 1 减法反应时技术Donders于 1868年提出了反应时的相减法。
他认为在一个刺激和一个反应的简单反应中若增加他种心理过程而使之复杂化, 如果反应时间增加, 那么这一增量就是加入过程的时间数量他首先确定了 3 种不同的反应时:(1) A反应时间:即简单反应时一个反应仅对应一个刺激,当这个刺激呈现时立即做出反应其时长最短( 2 ) B反应时间:不同刺激对应不同反应,即有多个刺激和多个反应这种反应时包含简单反应时、辨别反应时( 辨别刺激的时间)和选择反应时( 选择反应的时间)其时长最长.( 3 ) C反应时间:对多个刺激中某个特定的刺激进行反应,即多个刺激和一个反应只有实现规定的刺激呈现时,才做出反应;其他刺激出现时,不予反应这种反应时包含筒单反应时和辨别反应时( 辨别刺激的时间)根据上面三种反应时数据,就可以计算出辨别过程的反应时和选择过程的反应时辨别过程的反应时为:C反应时- A 反应时选择过程的反应时为:B 反应时- C 反应时反应时的相减法最初是用来测定某一心理过程所需的时间, 但是, 也可以从两种反应时的差数来判定某个心理过程的存在认知心理学更多地从后者的逻辑思想进行研究 应该注意,要在复杂的心理过程中区分出不同的加工阶段,还存在一些困难。
在运用反应时的相减法时,应该结合具体的研究课题,周密考虑减数法的逻辑/ 前提:A一种作业包含另一种作业所没有的某个特定的心理过程,且除此之外二者在其他方面均相同,那么这两种反应时的差即为心理过程所需的时间B 一种作业的性质与持续时间和另一种作业的性质与持续时间互不影响( 这一假定在许多课题的研究上是难于确定的)减数法的经典实验:A心理旋转存在实验;B短时记忆视觉编码实验A心理旋转存在实验心理旋转是指单凭心理运作( 不靠实际操作) ,将所知觉之对象予以旋转,从而获得正确知觉经验的心理历程.也就是说,当一个知觉对象不是以符号知觉经验的角度呈现时,人们可以通过内部心理过程把这个对象旋转到符合知觉经验的角度加以辨认2 0 世纪7 0 年代初,库伯和谢波德用减数法反应时实验证明了心理旋转的存在研究者设想,如果连续的心理旋转确实存在, 那么减数法反应时的逻辑正好可以与之吻合假设有两个任务, 它们之间除了被知觉对象需要心理旋转的角度不同外别无差异, 那么两者的反应时之差就是心理旋转完成两者间角度所需的时间实验者进一步推论: 如果发现以上任务的反应时间却有差异, 而且这种差异和俩任务角度差异呈现正比关系,就可以证明心理旋转的存在。
在这个实验中,库伯等取非对称性的字母或数字( J 、G 、R 、2 、5 、7等)为实验材料,根 据 “ 正” 、“ 反”以及不同的斜度,构 成 1 2 种情况在实验里,被试的任务是不管倾斜度如何,只要求判断R 字母是正的还是反的,并做出反应有五种实验条件: a完全没有提示,即测验前2 秒钟后呈现空白信号,持续时间2 秒;b 提示正或反,即测验前两秒钟呈现正或反的提示信号,持续2秒;c 提示倾斜度,即测验前两秒钟用箭头提示倾斜度数;d分别提示正反和斜度,即用两个信号分别提示正反和倾斜度;e 同时提示正反和倾斜度,即在实验前用两个信号同时提示正反和倾斜度,都持续两秒钟实验结果为,字母倾斜程度越大,反应时越长B P o s n er 等的短时记忆编码实验2 0 世纪6 0 年代以来,根据记忆实验中对错误回忆的分析,人们通常以为短时记忆信息( 如字母)是以听觉形式来编码的但是7 0 年代初波斯纳等人的实验却证明,这种信息可以有视觉编码实验程序:给被试并排呈现两个字母, 这两个字母可以同时给被试看,或者中间插进短暂的间隔时间,然后要求被试指出这一对字母是否相同并按键做出反应, 记录反应时间。
所有的字母对有两种:一种是两个字母的读音和书写方法都一样,即 ( A A ) ;另一种是两个字母读音一样而书写不同,即 ( A a) o结果发现,当两个字母同时呈现时,同形关系的字母反应更快;当两个字母先后间隔一秒呈现时,同形关系和同音关系的反应时没有差异根据实验结果, 研究者认为,由于由于同形关系同同音关系更具有形的优势,因此只有在依靠视觉编码进行的作业中才会出现这一优势山此可以推断, 在短时记忆的最初阶段存在视觉形式的编码,之后才逐渐向听觉形式过渡C句子一图画匹配实验( C l ar k C h as e )方法: 给被试看一个句子iexcl:星形在十字之上iexcl; ± ,紧接着再看一幅图画,如土, 要求被试尽快地判定, 此句子是否真实地说明了图画, 作出是或否的反应, 记录反应时实验条件: 变量一介词( 之上、之下)变量一主语( 星形、十字)变量一陈述方式( 肯定、否定)实验假设: 当句子出现在图画之前时, 这种句子和图画匹配任务的完成要经过几个加工阶段:第一个阶段是将句子转换为其深层结构, 而且对iexcl:之 下iexcl; 土的加工要长于对iexcl;之 上iexcl; ±的加工( 参数a),对否定句的加工要长于对肯定句的加工( 参数b);第二个阶段是将图画转换为命题, 并带有前面句子中所应用的介词(iexcl;之 上iexcl;±或iexcl; 之 下iexcl; 土);第三个阶段是将句子和图画两者的命题表征进行比较,如果两个我征的第一个名词相同, 则比较所需的时间比不同时为少( 参数c),如果两个命题都不含有否定, 则比较所需的时间比任一命题含有否定时为少( 参数d);最后的阶段为作出反应, 其所需的时间被认为是恒定的( 参 数t)。
星星在十字之上iexcl; 土正确说明图画, 其反应时间就包括参数a和参数t星星在十字之下iexcl; 土正确说明图画, 其反应时间就包括参数t通过两种反应时间查可以计算出参数a的数值, 同理实骁可以得到各参数的数值缺点: A这一方法要求实验者对实验任务引起的刺激和反应之间的一系列心理过程要有比较精确的预测,B 两个相减的任务中共有的心理过程要严格匹配,C难以直接得到某个特定加工阶段所需的时间, 并要通过严密的推理才能被确认D 选择反应时和简单反应时在反应的准备阶段上存在不同3 . 2加法反应时技术相加因素法的基本逻辑是: 完成完成一个作业所需的时间是一系列信息加工阶段分别所需时间的总和 如果两个因素的效应是相互制约的, 即一个因素的效应可以改变另一个因素的效应,那么,这两个因素只作用于同一个信息加工阶段;如果两个因素的效应是相互独立的,那么这两个因素分别对不同的信息加工起作用,各自作用于某一特定的加工阶段相加因素法的基本前提:A人的信息加工过程是系列进行的而不是平行发生的B人的信息加工过程是由一系列有先后顺序的加工阶段组成的, 有时这些加工阶段可能存在一定的相关性,公式:R T = e + N b+ C , 设 2 = 6 + 孰 则 R T = a + b N 。
于是,在相加因素法实验中,研究者通常的假设是:完成•项作业所需的时间是一系列信息加工阶段分别所需时间的总和在相加因素法实验中,当两个因素影响两个不同的阶段时, 他们将对总反应时间产生独立的效应,即不管一个因素的水平变化如何,另一个因素对反应时间的影响是恒定的相加因素法实验不是用来区分不同加工阶段的反应时间, 而是分离任务的不同加工阶段,以及不同阶段所需的时间加因素法的经典实验:斯腾伯格的“ 短时记忆信息提取”实验实验方法:先给被试看1〜6个 数 字 ( 识记项目),然后看一个数字( 测试项目)并同时开始计时. , 要求被试判定此测试数字是否是刚才识记过的, 按键作出是或否的反应,计时也随即停止这样就可以确定被试者能否提取以及所需要的时间( 反应时间)这一实验确定了对短时记忆信息提取过程有独立作用的4个因素: 识记项目的数量( 记忆集大小);探针刺激的质量( 清晰或不清晰);反应的类型( 肯定或否定);反应类型的相对频率 这 4个因素分别对4个独立的加工阶段起作用, 这 4个加工阶段是探针刺激的编码阶段、顺序比较阶段( 识记项目的数量)、决策阶段和反应组织阶段优点:A在揭示心理过程的时间方面又进了一步。
B并在很大程度上对认知心理学的发展起到了积极的推动作用C加因素法不是对减数法反应时间的否定,而是减数法的发展和延伸缺点: A难以直接得到某个特定加工阶段所需的时间, 并要通过严密的推理才能被确认B是否可以用相加效应和互不影响效应来确认认知加工阶段需要进一步探索3 . 3开窗技术开窗技术是基于反应时技术而发展的一种实验范式, 它运用了反应时的相减法和相加因素法的基本原理最早的开窗实验是霍基等人的字母转换实验开窗实验能够比较直接地测量每个加工阶段的时间, 从而能比较明显地看出这些加工阶段的一项实验技术 采用这一技术来研究反应时各加工阶段的时间很方便, 就好象打开窗户那样可以一览无遗 它是反应时实验的一种新形式,在反应时研究史上发展较晚,有些教科书也把这一实验当作加因素法反应时的一种变式H a m i lt o n ( 1977)和 H o c k e y ( 1981)的字母转换实验:方法:给被试呈现1〜4 个英文字母并在字母后面标上一个数字,如 “ F + 3 ”、 “ K E N C+4 ” 等,当呈现“ F + 3 ”时,要求被试说出英文字母表中F后面第三个位置的字母即“ I ”。
换句话说, “ F + 3 ”即将F 转换为I , 而 “ K E N C + 4”的正确回答是“ 0I R G ”,但这四个转换结果要一起说出来,凡刺激字母在一个以上时,都应如此,只作出一次反应 K E N C + 4”实验的具体过程:四个字母一个一个地继时呈现,由被试者按键自行控制, 被试者第一次按键就可以看见第一个字母K , 同时开始计时,接着被试者按照要求作出声转换,说出LM N 0, 然后再按键看第二个字母E ,再作转换如此循环直至四个字母全部呈现并作出回答,计时也随之停止出声转换的开始和结束均在时间记录中标出来根据这种实验的反应时数据,可以明显地看出完成字母转换作业的三个加工阶段:A从被试者按键看到一个字母到开始出声转换的时间为编码阶段, 被试对所看到的字母进行编码并在记忆中找到此字母在字母表中的位置;B 被试按规定进行转换所用的时间即为转换阶段;C从出声转换结束到按键看下一个字母的时间为贮存阶段, 被试将转换的结果贮存到记忆中,有时还须将前面的转换结果加以复述和归并开窗实验可以把每种认知加工成分所经历的时间比较直接的估计出来, 这比反应时的相减法和相加因素法具有明显的优势。
但是,也应该看到,不同认知加工阶段的区分是有一定困难的,比如字母转换实验中,储存阶段可能包含对前面字母转换结果的提取和加工3.4 内隐联想测验内隐联想测验是用来测量概念之间自动化联系强度的一般用途的程序, 可用思维实验时其加以说明在程序上,内隐联想测验采用的是一种计算机化的辨别分类任务 它以反应时为指标,通过对概念词和属性词之间自动化联系的评估进而来对个人的内隐态度进行间接测里内隐联想测验在生理上是以神经网络模型为基础的 该模型认为信息被储存在一系列按照语义关系、 分层组织起来的神经网络的节点上, 因而可以通过测量两概念在此类神经网络上的距离来衡量它们的联系在认知上,内隐联想测验以态度的自动化加工为基础,包括态度的自动化启动和启动的扩散内隐联想测验的步骤:第一步,呈现概念词:如让被试对花的名字( 如,郁金香)和昆虫的名字( 如,蜘蛛)进行归类并做出•定的反应( 看到花的名字按F键,看到昆虫的名字按J键) ;第二步,呈现属性词:让被试对积极的词汇( 如,可爱的) 和消极的词汇( 如,丑陋的)做出反应( 积极词汇按F,消极词汇按J ) ;第三步,联合呈现概念词和属性词:让被试做出反应( 花的名字和积极词汇按F,昆虫的名字和消极词汇按J ) ;第四步,让被试对概念做出相反的判断( 花的名字按J,昆虫的名字按F ) ;第五步, 再次联合呈现概念词和属性词, 让被试做出反应( 昆虫的名字和积极词汇按F ,花的名字和消极词汇按J )。
3 . 5 内隐联想测验的变式( -)心理物理法1 . 感觉阈限1 . 1绝对阈限和差别阈限的实验定义绝对阈限是指有50%的次数能引起感觉,50%的次数不能引起感觉的一种刺激强度差别阈限是指有5096的次数能觉察出,50%的次数不能觉察出的刺激强度的差别1 .2测定阈限的实验特点a选择好刺激系列和反应系列( 物理量为横坐标,心理量为纵坐标)b要尽量简化被试对刺激所做的反应( 判断有无,辨别相同还是相异)c测定的次数要多些( 不是分界点而是过渡区,100次以上)L 3影响感受性的三个因素a与如何测量阀限有关b与被试对任务的注意程度以及态度有关c与被试的感受性是否出现不稳定的摇摆有关.2. 极限法,也称最小变化法极限法中刺激是由递减和递增两个数列组成, 每次刺激后让被试报告是否有感觉 刺激的增减幅度应尽可能的小,目的是系统的探查被试从一类反应到另一类反应的转折点, 也就是被试从无感觉到有感觉,或从有感觉的无感觉的刺激强度2. 1极限法的特点以及绝对阈限的测定a自变量:刺激系列要按递增和递减系列交替呈现,起点要大于或小于阈限; 一般选10到20个强度水平;递增和递减序列要分别测定50次 左 右 ( 共100次左右);避免被试形成定势,每次呈现刺激的起点应该随机变化。
b因变量:被试的口头报告当刺激呈现之后,感觉有就报告“ 有 ”,感觉无就报告“ 无 ”,主试记录“ 十 ” “ 一” ;递增忖直到第一次报告“ 有 ”,这一系列停止,递减同理;说不准可以猜,但不可以放弃,也可以记录“ ? ”c阈限的确定:阈限是统计值,被试报告“ 有 ”和 “ 无 ”这两个刺激的中点,就是这一刺激系列的阈限具体计算: 可以将所有各系列的阈限求平均数: 可以先分别求出渐增系列和渐减系列的平均数再求出两系列的平均数; 也可以将每相邻的渐增系列和渐减系列的阈限为一组求平均数 ,然后再求各组的平均数在感觉的测定中能够充分体现极限法的特点:a刺激是由递增递减两个系列组成;b 递增和递减系列交替呈现;c 每个系列的起始点不同;d 每个系列的转折点是该系列的绝对阚限;e多个系列绝对阈限的算术平均值就是绝对阈限2 . 2 差别阈限的测定a自变量:两个刺激标准刺激( 固定的强度,大小不变) ,每次比较都出现比较刺激,按递增或递减系列,匹配呈现b因变量:口头报告,一般用三类反应, , , + ” “ 一 ” “ = ”c差别阈限的确定:A在递减系列中最后一次“ + ”到 非 “ + ”之间的中点为差别阈限的上限( L u ) ;第一次 非 , , 一”到 “ 一”之间的中点为差别阈限的下限( L 1 ) 。
B在递增系列中的最后一次“ 一”至 U 非 “ 一”之间的中点为差别阈限的下限( L 1 ) ;第- 次非“ + ”到 “ + ”之间的中点为差别阈限的上限( L u ) C上限与下限之间叫不肯定间距I U D不肯定间距的中点叫主观相等点( P S E) ,理论上P S E应与标准刺激( S t ) 相等,但实际有差距,叫 常 误 ( C E) »E 取不肯定间距的一半或取上差别阈( D L u - L u - S t ) 和下差别阈( D L l - S t - L l ) 之和的一半为差别阈限上差别阈 D L u = L u —S t下差别阈 D L l = S t - L l主观相等点 P S E= I U / 2 = ( L u - L l ) / 2常误 C E= S t - P S E差别阈限 D L = [ D L u + D L l ] / 2=[( L u - S t ) + ( S t - L l ) ] / 2=[ L u —L l ] / 2差别阈限即刚刚能引起差别感觉的最小刺激量的变化,用 D L 表示在差别阈限的测定中,每次都让被试比较两个刺激,即标准刺激和比较刺激。
被试可以做出3 类反应,分别用+ , = , - 表示比较刺激和标准刺激的关系 表示被试无法区分两个标准刺激的关系,即认为相等从- 到= 的转折点是下限,从= 到+ 的转折点是上限上限与下限之间的距离称为不肯定间距,即不肯定间距等于上限减下限不肯定间距也称为相等地带,一般用I U 表示差别阈限等于1 / 2 不肯定间距不肯定间距的中点被称为主观相等点( P S E),它反映的是被试在做判断时实际上所依据的标准刺激也即主观相等点等于1 / 2 的上限与下限之和经过这样的过程可以测定绝对差别阈限绝对差别阈限与标准刺激的比例就是相对差别阈限2 . 3 极限法的误差在极限法的实验中, 经常会出现习惯误差和期望误差习惯误差是指被试因习惯于原先刺激所引起的感觉或感觉状态, 对新的刺激做了错误的判断 当递增系列的阈限显著大于递减系列的阈限时,就推断存在习惯误差期望误差是指被试因过早•期望将要来临的刺激而导致错误的判断 当递减系列的阈限显著大于递增系列的阈限时,被试就存在期望误差2 . 4极限法的变式——阶梯法阶梯法与极限法的不同在于把增加和减少刺激强度的程序连续进行 当被试报告感觉不到时,主试就按一定梯级来增加刺激强度;当增加到被试感觉到时,有按一定梯级来减少刺激程度。
这样,实验可以出现预定的转折点,各转折点的平均数就是感觉阈限值3 . 平均差误法易产生动作误差,H 单选平均差误法的典型实验程序是,以某••刺激为标准刺激,要求被试调节另一比较刺激,使后者在感觉上与标准刺激相等把多次比较的误差平均就是平均误差当用平均差误法测定绝对阈限时,只要设想标准刺激的强度为零然后来调节比较刺激,使比较刺激的大小变化到刚刚觉察不到或刚刚觉察到, 然后, 对比较刺激求平均数就是绝对阈限当用平均差误法测定差别阈限时,因为平均误差与差别阈限成正比, 所以可以用平均误差来表示差别感受性求平均误差的方法有:a 把每次调节的结果( 或每次的判断)与标准刺激之差的绝对值平均数作为差别阈限的估计值b 把每次调节的结果与主观相等点之差的绝对值的平均数作为差别阈限 主观相等点是相等地带的中点,它等于各比较刺激的平均数c用每次调节结果的标准差作为差别阈限的估计值d用每次调节结果的四分差值作为差别阈限的估计值平均差误法的主要特点:a 要求被试判断什么情况下比较刺激与标准刺激相等,直接主观相等点,且这个主观相等点落在不肯定间距内被试的反应不是口头报告,而是调整的等值b 被试积极参与,实验过程中由被试本人调整刺激的变化。
c 刺激量是连续变化的d在接近阈限时,被试可以反复调整刺激,以减少刺激的起始点对结果的影响平均差误法的主要误差来自被试动作方式不同而过高或过低估计比较刺激的反应倾向,称之为动作误差如果是视觉刺激,易出现因刺激呈现方位不同造成的空间误差如果标准刺激与比较刺激在时间上先后出现,则易于出现时间误差可以采用A B B A 等方法平衡平均差误法的优点是, 可以让被试自己动手调整刺激, 因此在整个实验中被试可以保持高水平的积极性 可直接测量被试的反应,实验结果可以采用正常的统计处理其缺点是易受动作技巧的影响 另外, 如果刺激不是连续性的, 用这种方法测得的差别阈限就不精确了4 . 恒定刺激法及其变式在恒定刺激法中,刺激通常由5 - 7 个组成,在实验过程中保持不变 刺激的最大强度被感觉的概率达到9 5 %左右;最小强度被感觉的概率在5 %左右各个刺激之间的距离相等与极限法不同,恒定刺激法的刺激是随机呈现的,每个刺激呈现的次数相等4 . 1 恒定刺激法的特点只用经常被感觉和经常不被感觉这一感觉过渡地带的5 - 7 个刺激, 而且这几个刺激在整个测定阈限的过程中是固定不变的 一个处在被感觉到和不被感觉到的过渡地带的刺激, 当它被感觉到的百分比恰为5 0 % 时,这个刺激的强度就是阈限的位置。
4 . 2绝对阈限的测定一般步骤为:a 确定自变量,包括刺激的数目与强度等;b确定反应变量,一般是被试对呈现刺激的“ 有”或 “ 无”的报告;c 绝对阈限的计算,一般可采用直线内插法、平均法、平均Z 分数法、最小二乘法或S p e a r m a n 分配法来确定4 . 3 差别阈限的测定一般步骤为:a 确定自变量,即确定标准刺激和几个比较刺激的强度范围 ( 2 )确定反应变量,即被试对标准刺激和比较刺激关系的反应可以有两种,一种是三类反应,一种是两类反应 ( 3 )差别阈限的计算不同反应条件下,计算方法不同如果只有两类回答,即+ 和- ,以被试7 5 % 次感觉重于、大于或长于标准刺激的比较刺激作为相等地带的上限,以 2 5 % 感觉重于、大于或长于标准刺激的比较刺激作为相等地带的下限这种方法计算出的差别阈限称为7 5 % 的差别阈限如果允许被试做3 种回答,这时相等地带的上限为5 0 % 感觉重于、大于或长于标准刺激的比较刺激,相等地带的下限是5 0 % 感觉轻于、小于或短于标准刺激的比较刺激在三类回答的实验中,被试的态度会影响相等地带的大小4. 4 不肯定间距的不稳定性当采用三类反应, 不肯定间距的大小则依赖于相等判断次数的多少。
如果被试的相等判断多,不肯定间距就大;如果相等判断少,不肯定间距就小;如果没有相等判断,不肯定间距就是零这样计算出的差别阈限就很难解释,不肯定间距成了态度测量的指标如果刺激系列扩展在标准刺激两侧,其中一个与标准刺激等值,就是使用“ 大于” “ 小于”两类反应指标,其结果也能很好的反应辨别力因此,从整体情况看,两类判断应该受到偏爱,它省时、省事,所得结果又都可用4. 5 恒定刺激法的变式a 分组法把比较刺激分为三组,将大于和小于标准刺激且与其间距相同的比较刺激分到一组中去,每组的两个比较刺激都与标准刺激随机比较若干次,可以按照1、2, 3, 3、2、1排列,记录和结果都按恒定刺激法的正常方式进行b 用对数单位的比较刺激系列即刺激系列采用对数梯级c 单一刺激法准备一系列刺激,用随机顺序反复呈现,指示被试把它们分为一定的类别事先要求被试做一些练习,熟悉刺激范围,然后让被试凭绝对的印象进行判断被试的反应类型可以根据研究者的需要分为两类、三类或四类,用恒定刺激法的方式处理结果可见, 三种方法中,极限法的实验程序和计算过程都体现了感觉阈限的含义, 但其会产生习惯误差和期望误差 恒定刺激法的结果可以运用各种数学方法加以处理, 因而便于与其他测定感受性的方法比较。
当应用3 类反应的实验程序时, 被试的态度会对差别阈限值有较大影响平均差误法的特点是求等值,它的实验程序容易引起被试的兴趣, 但对不能连续变化的刺激则不能用平均差误法来测量其差别阈限 二)心理量表法1 . 量表的类型1. 1 直接量表和间接量表以测量的方式来划分, 直接量表就是可以直接测量所要测量的事物的特性 间接量表是借助于测量另一事物来推知所要测量事物的情况1 .2 命名量表、等级量表、等距量表和比例量表心理物理学中,根据量表有无相等单位和有无绝对零点来划分的命名量表也叫称名量表,只是用数字来代表事物或把事物分类例如男性与女性等级量表也叫顺序量表, 是将对象的某一属性排除顺序和等级 例如, 第一名、 第二名、第三名等这种量表没有相等单位,也没有绝对零点例如,我们没法根据第一名与第二名的差异推测第二名与第三名的差异; 也不能说明第•名是第三名的几倍 顺序量表的每一类别只具有序列性,并不表示数与数之间的差别是相等的等距量表具有相等单位,可以测量对象之间的差别,但是没有绝对零点比例量表既有绝对零点又有相等单位,因此,它既可测量对象之间的差别,又可确定他们之间的比例 也就是, 比例量表的数据既可以加减又可以乘除。
比例量表是最高级的量表L 3 心理量表的评价一个好的心理量表应该满足一下三点:a 符合三种基本假设A不是a=b就是a # b , 即对心理特质有明确的标志和测量单位B如果2」 且 6=的 那 么 a=c有了这个假设间接量表才有可能C 如果 a>b, b > c ,那么 a>cb 有系统的测量理论c 用直接量表法进行核对测量感觉阈限的目的在于为心理物理函数标定起点, 真正确定心理物理函数的走势还需要对阈上感觉进行测量,而对于阈上感觉的量化可以通过心理物理量表来表示2 .感觉比例法与数量估计法比例量表既有真正的零点,也有等距单位2. 1感觉比例法( 分段法)感觉比例法又称分段法, 它是制作感觉比例量表的一种最直接的方法 感觉比例法的基本逻辑是: 通过物理量所引起的感觉量加倍、 减半或按照某•特定的比例变化来建立的物理量与心理量之间关系的量表如,Stevens Davis的听觉响度量表(1 9 3 6 )感觉比例法的基本操作步骤是:a 首先呈现一个阈上物理刺激作为标准刺激,然后让被试调节另一个比较刺激,并随时判断该比较刺激所引起的感觉量是标准刺激所引起感觉量的一倍、一半还是指定某一比例,这样可以获得某一强度的比较刺激所引起的不同感觉量的关系的量表;b 在比较完后,可以变化标准刺激的强度,然后再选择一个比较刺激进行调节,从而产生不同物理刺激强度所对应的不同比例感觉量的关系量表;C通过上面的比较,就可以建立物理量和心理量之间关系量表。
声音强度和主观感觉的响度之间关系就可以通过这种方法建立感觉比例量表2. 2 数量估计数量估计法是制作感觉比例法的一种直接方法具体步骤为:主试先呈现一个标准刺激,并规定其一个主观数值,然后让被试以这个主观值为标准,把其他同类但强度不同的主观值放在这个标准刺激的主观值关系中进行判断, 并用•个数字表示出来通过这种方法可以建立不同关照度下的主观明度感觉的关系量表2 . 3 制作等比量表应注意的问题a 被试能否正确使用数字,这是影响实验结果的重要因素b 在判断中易受其他心理因素的影响,如动机、周围环境干扰等实验中误差较大,判断很难按等比的尺度进行,因此很难保证量表的等比性质3 . 感觉等距法与差别阈限法3. 1感觉等距法感觉等距法是把两个刺激所引起的某感觉连续体按照主观上相等的距离区分开, 这样按照物理量和心理量之间的距离划分便可以得到感觉等距量表常用的感觉等距法是二分法如八等分灰色光度心理物理量表就是用此种方法制作的感觉等距量表是以感觉的等距离变化作为标准,但物理量的变化不一定是等距离的3. 2 差别阈限法差别阈限法是制作等距量表的另一种间接方法 它以绝对阈限为起点,以最小可觉差为最小单位制作心理量表• 运用差别阈限法制作等距量表时,假定所有的JND ( 最小可觉差)在心理上都是相等的,那么,感觉量表上等距的增长, 就必然要求刺激强度表上越来越大的增加。
对物理量取对数后作图,心理量和物理量之间的关系可以用一条直线表示韦伯定律和费希纳定量都是运用这种方法制作的心理量表 制作差别阈限量表首先要知道4 .对偶比较法与等级排列法对偶比较法与等级排列法是制作等级评价量表常用的两种方法4. 1对偶比较法对偶比较法的刺激成对出现, 要求被试判断每对刺激中那一刺激的某个特征更明显或更喜欢哪一个刺激如果有n 个刺激,配对的数目就是n (n-1) / 2 , 每对刺激需要比较两次,目的是平衡顺序误差和空间误差于是,总的比较次数为n ( n - 1 ) o最后,计算对偶比较的相关系数,其值越高说明评价的一致性程度越高4 . 2等级排列法具体操作步骤为:首先给被试呈现一系列刺激,然后要求被试按照好坏或喜欢- 不喜欢的顺序依次排列等级排列法与对偶比较法的不同之处在于,等级排列法一次对所有的刺激排序因此,在空间误差可以忽略的前提下,等级排列法是制作心理量表的一种最简捷、最直接的方法 三) 信号检测论信号检测论的数学基础:统计决策理论 P ( n / S N ) = 1 - P ( y/ S N ) P ( n / N ) = l - P ( y/ N )信号检测实验的使用前提:A在信号和噪音不易分清的条件下进行( 这里的噪音是指凡是对信号起着干扰作用的因素) 。
B 在呈现刺激前,主试要告诉被试N和 S N 各自出现的概率这个概率称为先定概率,同时对被试说明判定结果的奖罚办法似然比B :被试的判定标准因先定概率和判定结果奖罚办法的不同而不同辨 别 力 指 数 测量感受性,力 越大,表示敏感性越高,/ 越小,表示敏感性越低/ _ M SN _ M N _ 7 _ 7“ 一 ~ — —乙 S N 一4 N 一 ” 击中一乙 虚 报<7 ( 71 . 信号检测论的由来信号检测论是信息论的•个分支,研究的是信息传输系统中信号的接收部分由于人的感官、 中枢分析综合过程可看做是一个信息处理系统, 把刺激变量看做是信号,把刺激中的随机物理变化或感知处理信息中的随机变化看成是噪音, 人作为一个接收者对刺激的辨别问题便可等效于一个在噪音中检测信号的问题2 .信号检测论的基本原理2 . 1 统计学原理( 1 ) 信号检测论的基本概念信号和噪音是其基本概念信号也就是刺激,对信号检测起干扰作用的所有背景都是噪音信号总是伴随噪音, 在噪音背景上出现如果正确检测出噪音背景上的信号,就成为击中也即对信号的正确肯定;如果没有检测出混杂在背景中的信号,则称为漏报,即漏掉信号; 如果判断了背景中没有信号, 则为正确否定; 如果把无信号报告成有信号, 则称为虚报。
相应的,击中率为击中次数/ 出现总次数( P ( y / S N )),漏报率为漏报次数/ 出现总次数可见, 击中率与漏报率之和为1 0 0 % 同样, 虚报率就是虚报次数/ 噪音出现总次数( P ( y / N ) ) ,正确否定率为正确否定次数/ 噪音出现总次数虚报率与正确否定率之和也为1 0 0 % . 在信号检测论当中,当判断标准变化时,击中率、虚报率也会发生相应的变化 2 )信号检测论的基本观点a基本前提假设假设一:重复呈现同一刺激并不产生相同的感觉量因此,多次呈现同一刺激就会形成一个感觉分布,而且由信号( S N )和 噪 音 ( N )引起的感觉分布都是正态的,两个分布的标准差相等,S N 分布的平均数要大于N分布的平均数假设二:被试在决定某一感觉是有信号或噪音引起时,是根据自己的主观标准来判断的,这个判断标准可以受信号呈现的先定概率P( S N )和对反应奖惩办法的影响b 统计决策理论是信号检测论的数学基础从统计学观点看,从噪音中接收信号是一个统计判断过程从假设检验的观点出发,判断信号有无,需要检验这样两个假设的真伪:H 假设,也叫零假设,即没有信号存在的假设;%假设,也叫备择假设,即有信号存在的假设。
于是在被试判断有或无的过程中,存在四种可能,即击中、漏报、正确否定和虚报被试在接受每诙感觉过程时都会产生一定的感觉量X , 这个X 一定落在噪音分布和信号分布的区域内如果X很弱,它就处于噪音分布中;如果X 很强,它一定就是信号关键是不强不弱的X , 它处在信号分布和噪音分布的重叠区域,有可能是信号也有可能是噪音对于这一区域内的X , 它来自信号分布或噪音分布的可能性,可以用信号分布和噪音分布中对应的两个纵线高度( 0 )的比值来衡量,这一比值称为似然比,记 作 1 ( X )信号检测论假设,被试在进行判断过程中,事先选择某一个似然比作为信号和噪音的分界点,也称作判断标准( B)可见,判断标准等于击中率的纵坐标/ 虚报率的纵坐标 击中率的纵坐标就是与击中率相应的Z 分数上正态曲线的高度,可以通过查正态曲线表获得; 虚报率纵坐标的含义类似 被试只要比较当前的X 所对应的似然比与自定的判断标准的大小,就可以做出反应了如果大于判断标准,就 做 “ 有信号”反应;否则就反应“ 噪音”2 . 2 最优决策原则人们在确定判断标准时要受到以下标准的影响:( 1 )信号和噪音的先定概率的大小是影响判断标准的一个因素。
先定概率是在实验之前即可得知的信号或噪音在所有事件中的比率 如果信号的先定概率除以噪音的先定概率大于 1 , 则倾向于“ 有信号”,判断标准就降低( 2 ) 对判断结果的奖惩也影响判断标准当奖惩办法是鼓励多说信号时, B偏低;当奖惩办法是少说信号时: B偏高 3 ) 被试所欲达到的目的是影响判断标准的因素之一 4 ) 其他因素,如速度与准确性权衡、有关实验的知识与经验、主观预期概率、系列跟随效应、信号和噪音的强度及其强度差异等3.信号检测基本原理3. 1信号和噪音:信号:就是刺激 S噪音:信号所伴随的背景 N ( 对信号起着干扰作用的因素都可以当作噪音)3. 2 信号分布和噪音分布信号伴随噪音, 和单独出现噪音这两种情况下, 分别可以在心理感受量值上形成两个分布:信号加噪音分布( 信号分布)SN噪音分布 N3. 3 信号检测论的两种独立指标A反应偏向或判断标准B数学定义:区分信号与噪音反应的心理感受水平( 反应标准)所对应的信号分布纵轴与噪音分布纵轴之比0 (SN)B = ---------------0 (N)标准右移:反应标准变得严格,击中率和虚报率下降,漏报率和正确否定率上升,B值上升。
标准左移:反应标准变得宽松,击中率和虚报率上升,漏报率和正确否定率下降,B值降低例,P ( 击 中 )=0. 28, P ( 虚报 ) =0. 0 6 ,通过查PZ0转换表,求得0 击中的纵轴值为 0. 3368, 0 虚报的纵轴值为0. 1192,则0 (SN) 0. 3368B = --------------- = ---------------------七30 (N) 0. 1192P ( 击中)= 0 . 7 0 P ( 虚报)= 0 . 3 0 , 通过查P Z 0 转换表,求得0击中的纵轴值为0 . 3 4 7 8 , 0虚报的纵轴值为0 . 3 4 7 8 , 则0 ( S N ) 0 . 3 4 7 8B =- - - - - - - - - - =- - - - - - - -0 ( N ) 0 . 3 4 7 8P ( 击中)= 0 . 9 4 P ( 虚报)= 0 . 7 2 , 通过查P Z 0 转换表,求得0击中的纵轴值为0 . 1 1 9 2 , 0 虚报的纵轴值为0 . 3 3 6 8 , 则0 ( S N ) 0 . 1 1 9 2B =- - - - - - - - - - =- - - - - - - - « = 1 / 30 ( N ) 0 . 3 3 6 9B的含义:。
值被认为是反应阈限, 但8不再是对被试感觉状态的绝对分界, 而是被试主观决策反应的判断标准影响判断标准变化的原因主要有:信号出现的概率和对被试回答的奖惩办法4 .辨别力指数c P 及接收者操作特性曲线4 . 1 辨别力指数I 也就是被试的感受性,它等于击中率P 对应的Z分数与虚报率P对应的Z分数之差dr越大,表示敏感性越高,d ,越小,表示敏感性越低设 B=l,则 d '可能出现三类情况:非常敏感:d ' =Z击中一Z虚报= 1 . 4 7 6 - ( - 1 . 4 7 6 ) = 3中等敏感:d ' =Z击中一Z虚报= 0 . 9 9 4 - ( - 0 . 9 9 4 ) = 2不敏感:d ' = Z 击中一Z 虚报= 0 . 5 2 4 - ( - 0 . 5 2 4 ) = 1影响被试辨别力的变化的因素有:被试的感受性和信号强度4 . 2以虚报率为横坐标,击中率为纵坐标作图,可以看到随着标准的变化,击中率与虚报率也相应的变化,而辨别能力才 保持不变这个图就叫做操作者特性曲线( R 0 C 曲线),曲线上每一点的感受性相等( 即 I 值相等),也叫等感受性曲线。
将具有不同分辨能力的被试的实验结果画在•起,可以得到一组d ' 不同的操作者特性曲线图 中 ( 略)从左上到右下的条对角线是条击中率等于虚报率的直线,表示被试的辨别力等于零R 0 C 曲线离这条线越远,表明被试的辨别力越强R 0 C 曲线的曲率( 辨别力)是由信号强度和被试的感受性共同决定的,而与被试的判断标准无关 感受性和判断标准是分离的, 无论是感受性高还是感受性低的曲线,都有高判断标准和低判断标准的情形R O C 曲线的属性:B值的改变独立与d'的变化;R O C 曲线的曲率反应敏感性指标d ,对角线代表P ( y / S N ) = P ( y / N ) 曲线离对角线越远,表示辨别力越强,丁值就越大4 . 信号检测论的应用如,抑郁症和老年痴呆患者的记忆力衰退在社会认知方面的研究:攻击行为4 . 1 有无法一般步骤:( 1 ) 事先选定S N 刺激和N刺激 2 ) 规定S N 和 N出现的概率 3 ) 以随机方式呈现S N 和 N , 要求被试回答是S N 还是N 4 ) 根据被试判断的结果来估计P ( y / S N ) 和 P ( y / N ) 在此基础上就可以计算出各项相关指标,绘出操作者特性曲线。
4 . 2评价法有无法把感觉连续体分为两个部分, 有信号感觉和无信号感觉, 因此只能提供给我们某一感觉是在标准之上还是之下, 而无法知晓这种感觉离标准多远 而评价法则是在同一实验中,被试使用几个不同的判断标准在评价法中通常有儿个不同的评价等级, 代表了被试对刺激的不同确信程度 相应被试判断的不同等级, 被试存在不同的判断标准所以,评价法是把强度不同的感觉分属于不同的评价等级,可以用反应的把握程度表示出来,从而避免有无法中感觉强度的不同,只用有信号或无信号反应的简单做法, 而保留了更多的信息 评价法可以获得有无法多轮实验才能获得的结果,可以计算不同标准下的d ,和 B但是,应注意,个标准下击中率与虚报率的计算,高标准下的击中率与虚报率等于低于该标准的击中率和虚报率的累积相加 ( ? )4 . 3 迫选法采用迫选法时,主试的兴趣主要在于被试的辨别力,而对其判断标准不太关心 迫选法在被试每次判断之前至少连续呈现两次刺激, 在两次或多次呈现的刺激中只有•次有信号出现,而且,信号出现的顺序是随机排列的,让被试判断那一次刺激中有信号迫选法的基本步骤是:( 1 ) 事先确定S N 和 N ( 2 ) 刺激呈现方式: m A F C ( a l t e r n a t i v e f o r c e d c h o i c e , m代表刺激的数目) 程序,即每次从m个刺激中选出信号。
一般每次呈现2 - 8 个刺激,其中只有一个S N , 其余都是相同的N o( 3 ) 反应方式:多个刺激呈现后,判断哪一个是SN 被试对信号的判断是依据他的感觉,不需要自己确定一个标准,也没有多说或少说‘ ' 信号" 的倾向 4 ) 计算感受性的方法:根据被试正确判断次数和实验次数可以计算正确判断概率,即 P ( c ) =正确判断的次数/ 判断的总次数P ( c ) 是反映被试辨别力的指标,P ( c ) 越大说明感受性越高在其他条件不变的情况下,被试的辨别力与每次呈现的刺激数目有关 一般而言,一次呈现刺激数目越多,被试分辨的难度越大阈限理论和信号检测论都反映了感觉过程的某些方面, 将两者整和之后, 就可得到更全面的图景:感觉系统对刺激的有效分辨从某一强度开始,这一强度就是阈限;同时对于阈限以上强度的刺激,感觉报告将取决于感觉强度与某一主观决策相比较的结果 四) 假设检验可以说,每一个实验的存在,仅仅是为了给事实一个反驳虚无假设的机会 - - - R. A . F i s h e r参数估计和参数假设检验的共同之处是利用样本信息对总体进行某种推断, 且使用的统计量也一样在统计学中,通过样本统计量得出的差异做出一般性结论,判断总体参数之间是否存在差异, 这种推论过程称作假设检验。
它的基本任务就是事先对总体参数或总体分布形态做出一个假设, 然后利用样本信息来判断原假设是否合理, 从而决定是否接受原假设假设检验包括参数检验和非参数检验若进行假设检验时,总体的分布形式已知,需要对总体的未知参数进行假设检验, 称其为参数假设检验若对总体分布形式所知甚少,需要对未知函数形式及其他特征进行假设检验,通常称之为非参数假设检验1 . 假设检验的原理1 . 1 假设与假设检验假设检验是统计学中的一种推论过程,通过样本统计量得出的差异作为一般性结论,判断总体参数之间是否存在差异假设检验的实质是对可置信性的评价,是对一个不确定问题的决策过程,其结果在- 淀概率上正确的,而不是全部统计学中的一般专指对总体参数所做的假定性说明 在进行任何一项研究时; 都需要根据已有的经验和理论对研究结果事先做出一种预期性假设, 我们称为科学假设, 又叫备择假设,记作乩在统计学中,不对乩的真实性做直接检验,而是检验与其对立的假设,即虚无假设,或称零假设,记作H 假设检验的目的就是要判断虚无假设H 是否正确,决定接受还是拒绝原假设用虚无假设和备择假设相互排斥,并且只有 个正确虚无假设是统计推论的出发点。
对于任何一种研究而言,其结果无外乎有两种可能, 即是否符合我们预期一般来说证伪一件事情比证实一件事容易, 在行为科学的研究中,由于我们无法了解总体中除样本以外的个体情况,因此尝试拒绝虚无假设的方法优于证明备择假设备则假设:因变量的变化、差异是由于自变量的作用,往往是我们对研究结果的预期,用 “表示虚无假设:实际上什么也没有发生,我们所预计的改变、差异、处理效果都不存在,观察到的差异只是随机误差在起作用,用及表示1 . 2小概率原理假设检验的基本思想是概率性质的反证法即假设虚无假设为真, 然后检验虚无假设的真实性在假定虚无假设为真的情况下,虚无假设被判断为假的几率十分渺小,我们称之为小概率事件 但如果这种小概率事件依然会在一次试验中出现, 则表明此事件不可能为小概率事件,也就推翻了虚无假设为真的假定此时,要接受备择假设反之,小概率事件没有出现,则要接受虚无假设,但这并不意味着虚无假设是成立的 小概率事件在一次试验中几乎是不可能发生的 )L3 假设检验中的两类错误( 本部分内容请参照实心信号检测论对照来看——M J 注)总体的情况往往是未知的,根据样本推断总体,有可能犯两类错误:( 1 )当虚无假设正确时,我们拒绝了它所犯的错误,这类错误也叫弃真错误,即 I 类错误,这类错误的概率以a表示,因此也叫a错误。
研究者得出了处理有效果的结论,而实际上并没有效果,即所谓 “ 无中生有” 2 )当虚无假设是错误的时候,我们没有拒绝所犯的错误,这类错误为取伪错误,即 I I 类错误,这类错误的概率用B表示,故也叫B 错误假设检验未能侦查到实际存在的处理效应,即所谓“ 失之交臂” 在实际问题中, 一 般总是控制犯I 类错误的概率a ,使 H 成立时犯I 类错误的概率不超过a在这种原则下的统计假设问题称为显著性检验两类错误的关系:( 1 ) a+ B不一定等于h a与B是在两个前提下的概率a的前提是 “ H 为真” ;B的前提为“ H 为假” 2 )在其他条件不变的情况下,a与 B不可能同时减小或增大许多情况需要在规定a的 同 时 尽 量 减 小 最 直 接 的方法就是增大样本容量1 - B 反映着正确辨认真实差异的能力统计学中称( 1 - B )为统计检验力.表 5 - 1 假设检验中的两类错误真实情况判断结果接受H 拒绝H 为真正确概率1 - a ( 击中)弃真概率a ( 第一类错误)( 漏报)H 为假取伪概率B ( 第二类错误) ( 虚报) 正确概率1 - B ( 正确否定)1 . 4单侧检验和双侧检验只强调差异不强调方向性的检验叫双侧检验, 显著性百分等级为a / 2 。
强调某一方向的检验叫单侧检验,显著性的百分等级为a两者的区别:( 1 )问题的提法不同双侧检验的提法是:P和已知常数U 是否有显著差异?单侧检验的提法是: U是否显著地高于已知常数U o ?( 2 )建立假设的形式不同双侧检验的虚无假设假设和备择假设为:H o : y — u 0 , H i : u # u “ 0单侧检验的虚无假设和备择假设为:H o : U § U 0 , H i : U > N o 或 H o : 口 M NO, HI: U< y o »( 3 )否定的区域不同双侧检验否定区域为| Z | > Z “ 2 , 而单侧检验查表得Z 一定要根据研究目的所规定的方向性来确定使用何种检验对于同样的显著性标准, 在某一方向上,单侧检验的临界区域要大于双侧检验,因此如果差异发生在该方向,单侧检验犯B错误的概率较小,我们也说它的检验效力更高1 . 5 假设检验的步骤( 1 )提出虚无假设和备择假设 2 )选择适当的检验统计量 3 )确定检验的方向性并规定显著性水平 4 )搜集样本数据,计算检验统计量的值 5 )做出统计决策可以有两种方法做出统计决策。
a 将检验统计量的值与拒绝规则所指定的临界值相比较,确定是否拒绝虚无假设( 原假设) ;b由步骤( 5 )的检验统计量计算p 值,利用p 值确定是否拒绝虚无假设( 原假设) 2.样本与总体平均数差异的检验在假设检验的步骤中,关键在于确定适当的统计量其他过程中的变化较少 1 ) 总体平均数的显著性检验中,当总体正态分布且方差已知,采用:2 岫 =X二 - 〃4o 其,中 仁 = 生C T()为 和% 分别为总体的平均数和方差( 2 ) 总体平均数的显著性检验中,当总体正态分布而方差未知,采用t 检验,以样本方差估计总体方差,选择的统计量为:obs等 其 中 与 =方 而s =ssn-1S为用样本和方估算出的总体方差3 )总体平均数的显著性检验中,当总体为非正态分布,且样本容量大于3 0 时,可以选择近似Z 检验总体方差已知时Z ' = Z ;总体方差未知时:Z , = t 3.两样本平均数差异的检验3 . 1 独立样本(1 )V - Y两总体方差已知:Z= 1 2(2 ) 两总体方差未知,且方差相等:t =(〃1 + % )〃 1 + % - 2 n} •n2自由度 d f -n i + n2-2 o( 3 )两总体方差未知,且方差不等:, 二 凡一招」其 中 ,SE2邓战+S琮 〃此时分布的自由度为:1 _ S屋“ - H । (1 + 幻2也- S战 + 限 , )勺 n2( 4 ) 两总体方差未知,且方差不等:也同样使用仁 -「 无一』2—J s 琮 + S /但这时要计算出临界值。
计算方法略( 5 ) 当 m和 m都是大样本数据时,可以不管总体方差是否相等,应用公式:3 . 2 相关样本两种方法:( 1 ) 应用原始数据计算构造新的数据4 =无 ,「 又2 , , 7的分布可以看作是从d总体中抽取的一个样本平均数, 因而统计量1 = 服从自由度为n -1—\ n(n-l)的 t 分布 ( 2 ) 应用两组样本的相关系数计算 两总体方差已知, Z = 1 七兄 ;< 7(2 + < 7 2 - 2 r < 7lCT2Y _ y两总体方差未知时,t= ( , : 2 @卜 ;+ s; 2 r si &V n-13 . 3总体非正态分布如果两样本容量大于3 0 可以近似使用Z , 检验这是两样本平均数检验的通用公式,( 1 ) 总体方差已知①独立样本②相关样本%"立乌产&其中r( 2 ) 总体方差未知①独立样本( 方差差异不显著时),所不同的仅在于标准误的计算为两组变量之间的相关系数(J — —DX勺5 ; +“ 2 $ ; 马+%勺+ 〃2 - 2 nxn2②相关样本a . 相关系数未知:( T , - = 1 ----- - ——— 其中d为每一对对应数据之差DXYb . 相关系数已知:< 7 , -s; + s; —2方|5 2n -\4 . 方差齐性的检验方差齐性检验就是从两个样本方差的有关数据信息来推断两总体方差的差异是否显著。
通常使用齐性检验时方差都是未知的, 因此要用样本方差的无偏估计量来推论总体方差 应用的检验统计量为F =土 坯 , 其自由度为dfk = 〃 大 —1 和 6" 小 =〃 小 —1 的 F分布 且 F 三1 ,S" T 小它的否定域总在右侧注意,此时的检验为单侧检验 H o: < 1 , H i : M l # ? # )4. 1样本方差与总体方差当从正态分布的总体中随机抽取容量为n的样本时, 其样本方差与总体方差比值服从xz分布:/ =与由自由度可=〃 一 1 箸 / 茂 ,依据显著性水平判断4. 2两个样本方差之间A独立样本2F = 3其中当两样本自由度相差不大时可用s .代替s“ _ i$ 小查表时/ - 1 , 期 =% - 1B相关样本其中df = n —25 . 相关系数的显著性检验( ?)5 . 1 积差相关( 即用样本的相关检验总体的相关)a . 当 P = 0 时:t = - J -其中的~ = r为样本的积差相关系数 此时,虚无假臣设为H ° : P = 0o这里P为总体的相关系数)b . 当 P W0时:先通过查表将r和 P转化为费舍乙和Z , 然后进行Z 检验Z -ZV 〃 - 35 . 2 等级相关和肯德尔W系数在总体相关系数为零时:查各自的相关系数表,判定样本相关显著.5 . 3 相关系数差异的显著性检验( 1 ) n和R分别由两组彼此独立的被试得到。
这时将两相关系数进行费舍Z , 的转化进行Z检验 2 ) 两样本的相关系数由同一组被试算得P权 , P 2 3 , P l ” 目的是检验P 1 2 与 P 1 3 的差异五、实验器材与实验范式( 一 ) 主 要的实验仪器1 . 听力计听力计是测定个体对各种声音感受性大小的仪器, 通过与正常听觉的比较, 可确定被测者的听力损失情况 心理学中使用的听力计通常是纯音听力计 仪器可根据被试的反应直接绘出可听度曲线2 . 立体境立体境是一种证实双眼视差和立体知觉的仪器 目前实验室常用的立体境有三棱镜式立体境、反射式立体境和栅栏式立体境3 . 深度知觉仪深度知觉仪是用来检验深度知觉敏锐度的仪器 该仪器早期主要是用来作为一种选拔测验,以淘汰那些不符合深度知觉要求的候选航空人员 它是根据赫尔姆霍兹的三针实验原理而制成4 . 时间知觉测试仪时间知觉仪是时间知觉实验的基本仪器, 可用于检验各种因素对时间知觉的影响, 检查个体的自我估计在估计时间中的作用, 测验个体在时间知觉上的阈限, 检验刺激的不同呈现方式对估计时间的影响,帮助学习用复制发研究时间知觉而且,此种装置还可以替代定时装置.5 . 空间知觉测试仪空间知觉测试仪是用于考察人类空间知觉认知特点的仪器, 通过人们凭借视觉对空间位置中形状、方向的辨别过程,来鉴别个体对空间特性的辨别能力,还可用于验证刺激的空间结构特点对信息传递效率的影响。
6 . 速度知觉仪速度知觉仪是测量人的速度判断能力的仪器7 . 速示器速示器是一种短时呈现视觉刺激的仪器,在知觉、记忆和学习等方面的研究中, 经常要适当的仪器把刺激呈现给被试,以记录他们的反应该一起用途范围较广,可以通过高速呈现来测定图形、汉字、英文、数字、广告的辨认阈限,测定注意范围,还可用于学习和记忆等多种实验但是,使用速示器进行的实验具有•个弱点, 即由于视觉后像的存在, 常常无法判定被试到底是对刺激的反应还是对后像的反应8 . 记忆鼓记忆鼓是- - 种研究记忆的仪器/ 该仪器适用于多种记忆研究,如提示法记忆研究、系列学习和成对联想研究等9 . 反应计时器反应计时器是一种用来测量个体在不同条件下对单个或多个刺激或刺激组合的反应速度和准确性的仪器比较有代表性的有简单反应计时器、视觉选择反应计时器、多选择反应计时器反应盒也是目前常用的一种用来测量视觉和听觉刺激反应时的装置10 . 警戒仪警戒仪是测定个体警戒状态的仪器 警戒指的是人在一定环境中的觉察特点,即对不能预期出现的事件的准备状态 警戒作业的绩效受多种因素的影响, 通常随着持续时间的延长而下降11 . 镜画仪镜画仪是一种主要研究练习效果和技能迁移作用的仪器。
可考察被试的反转能力、 手眼协调能力和学习能力1 2 . 眼动仪眼动仪是测试人眼活动情况和研究有关心理过程的专用仪器 二)各实验中使用的仪器( 三 )主要的实验范式图像记忆实验:部分报告法声像记忆——四耳人实验短时记忆的自由回忆实验不随意学习实验心理旋转实验短时记忆视觉编码实验短时记忆的信息提取实验开窗实验序列反应时范式( P 2 1 3 )内隐联想测验( P 2 1 7G o / N o - G o 范式外在情感性西蒙任务提示范式( P 3 2 8搜索范式( P 3 3 4过滤范式( P双任务范式( P 3 3 9视崖实验时间泛化程序( P 4 0 1二分程序固定时程强化程序峰值程序斯特鲁普启动实验巴特利特的再现实验( P 4 3 3人工语法研究范式序列学习范式复杂系统控制反射信号检测范式出声思维( P 4 9 6认知建模( P 5 0 2人工概念实验渐变一突变实验“ 两组三项组合”程序滑铁卢格式塔趋合任务累积线索任务F O K 范式复杂系统控制任务球一箱问题实验图灵测验3 . 主要的情绪实验沙赫特的情绪产生实验哈罗的恒河猴实验恐惧习得实验习得性失助实验人类抑郁与控制能力缺失的关系研究图片联想实验条件性情绪技术双跑道程序单词诱导法时间抽样技术。












