
管理科学中的实验研究方法综述.ppt
35页经济管理科学中的实验研究方法,西南交通大学经济管理学院 西蒙-泽尔滕行为决策研究实验室 傅浩 haofu12@,大纲,一、经济管理科学研究中的实验研究方法 1.1 计算机联机实验方法 1.2 神经与电生理实验研究方法 1.3 录像实验与文本分析方法 1.4 实地实验研究方法(略) 二、跨文化比较的实验研究:以腐败行为实验为例,一、经济管理科学中的实验研究方法,发端于1930年代(Thurstone,1931)的经济学实验研究目前为止在方法论上已出现若干主要的分支 按Roth(1995)的划分,1960年代以前的早期实验研究大多受到了博弈论的基础性影响(von Neumann & Morgenstern,1944) “each of these strands of experimental economics was profoundly influenced by the publication in 1944…” 行为博弈理论(behavioral game theory)被公认为实验经济学的两大研究主题之一(另一个主题通常认为是市场设计(market design),略),行为博弈理论,与一般的博弈论研究的纯数学理论分析框架不同 研究被试在不同实验规则下如何做出决策,可能会犯哪些错误(bias) 通过行为博弈实验,人们由此修正纯理论博弈可能的缺陷(囚徒困境) 实验研究结果发现:由于存在社会偏好(social preferences),人们只有有限理性(boundedly rational),以及学习效应,使行为博弈实验结果与纯理论推导可能存在不同,1.1 计算机联机实验方法,,科学方法:寻找用可重复验证的方法来解释自然现象,并由此作出有用的预测。
实现的方式包括观察自然现象、以及(或)用实验在可控条件下模拟自然现象……,从上述定义引出的方法论意义,任何“科学”所使用的“方法”,均应可重复验证并作出预测 从这个角度看,对这一定义的接受,也意味着对大名鼎鼎的“萨缪尔森-弗里德曼争论”中弗里德曼的“预测高于假设(现实性)”的工具理性主义的支持 相关分析参见《经济学方法论》(马克·布劳格),检验的方法,按照维基百科的定义,验证理论的方法无非两类: 观察(迄今为止仍被广泛使用的计量建模方法即是一种观察方法)与实验 早期的经济学研究曾认为经济学主要只能依靠非实验方法(参见老版萨缪尔森《经济学》),但显然这一论断已被放弃(对比最新版本),实验方法何以被主流学界所接受?,在可控环境下进行的经济学实验,使研究者可以考虑“在其他条件不变的情况下,改变某个解释变量以衡量其对被解释变量的影响,进而检验变量间的经济联系” 虽然经济学实验较之观察方法(如计量等)发展较晚,但在经济实践中事实上早已出现 例如:每一公共政策的推行,均可视为一个政策实验(policy experiment),所产生的政策效果即实验效果,只是由于这个实验只有“实验组”没有“对照组”,使政策绩效评估相对困难甚至完全不可能,一个典型例证:miracle of Chile? Friedman Vs. Sen,1973年Pinochet延请芝加哥学派主导制定智利的经济政策,其后智利的经济增长绩效远超其他南美国家 M. Friedman: Chilean economy did very well A. Sen: there was little net economic growth, social indicators remain poor 完全相反的观点,各自均可从不同视角的观察中获得支持 两个诺奖得主,谁正确?,合理的解决方案:“实验组-对照组”的比较,没有实验对照组的对比,争论将永无休止 自然科学研究中常用的“实验组-对照组”研究思路由此出现 中国经济政策制定中常用的“试点” E. Duflo(MIT)等即用field experiment方法进行了大量政策评估性质的研究 http://econ-www.mit.edu/faculty/eduflo/papers,现场实验或田野实验的缺陷,对于一些“反事实”的推论 以及即使小范围试点也代价高昂的经济行为 无法进行现场实验或田野实验 例如: 08年奥运(或2010年世博)举办会对中国经济产生影响,但具体这个影响多大,由于无法回到08年8月8日不让奥运举办,因此量化分析事实上不可能,解决的方法,实验室实验(Lab experiment) 又称控制实验(controlled experiment) 在联机实验室中,通常招募学生作为被试,在电脑上给定不同的情景,使之做出相应的经济决策 匿名 货币报酬:Experimental Currency Unit + show-up fee 诚实(非欺骗),匿名,目的:获得被试基于“真实偏好”所形成的真实反应(sincere response) 与真实反应相对应的概念:策略性反应(strategic response) 在传统的问卷调查方法中,事实上即不可避免地存在程度不等的被调查者的偏好掩饰或偏好伪装 保证实验的匿名性,可使被试的决策能够最大程度地体现其真实偏好,保证匿名实验的若干控制手段,1、通过被试报名时的个人信息尽可能使一组同时参加实验的被试互不认识 2、在被试参加实验前的等待时间严格禁止相互交谈 3、在实验开始之初的被试配对中完全随机 4、在实验进程中被试之间严格控制其相互交流,货币报酬,之所以游戏似的实验能够用于理论检验和预测,是因为假定通过实验能够获得被试的真实反应 而之所以被试能够做出真实反应,是因为有必要的激励 货币报酬是最常用的激励 此外,包括物品、学分等,诚实(非欺骗),保证所有被试均得到同样的公共信息 通过实验导语的宣读、讲解,以及测试,保证所有被试对实验有同等程度的正确理解 对实验主持者的要求 在实验结束后,通常以问卷方式搜集有关被试实验决策的调查资料,由此了解他们对实验的真实看法,尤其找出个别被试对实验的错误理解,1.2 神经与电生理实验,业已形成一个新的经济学分支:神经经济学(neuroeconomics) 高度的工具导向 fMRI(核磁共振)、眼动仪、多导生理仪等 在经济学与营销科学中广泛地使用,神经实验的控制与组织,由于神经与电生理实验对被试个体的生理与心理状态及实验环境要求较高 因此在被试选择时必须有更严格的要求 参加实验前及实验进行之中需生理状态良好(无疾病,无服药等) 通常为右利手 实验环境要求电磁屏蔽(fMRI),光照、温度、湿度等恒定,一个极端例子,在经典的最后通牒实验中,结果显示存在着一种与互利有关的社会共识(social norm),对经济人假定形成了挑战 在fMRI实验中,有证据显示面对不公平的建议时,跟情绪有关的脑部区域活动强烈程度与拒绝这一分配的倾向正相关,但这一相关性是否是因果关系?Knoch et. Al(Science, 2006)使用一个极度“暴力”的实验设计,用穿透颅骨的电磁刺激直接作用于对应于情绪的脑部区域,使之活动中断,结果显示,在此期间,被试接受不公平分配的倾向显著增加,在营销科学中的其他应用,有生理研究显示,恰当的背景音乐可以显著地提高消费者在卖场的停留时间(field experiment + Lab experiment + nerouexperiment) 广告在平面媒体(如电脑屏幕或报纸)的位置会显著地影响受众对广告诉求的认知(眼动实验和电生理实验),1.3 录像实验与内容分析研究方法,录像实验(Video experiment):在无主持(无引导)或有主持(有引导)的实验情境中,由被试进行面对面的讨论,加以录像录音,整理录音文本后进行运用非参数检验等方法内容分析(content analysis) 在行为科学中一种成熟的研究方法 who says what, to whom, how, and with what effect (Lasswell,1946),一个例子,,录像实验的特点,实施手续简单,甚至可以进行儿童实验 评价方法固定且客观 应用范围广泛,文本分析工作量大 在有主持(需要引导)时,引导的方法和程度需要十分谨慎 在进行跨文化比较研究时,所有材料均需双向互译以避免误解,实验设计例1 选美比赛实验(p-beauty contest game),Keynes在《通论》中曾说:“报纸上发表一百张照片,要参加竞赛者选出其中最美的六个,谁的结果与全体竞赛的平均爱好者最接近,谁就得奖。
在这种情况下,每一参加竞赛者都不选他自己认为最美的六个,而选他认为别人认为最美的六个” 在股市上,则是一个多层次思考(level-K thinking)的过程:普通人预测明天哪只票会涨,聪明人预测明天所有人(或大多数人)会预测哪只票会涨 为对这个问题进行实验研究,可设计如下实验(Nagel,1995),实验设计,全班每位同学均从0-100中选一个数字,我们将计算出所有人的总平均,最接近总平均*1/2的人获胜,赢得奖金 你会怎么选?,均衡解,因为初始均值小于等于100,所以位于[50, 100]上的选择是违反理性的 既然认为别人是理性的,所以选择应该集中于[0, 50],进而均值不会超过50 50的1/2是25 由此可以得到,在[25, 50]之间的选择运用了一步推理,同理,[12.5, 25]之间的选择运用了两步推理等等 以此类推,无限推理达到的均衡解是0,结果:UCSD的Crawford教授在世界各国进行了大量实验,被试均为经济学教授,结果:除了在理性预期学派重镇的芝加哥大学所有人都给出均衡解0,其他大学均有很多被试选择0的解,明显不理性,一次p=2/3的课堂实验结果,平均值=27.75 平均值*2/3=18.5 剔除“野值”(67)后 均值=20.9 平均值*2/3=14 这意味着或者真的有人“很傻很天真”;或者有人认为“别人很傻很天真” 但随着实验轮次的增加,平均值会逐渐下降,到第10轮时,基本稳定到0——学习效应,P选美实验的应用,研究市场泡沫问题 当资产价格不断上升时,所有人都知道迟早要崩盘 但就此沽空可能让你赔掉大好的机会 都知道泡沫终会破灭,但何时破灭? 如同现在大家都知道均衡解为0,但第一轮选0极为不智,实验室实验流程介绍: 例2:trust experiment,实验设计: 每个session共24个被试,分成3组,每组8人 实验开始前每个被试抽签决定在实验中扮演的角色(主席候选人3个或公民5个) 单轮实验与多轮实验;随机生成与投票选举;公开主席信息与不公开 形成主席后,1个主席与5个公民形成一个实验小组进行决策 决策步骤一:公民决定在自己初始获得的游戏点数(如10点)中发送多少点(X)给主席 决策步骤二:主席从每个公民所发送的2X点中返还给公民多少点(Y),主席的所得为初始点数+2(X1+…X5)-(Y1+…+Y5),公民的收入为初始点数-X+Y 第一轮实验结束 理论上应有以下三个假设: H1:单轮实验达成信任的可能性显著低于多轮实验、 H2:投票选举达成信任的可能性显著高于随机生成 H3:信息公开达成信任的可能性显著高于不公开 H4: 被试的风险偏好会对其决策行为产生影响 H5: 被试的性别会对其决策行为产生影响,2. 国内外研究现状及发展动态分析,将腐败问题纳入经济学研究的范畴始于1970年代(Rose-Ackerman,1978) 在研究方法上,传统研究主要使用两类基础数据: (1)国际组织或学术机构定期或不定期发布的宏观腐败/清廉指数(如由Transparency International发布的腐败感知指数Corruption Perceptions Iindex等); (2)由问卷调查等方式获得的“微观”数据,利用统计分析、计量建模等分析方法进行研究(Dollar等,2001) 实证研究中传统研究思路主要集中于 1)或者从薪酬水平等经济因素的解释(如Van Rijckeghem和Weder, 2001等); 2)或从经济、法律等制度的角度进行探讨(如Herzfeld和Weiss,。












