
第一章囚徒困境与纳什均衡
104页单击此处编辑母版标题样式,,单击此处编辑母版文本样式,,第二级,,第三级,,第四级,,第五级,,,,*,第一章 囚徒困境与纳什均衡,,一、经典案例,——,囚徒困境,,二、现实生活中的“囚徒困境”,,三、如何走出“囚徒困境”,,四、如何利用“囚徒困境”,本章内容,一、经典案例,——,囚徒困境,,克格勃的小花招,在前苏联,有一位乐队指挥坐火车前往某地演出正当他在车上翻看乐谱时,两名克格勃(,KGB,,苏联国家安全警察,实际是政治特务)将他作为间谍逮捕了他们以为那乐谱是某种密码,这位乐队指挥争辩说那只是柴可夫斯基的小提琴协奏曲,却无济于事第二天,审问者自鸣得意地走进来说:,“,我看你还是老实招了吧,我们已经抓住了你的朋友柴可夫斯基了,他这会儿正向我们交代呢你如果再不招就枪毙了你如果交代了,只判你,10,年经典案例,——,囚徒困境,两个嫌疑犯(甲和乙)作案后被警察抓住,,隔离,审讯;警方的政策是,“,坦白从宽,抗拒从严,”,:,,如果两人都坦白则各判,8,年;,,如果一人坦白另一人不坦白,坦白的放出去,不坦白的判,15,年;,,如果都不坦白则各判1年这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?,,1950,年,斯担福大学客座教授、数学家,图克,(,Tucker),为形象地说明博弈过程,构造了著名的“囚徒困境”模型。
15,,,0,),,(,0,,,15,),(,1,,,1,),乙,甲,合作,合作,背叛,背叛,(,8,,,8,),经典案例,——,囚徒困境,从表面上看,他们应该互相合作,保持沉默但他们不得不仔细考虑对方可能采取什么选择甲、乙两个人都十分精明,而且都只关心减少自己的刑期,并不在乎对方被判多少年,(,人都是有私心的嘛,),甲会这样推理:假如乙不招,我只要一招供,马上可以获得自由,而不招却要坐牢,1,年,显然招比不招好;假如乙招了,我若不招,则要坐牢,15,年,招了只坐,10,年,显然还是以招认为好无论乙招与不招,我的最佳选择都是招认还是招了吧自然,乙也同样精明,也会如此推理经典案例,——,囚徒困境,“,囚徒困境,”,产生不良结局的原因是囚犯都基于自私的角度考虑,最终导致合作没有产生如果你认为对方合作,那你背叛将能得到更多的好处反过来,如果你认为对方将背叛,那么你也有两个选择,你选择合作,那么你就是,“,笨蛋,”,;你选择背叛,就会得到,“,对双方背叛的惩罚,”,无论对方如何行动,你背叛总是好的相同的逻辑对另一个人也同样适用个体的理性导致双方得到的比可能得到的少,这就是,“,困境,”,经典案例,——,囚徒困境,启示,1,:,在,“,囚徒困境,”,中表现最好的策略直接取决于对方采用的策略,特别是取决于这个策略为发展双方合作留出多大的余地。
独立于对方所用策略之外的最好决策规则是不存在的启示,2,:,“,囚徒困境,”,是一些非常普遍而有趣的情形的简单抽象在这些情形中,从个人的角度来说,背叛是最好的选择,但双方背叛会导致不甚理想的结果出现经典案例,——,囚徒困境,就是说,对方背叛,你也背叛将会更好些这意味着,无论对方如何行动,如果你认为对方将合作,你背叛能得到更多;如果你认为对方将背叛,你背叛也能得到更多你背叛总是好的于是两人都作出招供的选择,这对他们个人来说都是最佳的,即最符合个体理性的选择照博弈论的说法,这是本问题的惟一平衡点只有在这一点上,任何一人单方面改变选择,他只会得到较差的结果这一点就是,纳什均衡,(Nash Equilibrium)经典案例,——,囚徒困境,纳什均衡的思想,,在博弈达到纳什均衡时,局中的每一个博弈者都不可能因为单方面改变自己的策略而增加获益,于是各方为了自己利益的最大化而选择了某中最优策略,并与其他对手达成了某种暂时的平衡这种平衡在外界环境没有变化的情况下,倘若有关各方坚持原有的利益最大化原则并理性面对现实,那么这种平衡状况就能够长期保持稳定纳什均衡的思想,,再简单一点说,一策略组合中,所有的参与者面临这样的一种情况:当其他人不改变策略时,他此时的策略是最好的。
也就是说,此时如果他改变策略,他的收益将会降低在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动在,“,囚徒困境,”,变形的博弈中,,A,和,B,都坦白就是一个纳什均衡,这对双方来说都是最优选择同时在这个博弈中,其均衡对双方来说是全局最优的当然,博弈达到纳什均衡,并不一定是对参与者最有利的结果,,更不意味着是对整个社会作为一个整体而言最有利的结果诺贝尔经济学奖得主,萨缪尔森,:,,你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词,——,供给与需求博弈论专家,坎多瑞,引申说:,,要成为现代经济学家,这只鹦鹉必须再多学一个词,这个词就是“纳什均衡”Paul Anthony Samuelson,(born May 15, 1915),纳什均衡的思想,,二、现实生活中的“囚徒困境,”,[,明,],宋濂,《,宋文宪公全集,》,记有一个故事:,,玉寅生与三乌丛臣是朋友,他们曾歃血盟誓:,“,我辈应自励,他日入朝为官,绝不趋炎附势如有违此誓,请神明惩罚没多久,他们一起到晋国为官当时赵宣子是晋王宠臣,各大夫均奔走于他家玉寅生重申以前的誓言,三乌丛臣说:,“,说过的话犹在耳畔,岂敢忘记!,”,,但三乌丛臣后悔当初的誓言,又怕玉寅生知道。
于是在一个大清早,鸡刚一报晓,他就前去拜望赵宣子一进门,他忽然看到东边走廊有个人坐在那里,他走前举灯一照,那个人原来是玉寅生现实生活中的“囚徒困境 ”,现实生活中的“囚徒困境 ”,(,升官或落选,,,升官或落选,),(,落选,,,升官,),三乌丛臣,玉寅生,不,巴结,巴结,不巴结,巴结,(,升官,,,落选,),(,升官或落选,,,升官或落选,),取决于谁巴结得更到位,如果巴结上司会有升官的机会,则其他人也面对同样的局面假定两个人竞争一个官职,则,双方均巴结,则双方成本高;双方均不巴结,则双方成本低然而“背叛”是双方的最佳的策略囚徒与战士,约瑟夫,·,海勒,《,第,22,条军规,》,的一个故事:,,第二次世界大战胜利在望,投弹手尤塞里安不想成为胜利前夕最后一批牺牲者,千方百计逃避执行任务他的上级军官问:,“,可是,假如我方士兵都这么想呢?,”,可尤塞里安答道:,“,那我若是不这么想,岂不就成了一个大傻瓜?,”,1984,年,美国联邦预算赤字实在太高了裁减必要的巨额开支在政治上并不可行,因此,大幅增税应是不可避免的民主党总统候选人沃尔特,·,蒙代尔在竞选中提出增税政策,却被,罗纳德,·,里根,打得落花流水,因为里根许诺绝不加税。
政客的囚徒困境,,这就是为什么美国是世界上最富有的国家,却同时又是最大的债务国的原因电信价格竞争的“囚徒困境”,A,(中国移动)实力雄厚,占据了绝大多数的市场份额;政府为了打破垄断鼓励竞争而筹建起,B,(中国联通)并允许,B,的价格可以比,A,低,10,%这一举动,则开始不会对,A,产生多大的影响,,A,、,B,可以达到平衡但由于,B,在价格方面的优势,市场份额逐步壮大,到了一定程度,对,A,造成了影响这时候,,A,该怎么做?不妨假定:,,,,,1,),A,降价而,B,维持,则,A,获利,15,,,B,损失,5,,整体获利,10,;,,,,,2,),A,维持且,B,也维持,则,A,获利,5,,,B,获利,10,,整体获利,15,;,,,,,3,),A,维持而,B,降价,则,A,损失,10,,,B,获利,15,,整体获利,5,;,,,,,4,),A,降价且,B,也降价,则,A,损失,5,,,B,损失,5,,整体损失,10,电信价格竞争的“囚徒困境”,,从,A,角度看,降价显然要比维持好,在概率均等的情况下,,A,降价的收益为,15,×,50,%-,5,×,50,%=,5,,维持的收益为,5,×,50,%-,10,×,50,%=-,2.5,。
从,B,角度看,降价同样比维持好,其降价收益为,5,,维持收益为,2.5,在这轮博弈中,,A,、,B,都将降价作为策略,因此各损失,5,,整体损失,10,,整体收益是最差的这就是此博弈最终所出现的纳什均衡-,5,,,-,5,),(,-,10,,,15,),B,(中国联通),A,(中国移动,不降价,降价,不降价,降价,(,15,,,-,5,),(5,,,10,),学生的囚徒困境,数十道,“,减负令,”,难见效,,中小学生课业负担不减反增,,,,,,仅,1985,年至,2000,年的,15,年里,中央就下达,“,减负令,”,49,次减轻中小学生过重负担喊了,20,多年,实际情况却是学生课业负担不但没减下来,反倒呈现出越演越烈之势,致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等为什么?,,购房者的“囚徒困境”,,“,我没买房,结果房价还是涨了,因为我们无法保证大家都不买房可是,我错了吗?没有当初如果我买房了,房价下跌了呢?因为我不能保证大家都买房人们根本不能预知在疾风暴雨式的调控之下,房价竟还能且调且涨可是,我对了吗?没有这是一部眼下流行、充满黑色幽默的网络视频,《,北漂族的无房生活,》,中的经典对白。
含泪的,“,调侃,”,折射出当下楼市的,“,囚徒困境,”,:买,难担高房价重负;不买,难受房价节节攀升的煎熬2006,年,房价飙升,网上发起集体不买房,响应者众然而实际购房者仍多,房价仍然高企为什么?,盗版书的“囚徒困境”,无论怎么打击,盗版书仍是屡禁不绝而一个更加奇怪的现象出现了:一些畅销书还没有印刷完毕,其盗版书竟已堂而皇之地走上了书摊,———,他们一改过去,“,跟风,”,的传统,抢在了正版书的前面而且盗版和正版几乎没有什么差别这种情况下,人们只能得出一个结论:出版部门出了,“,内奸,”,可是,当这样的现象一次次出现,甚至已经成了某种规律的时候,人们才恍然大悟:原来,是出版者自己在盗自己的版!,,,陈鲁豫亲手抓盗版书,《,心相约,》,盗版,《,还珠格格3,》,正规出版者对盗版惟一的反击方式是与有关部门配合打击盗版但是效果并不明显为对抗盗版,正规出版者便盗印自己的书,这同样免除了各种费用,赖掉作者的版税,在价格上可盗版书竞争选,1,还是选,2,,假设每一个学生都拥有一家企业,现在他必须决定自己应该,,选,1,,生产高质量商品来帮助维持较高价格,或者,,选,2,,生产假货来通过别人所失换取自己所得。
规则,:,,,根据选择,1,的学生总数,将收入分给每个学生每个选择,2,的学生总比选择,1,的学生多得,50,美分,(,这个设定当然有现实意义,生产假货成本要比高质量商品低,),;,,选择,2,的人越多,全班的总收益就会越少(这个假设也有道理:假货太多,就会使市场混乱,产品信誉降低)一位教授让商学院的,27,名学生进行一个博弈:,选,1,还是选,2,,假设全体,27,名学生一开始都打算选择,1,,那他们各得,1.08,美元假设有一人偷偷改变决定,选择,2,,那么,选择,1,的学生就有,26,名,各得,1.04,美元,但那个选,2,的学生就能得到,1.54,美元可见,不管最初选择,1,的学生总数是多少,选择,2,是一个优势策略每一个改选,2,的学生都会多得,46,美分,同时会使他的,26,个同学分别少得,4,美分,结果全班收入会少得,58,美分等到全体学生一致选择自私的策略,尽可能使自己的收益达到最大,他们将各得,50,美分反过来,假如他们联合起来,协同行动,不惜将个人的收益减至最小,他们将各得,1.08,美元你会怎么抉择?,,选,1,还是选,2,,演练这个博弈的时候,起初不允许集体讨论,后来允许一点讨论,以便达成,“,合谋,”,,结果愿意合作而选择,1,的学生总数从,3,到,14,不等。
在最后的一次带有协议的博弈里,选择,1,的学生总数是,4,,全体学生的总收益是,15.82,美元,比全体学生成功合作可以得到的收益少了,13.34,美元我这辈子再也不会相信任何人了领导合谋的学生这样嘟囔那么,他自己又是怎么选择的呢?,“,噢,我选了,2,三、如何走出“囚徒困境,”,,,——,合作是可能的吗?,游戏:三家航空公司的博弈,,游戏规则和程序,分三个组,,5,人一组,每个组将分别代表一家航空公司在市场经营市场经营的规则:,,(,1,)所有航空公司的利润率都维持在,9%,;,,(,2,)如果有三家以下的公司采取降价策略,降价的公司由于薄利多销,利润率可达,12%,,而没有采取降价策略的公司利润率 则为,6%,;,,(,3,)如果三家公司同时降价,则所有公司的利润都只有,6%,3.,每个小组派代表先通过协商初步达成协议初步协商之后,小组代表回到小组向组员汇报小组讨论,5,分钟后,需要作出最终的决策:降还是不降?将决定写在纸条交给老师老师公布结果游戏:三家航空公司的博弈,,相关讨论,,1.,作为小组代表,在和别组代表讨论时,你的出发点是什么?,,2.,回到自己的小组中,你们的决策是在什么基础上产生的?你们是否遵守了几个小组达成 的共识?,,3.,你们是否运用了博弈?,游戏:三家航空公司的博弈,,总结,,,1.,本游戏看似简单,但结果往往出人意料但又在意料之中,因为大部分公司都会选择降价 ,结果降价会导致两败俱伤。
这个游戏可以用囚徒困境来分析:尽管每家航空公司都不降价均可保持,9%,的利润率,但是受到降价后,12%,利润率的吸引,它们还是会选择降价在这种选择下,每家公司都降价导致的是行业利润率的集体下降,变成,6%,, 但这种结果是无法避免的,因为每家公司都在追逐高利润2.,这个游戏告诉我们两个道理:①不要假定竞争对手比你傻;②不要打价格战,因为价格战没有赢家不带剑的契约不过是一纸空文它毫无力量去保障一个人的安全——,现代英国君主立宪政体的理论奠基人,,霍布斯对合作协议的观点,合作比不合作要好,曾经有两个饥饿的人,他们从一位智者那里得到了一根鱼竿和一篓鲜鱼,得到那篓鲜鱼的人就在原地把鱼煮熟了一口气吃完,解决了饥饿问题,可是很快就又感到肚内空空,最终饿死在了空空的鱼篓旁而另一个得到鱼竿的人则提着鱼竿向遥远的大海走去,当他终于来到了大海边的时候,他也用尽了自己的最后一点力气同样是两个饥饿的人,他们也从智者那里得到了同样的一根鱼竿和一篓鲜鱼不同的是他们并没有分头行动,而是一起去寻找遥远的大海每到饥饿的时候,他们就会从鱼篓中拿出一条鱼来吃当他们终于来到了大海边的时候,这两个人就拿着那根鱼竿开始了靠捕鱼为生的日子。
囚徒困境一定是坏事吗,?,作为一个比喻,我们会为囚犯不能合作而遗憾;可是如果它发生在现实中,我们就巴不得他们不能合作如果罪犯与执法者通过合作逃脱了法律制裁,……,,,如果几个大企业联手或勾结起来形成对行业的垄断,……,.,,方便面协会串联企业哄抬物价,方便面涨价,百姓不能承受之重,促进双方合作可以从三个方面着手:,,(,1,)使得未来相对于现在更重要些;,,(,2,)改变对策者的四个可能的结果的收益值;,,(,3,)教给对策者那些促进合作的准则、事实和技能走出囚徒困境的三大途径,对未来的预期,是影响我们行为的重要因素一种是预期收益:我这样做,将来有什么好处;一种是预期风险:这样做可能面临的问题这些将影响个人的策略大学生同学之间应如何相处?是背叛还是合作?是互相帮忙还是互相欺压?,,文凭的价值是否影响大学生的学习热情?,,,,,,未来是否重要?,,地摊、车站、旅游点,这些人群流动性大的地方,不但商品和服务质量最差,而且假货横行,因为在商家和顾客之间,“,没有明天,”——,一个旅客不大可能因为你的饭菜可口而再次光临,一锤子买卖,不赚白不赚在公共汽车上,两个陌生人会为一个坐位争吵,可如果他们认识,就会相互谦让。
为什么?,,在相互社会联系紧密的人际关系中,人们普遍比较注意礼节、道德 未来是否重要?,,两个原始人见面,一个拿着兽皮,一个拿着野果,他们都想把对方的东西据为己有如果他们的见面是偶然的,结果会如何?可如果他们都知道对方生活在附近,结果又会如何?,,如果他们的见面是偶然的,可能相互抢劫;,,可是如果他们都生活在附近,考虑到对方家族的报复,抢劫的风险就大了所以他们不去打对方的主意,——,所有权就这样产生了如果他们确实想得到对方的东西,他们可以选择合作,——,以物易物,交易就这样产生了未来是否重要?,,从消极的层面看,我们互不侵犯,是为了避免没完没了、两败俱伤的循环报应道德、法律、权力利益的划分,都与,“,还要见面,”,有关相邻的人互相敌对,只会两败俱伤两个相邻的国家,如果相互敌对,是一件非常不幸的事它们不可能,“,搬家,”,,又不可能消灭对方,(,这是现代国际关系准则所不允许的,),,这个死结就可能缠绕它们许多年遗憾的是,这样关系的邻国还不少,如巴以、印巴、两伊以及伊拉克和科威特希腊和土耳其也曾经是这样的世仇,现在关系虽已缓和,但是它们之间的不信任感还是长久不能消除中苏交恶的年代,双方都在边境地区陈兵百万,巨大的军费开支和潜在的战争风险对两国都是重负。
现在两国关系改善,互信增加,边境军事力量大大减弱,可以说是一个双赢从这个意义上说,,“,面向未来,”,不仅仅是一句外交辞令未来是否重要?,,增大未来影响的另一方法是使接触更加频繁在下一步接触很快就会发生的情况下,这一次合作通常更为重要经常接触有助于促进稳定的合作在商业上,专业化公司趋向于限制在与少数几个公司接触以便使这种接触更加频繁在小城镇比在大城市容易出现合作便是因为人与人的接触更频繁接触更频繁也是婚姻比恋爱相对来说更稳定的原因之一婚礼就是一个用来庆祝和促进持续关系的公共行为,对婚姻的稳定有促进作用增大未来的影响,——,走出“囚徒困境”,,分解(,问题分解成若干的部分),是促进稳定的合作的一种有效方法因为分解会增加接触的频率增大未来的影响,——,走出“囚徒困境”,,将军备控制和裁军条约分解成许多阶段,这样就允许双方有更,,多让步的机遇而不只是一两个让步这样可以使回报更有效如果双方都知道对方的一步不合作的策略可以通过下一步的回,,报来补偿,那么双方对整个过程可以按所期望的进行就更有信,,心而且,如果双方对自己识别欺骗的能力缺乏信心,那么,,,有许多小的步骤比只有少数大的步骤更有助于促进合作。
在商业上,商人们喜欢一个大订单分别按每次发货时间付款,,,而不愿等到最后付总账使得当前步骤的背叛相对于整个未来,,的接触过程来说不是那么有诱惑力,这是促进合作的好方法增大未来的影响,——,走出“囚徒困境”,,决定合作与否其实取决于一次博弈还是多次博弈,.,在博弈理论中,博弈专家已经用数学证明出,在无限次重复博弈的情况下,合作可能是稳固的如果博弈无穷次,双方就会逐渐从互相背叛走向互相合作因为任何一次背叛都会招致对方在下一次博弈时的报复;而双方都取合作态度会带来合作收益但是在现实社会生活中又不完全这样,人总是要死的,因而人与人之间的博弈不是无限次的当一个人知道他终将退出博弈时,他就可能不再害怕此后别人对他的报复,从而可以在博弈结束前做损害他人的事情,这就回复到有限次重复博弈的境况改变对策者的四个可能的结果的收益值,决定合作与否其实取决于一次博弈还是多次博弈,.,就恋爱博弈来看,男女双方在交往的过程,随时都在博弈,因为相爱的过程中任何一个时点都是有可能分手的用博弈论的术语来说,这是一种囚徒困境的重复博弈无数爱情故事中的悲欢离合、精彩跌宕正是这个博弈模型的表现素不相识一对男女的一夜情是一次性囚徒困境博弈。
增大未来的影响,——,走出“囚徒困境”,,决定合作与否其实取决于一次博弈还是多次博弈,.,生活中多人博弈的现象比两人博弈更为普遍在多人博弈中,只有其它所有参与者在第,k,-,1,次博弈中都是合作的,某个参与者才会在第,k,次博弈中采取合作策略然而,这一策略会带来一个协调问题,任何人的一个小小失误都会导致采取背叛策略的其他参与者的数量如同滚雪球一样地愈演愈烈,最终导致所有人的背叛更糟糕的是,一旦出现这种情况,没有任何人会主动开始合作因此,我们可以这么说,多人重复囚徒困境(无论有限或无限)中稳定的合作几乎是不可能的思考:光天化日下抢劫事件为何越来越多?,,,,,少女在车站等车,,,,,,歹徒实施抢劫,,,,少女被压在地上,,,,歹徒抢夺财物,①,少女在车站等车,②,歹徒实施抢劫,③,少女被压在地上,④,歹徒抢夺财物,OPEC,组织成员国之间的合作与背叛,无论在自然界还是在人类社会,“合作”都是一种随处可见的现象,然而多方合作却是难得一见多方博弈之所以能够合作,是因为囚徒困境如果是一次性博弈,(One shot game),的话,基于个人利益最大化,得到纳什均衡解(即不合作),但如果是多次博弈,就有了合作的可能性,囚徒困境就有可能破解。
连续的合作有可能成为重复的囚徒困境的均衡解,这也是博弈论上著名的“大众定理”,(Folk Theorem),的含义OPEC,组织成员国之间的合作与背叛,石油输出国组织(,OPEC,)(其目的是限制各石油生产国的产量,以保持石油价格,获取利润)经常会有成员国不遵守协定,私自增加石油产量每个成员国都这样想:只要他们不增加产量,我增加一点点产量对价格没什么影响结果每个国家都增加产量,造成石油价格下跌,大家的利润都受到损失当然,一些产量增加较少的国家损失更多,于是也更加大量生产,造成价格进一步下降,--,结果,陷入一个困境:大家都增加产量,价格下跌,大家再增加产量,价格再下跌,……,OPEC,后来为什么合作成功了?,,OPEC,组织成员国之间的合作与背叛,但合作的可能性并不等于必然性博弈论的研究表明,要想使合作成为多次博弈的均衡解,博弈的一方(最好是实力更强的一方)必须主动通过“可信的承诺”,(Credible commitment),,向另一方明确表达合作的诚意如果该困境同时涉及多个对手,则要在博弈对手中形成声誉,并用心地维护这个声誉这里“可信的承诺” 并不是什么空口诺言,而是实实在在的付出。
所以合作是非常困难的供应商合作还是背叛?,,某城市政府采购办公用品,每年招标,只挑选两个供应商政府每个月采购一次,两个供应商每个月就当月采购商品报价实行“价低者得”原则,如两供应商报价相同,则订单分为均等的两半,两供应商各得,50%,如报价不同,则全部订单给价低者这两个供应商应如何报价?,供应商合作还是背叛?,,两供应商相互合作,共同报一相同高价,获取最大利润,自是双方的最优策略两供应商共同合作了,11,个月,但在第,12,个月,两供应商知道这是今年最后一次,对方很有可能背叛与其对方背叛,不如自己背叛两供应商知道第,12,次对方会背叛,那么第,11,次不如我就背叛,因为第,11,次采用合作的态度并不会促使对方在第,12,次时合作同理,第,10,次、第,9,次,……,第,1,次,每一次都应该背叛因此双方不可能合作共同报高价,而是相互竞争地报低价OPEC,组织成员国之间的合作与背叛,理论上,几乎所有的卡特尔(类似于“同盟”)都会遭到失败,原因就在于卡特尔的协定不是一个纳什均衡,没有成员有兴趣遵守理论上,如果是无限期的合作,双方考虑长远利益,他们的合作是会成功的但只要是有限次的合作,合作就不会成功。
比如合作,10,次,那么在第,9,次博弈参与人就会采取不合作态度,因为大家都想趁最后一次机会捞一把,反正以后我也不会跟你合作了但是大家料到第九次会出现不合作,那么就很可能在第八次就采取不合作的态度第八次不合作会使大家在第七次就不合作,……,一直到,从第一次开始大家都不会采取合作态度运用向前展望,倒后推理的原则,合作就无从开始深谙策略思维者懂得瞻前顾后,避免失足于最后一步假如他预计自己会在最后一轮遭到欺骗,他就会提前一轮中止这一关系这样一来,倒数第二轮就变成了最后一轮促进双方合作可以从三个方面着手:,,(,1,)使得未来相对于现在更重要些;,,(,2,)改变对策者的四个可能的结果的收益值;,,(,3,)教给对策者那些促进合作的准则、事实和技能走出囚徒困境的三大途径,改变对策者的四个可能的结果的收益值,思考:,,如何促使“囚徒困境”中的两个囚徒合作而非背叛?,如何走出“囚徒困境”,烟草商为何不反对禁止烟草广告,,?,1971,年,在,“,禁烟运动,”,的声势下,美国国会通过了禁止在电视上做烟草广告的法律令许多人奇怪的是,这一回财大气粗的烟草公司反应相当平静,并没有动用其庞大的社会资源和影响力阻止这个法律的通过。
后来的统计资料表明:尽管烟草广告因受到限制而减少,可是烟草公司的利润却提高了因为禁令使他们从,“,囚徒困境,”,中解放出来烟草行业竞争激烈,为争夺市场,各大烟草公司每年都要花费巨额广告费用,这无疑降低了它们的利润水平也就是说,如果烟草公司都不做广告,它们的利润更高烟草公司本身能否达成都不做广告的协议呢?不能,因为谁遵守协议,就很可能被对手耍弄烟草公司做不到的,国家为它做了:法律起到了协议的作用,而政府承担了监督的成本烟草商为何不反对禁止烟草广告,,?,如何走出“囚徒困境”,威胁、承诺、作弊与惩罚,对于有限次重复博弈合作问题的解决主要有,2,个典型方法,——,(,1,)国家法律,(,2,)社会道德案例,,,A,公司与,B,公司是合作伙伴,,A,公司经常向,B,公司购买原材料,由于两家公司在不同的城市,于是两个公司谈判后签定合同:合同签订一周之后的那一天,在公司,A,将现金打入公司,B,的银行帐户,公司,B,则发货到公司,A,,若违约则处于,2-5,倍罚款实际上,如果公司,A,与公司,B,都是理性人,那么他们的合作就是一个有限次数重复博弈,在社会不存在法律的情况下,在两个公司任何一次交易中都有可能有某一家公司不遵守合同,逃款或逃货,即使公司,A,现金充裕,而公司,B,货源充足。
然而,在我们理想的法律环境下,公司,A,和,B,最佳策略都是合作威胁、承诺、作弊与惩罚,假设公司,A,与公司,B,每年的交易都有十几次,平均每笔生意为,100,万,若,违约则罚款,200,万,公司,A,与公司,B,合作时,双方收益均为,20,万(指公司,A,与公司,B,的利润);公司,A,付款,而公司,B,不发货,,A,损失,100,万,,B,收益,100,万;公司,A,不付款,公司,B,发货,公司,A,收益,120,万(其中包含,20,万的利润),公司,B,损失,80,万(指公司,B,货物的成本,也就是收入减去利润);公司,A,不付款,公司,B,不发货,双方收益为零0,,,,0,,-100,,,,,100,,,120,,,,-80,,,20,,,,20,,,合作,合作,不合作,不合作,公司,B,公司,A,威胁、承诺、作弊与惩罚,很显然这是一个有限次重复博弈的囚徒困境,这个博弈则是非对称博弈,这更加贴切于日常生活的真相在没有法律背景的条件下,双方选择不合作是,自然的纳什均衡点,然而引入强制性的法律则不同,这时他们所签合同具有法律效应,一旦有一方违约,另一方有权罚款其200万元,并且法院可以强制实行。
在这种情况下,两个“囚徒”,也就是公司自然都会采取合作策略,完成合同对各方所要求的行动简单说来,就是,法律,改变了两个公司博弈的均衡结果威胁、承诺、作弊与惩罚,霍布斯认为,国家以法律形式规定对某种行为如“违约”采取惩罚措施,如果惩罚措施不力,即使扣除惩罚的成本,行动者从“违约”策略中获取的好处大于他采取“守信”策略所带来的好处,那么国家的法律措施是无效率的或者说是低效率的因此国家法律的制定应以抑制对他人的危害行动为原则这就是法律制定的第一条原则:效率原则效率原则是从对社会的整体考虑分析得出的,从这个意义上讲,法律越严格越好,越严格越有效率威胁、承诺、作弊与惩罚,强制性有效率的法律之重要性还可从冷战时期美苏两个超级大国,40,多年的军备竞赛中得出反证尽管他们双方签定一些制止军备竞赛的协议,但是由于缺乏一个世界性的公平合理又具有强制性的法律环境,其结果仍然是陷入无法解脱的囚徒困境法律制定的第二条原则是,法律对犯法者的惩罚应以与犯法者给社会或他人造成的危害相等为原则,这就是公平原则用简单的一句话说,法律惩罚太重对犯法者不公平,惩罚太轻则对社会或他人不公平威胁、承诺、作弊与惩罚,大唐电信虚增利润再暴诚信劣迹,,证监会处罚太轻凸显制度缺陷,,,案例,:,ST,大唐于,2007,年,8,月,20,日收到证监会下达的,《,行政处罚事先告知书,》,,指称,ST,大唐存在,“,所披露的信息有虚假记载,”,和,“,重大遗漏,”,的行为,,2004,年虚增利润总额共计,3719,万元。
证监会由此拟决定对,ST,大唐处以,30,万元罚款威胁、承诺、作弊与惩罚,,过去几年,大唐电信已多次遭到主管部门的公开谴责和警告,不诚信行为早被记录在案因此,这次被罚,可谓大快人心 不过,这一处罚过轻,虚增利润,3719,万元,被罚却只有区区,30,万元,这不仅无法震慑,ST,大唐,对其他上市公司也难起到以儆效尤的作用ST,大唐近年来一直负面新闻不断2007,年,5,月,,ST,大唐出尔反尔的,“,阴阳公告,”,:,在,2006,年前,3,季度盈利,2761,万元的情况下,,ST,大唐竟然全年巨亏,7.19,亿元,并且被戴上,ST,帽子巨大的反差,让人瞠目威胁、承诺、作弊与惩罚,ST,大唐为何频频出尔反尔?作为上市公司的诚信在哪里,?,,ST,大唐,7,月,3,日公布的,《,大唐电信科技股份有限公司治理自查报告和整改计划,》,披露,在过去,4,年里,公司曾经,3,次因信息披露不规范而被上海证券交易所批评、谴责和惩戒此外,,2003,年,8,月,27,日,大唐电信被上海证券交易所内部批评,因为其,“,在关联交易及决策方面存在问题,”,2006,年,6,月,24,日,又被内部通报,“,从,2001,年,12,月到,2003,年,4,月,年报披露方面存在违规行为,”,。
其间,还有,4,次接收到监管部门的调查通知书,有,“,资金占用与担保,”,以及,“,虚假信息披露,”,等多个不同原因2003,年、,2004,年还两次被证监会要求对年报责令整改威胁、承诺、作弊与惩罚,荒诞的是,,ST,大唐却一直以诚信自诩,其官方网站赫然挂着获奖记录:,2005,年,1,月,21,日,北京市工商局对,2004,年度,3000,多家符合标准的守信企业进行了公示,大唐电信获北京市守信企业称号此外,,ST,大唐官方网站还标榜,公司向客户提供的不仅仅是先进的技术和优质产品,更是注重信誉、服务至上的精神威胁、承诺、作弊与惩罚,各界朋友:,,在中国信息产业的发展史上,有,“,大唐人,”,这样一个团队,以,“,忠诚、敬业、求实、立信,”,为职业道德,从零开始、持续创新、不断奋进,交出了辉煌的答卷……,,,真才基,,大唐电信科技产业集团董事长,董事长致辞,威胁、承诺、作弊与惩罚,,安然公司是一家美国大型能源公司,其排名曾居,美国上市公司第七位,2001,年,12,月,该公司申请破产保护,成为当时美国历史上最大的破产案当年,安然已连续5年被评为美国最具创新精神公司然而,这个拥有上千亿美元资产的公司却在几周内破产。
破产原因是被发现,该公司长期通过复杂的财务合伙形式,掩盖巨额债务并虚报盈余,为安然其做假账的安达信会计师事务所(,世界五大会计师事务所之一,)也随之破产安然事件”及“安达信事务所倒闭”,安然公司办公大厦图,威胁、承诺、作弊与惩罚,美国安然公司案主角可能面临数十年监禁,美国安然公司前首席执行官斯基林,(,左,),已自杀的安然公司前副董事长克利夫,·,巴克斯特,,2006,年,10,月,23,日,美国休斯敦联邦地区法院作出判决,安然公司前首席执行官因犯有欺诈、共谋、内部交易等一系列罪行被判处24年又4个月徒刑在重复型的囚徒困境中,并不是签订合作协议很困难,困难的是这个协议对博弈各方是否具有很强的约束力一个合作契约建立的困难在于任何协议签订之后,博弈参与者都有作弊的动机,因为至少在作弊的这一局博弈中,作弊者可以得到更大的收益常言道:,“,婚姻是走向爱情的坟墓,”,,但从博弈论的角度来看,婚姻恰恰是男女双方签订的一种协议,具有一定约束力的协议,因为一旦对方背叛婚姻,就会受到家庭的压力与社会舆论的谴责威胁、承诺、作弊与惩罚,威胁、承诺、作弊与惩罚,霍布斯,对合作协议的观点是:,,“不带剑的契约不过是一纸空文。
它毫无力量去保障一个人的安全威胁、承诺、作弊与惩罚,决定合作协议是否能够被囚徒双方执行的最关键的基本要素有两个,即承诺与威胁在社会生活中,承诺与威胁是非常常见的现象比如女生告诉她男朋友,如果他敢结交其他的女生,只要被发现一次,就立刻分手,这是威胁;而她男朋友向她发誓绝对自己是个专一的情圣,决不会背叛爱情,这就是承诺合作的关键是承诺与威胁的可信度有多大因为承诺与威胁都是在博弈者进行策略选择之前作出的,如果承诺与威胁对博弈者的约束力越小,那么合作的可能性就越小威胁、承诺、作弊与惩罚,我国不应反腐败,“,我国腐败适度存在,能使改革进一步推进,”,我国反腐败所花的成本大于腐败损失的金额,”,——,中山大学某名教授,威胁、承诺、作弊与惩罚,猴群博弈,与道德的产生,有一群猴子被关在笼子里,笼子上方有一条绳子拴着一个香蕉,绳子连着一个机关,机关又与一个水源相连猴子们发现了香蕉,有猴子跳上去够这个香蕉,当猴子够到时,与香蕉相连的绳子带动了机关,于是一盆水倒了下来,尽管够到香蕉的猴子吃到了香蕉,但其他猴子被淋湿了这个过程重复着,猴子们发现,尽管有猴子吃到香蕉,但吃到香蕉的猴子是少数,而其余的大多数猴子都被淋湿。
经过一段时间,有一伙猴子自觉地行动起来,当有猴子去抓香蕉时,它们便揍那个猴子每当有猴子去取香蕉,就有其他的猴子因愤怒而自动地去撕咬那个猴子,久而久之,猴子们产生了合作,再也没有猴子敢去取香蕉了威胁、承诺、作弊与惩罚,猴群博弈,与道德的产生,在这个故事里,猴子间产生了,“,道德,”,如果这群猴子构成一个社会,它们也繁衍下一代,它们会将它们的经历告诉下一代,渐渐地猴子们便认为取香蕉的后果对其他猴子不利,从而认为去取这个香蕉是,“,不道德的,”,,它们也会自动地惩罚,“,不道德的,”,猴子当然这只是一个故事,但这个博弈故事却反映了人类的道德的产生过程威胁、承诺、作弊与惩罚,猴群博弈,与道德的产生,与国家一样,道德也是对某些不合作行动的惩罚机制这种机制的出现使得人类从囚徒困境中走出来道德感自然地使得人们对不道德的或不正义的行为谴责或者对不道德的人不采取合作,从而使得不道德的人遭受损失这样,社会上不道德的行为就会受到抑制因此只要社会形成了道德或不道德,或者正义或非正义的观念,就自动地产生了调节作用道德可以打破囚徒困境,,威胁、承诺、作弊与惩罚,道德约束的局限性,儿歌:,“,我在马路边捡到一分钱,把它交给警察叔叔手里边,叔叔拿着钱,对我把头点,我高兴的说了声,‘,叔叔再见,’,。
威胁、承诺、作弊与惩罚,道德约束的局限性,拾金不昧是美德,当捡到,100,块钱时还给失主不仅有道德满足感,还会受到社会的表扬,建立起自己的美誉;若不及时交还失主并被发现的话,则会受到严厉的谴责并失去社会信誉假想一下,当捡到价值上百万的古玩名画时,极大的可能是据为己有这是因为他道德的满足感与可能所受谴责的效用远小于其所捡物品给他带来的效用这种情况下,道德作用失效了,法治就不可替换地代替了道德道德约束有其自身的局限性它对不道德的行为的抑制是有限度的,当不道德的行为带来的利益大于道德的满足时,道德约束的作用便失效威胁、承诺、作弊与惩罚,如何破解迟到困局,王老师组织全班同学集体活动(比如郊游)时,遇到一个棘手问题王老师通知全班同学早上,8:00,到校门口集合,结果有几个同学拖拖拉拉,导致大家,8:15,才出发此后,王老师改变策略,虽然真实的集合时间仍是,8:00,,但他通知大家,7:45,集合,结果最晚的几个同学也在,8:00,赶到,从而准时出发王老师对自己的策略很满意威胁、承诺、作弊与惩罚,如何破解迟到困局,然而好景不长时间久了,同学们都发现了王老师的策略,并可根据王老师的通知猜测真实的集合时间。
因此,每当王老师通知,7:45,集合时,大家仍然按,8:00,来做安排从而导致几个同学在,8:00,之后才赶来而哪些准时即,7:45,到达的同学都开始抱怨,也慢慢变得不那么守时了那么王老师应制定怎样的策略,才能使活动准时开始,并使大家都满意呢?,威胁、承诺、作弊与惩罚,如何破解迟到困局,这是一个老师与学生、学生与学生之间的博弈,即多人的囚徒困境每个学生都知道,其他学生的优势策略是即不能太早到达以免浪费等待时间,又不能太晚,以免承担耽误大家时间的责任威胁、承诺、作弊与惩罚,如何破解迟到困局,要破解这个困境,王老师有两个策略选择:,,一、只要过了集合时间,就不再等下去,让迟到的同学独自承担责任这种责任和相应的惩罚对同学会造成很大的损失,他们就不会再迟到了二、如果迟到的学生比较多,那么等某个数量的学生到齐后马上出发,而让迟到时间过长的那些同学承担责任威胁、承诺、作弊与惩罚,如何破解迟到困局,一次性博弈会引发不合作的行为即使在重复博弈中,合作的一方在遭到对方背叛之后,往往没有机会也没有还手之力去进行报复在这种情况下,要使交易能进行,并防止不合作行为,必须设置严格的惩罚机制一般说来,博弈对方合作时得益最大,但若一方不遵守合作约定,必定是另一方合作者吃亏。
所以需要引入处罚机制:谁违约,就处罚谁,使他不敢违约促进双方合作可以从三个方面着手:,,(,1,)使得未来相对于现在更重要些;,,(,2,)改变对策者的四个可能的结果的收益值;,,(,3,)教给对策者那些促进合作的准则、事实和技能走出囚徒困境的三大途径,走出囚徒困境的三大途径,一艘军舰在夜航中,舰长发现前方航线上出现了灯光舰长马上呼叫:,“,对面船只,右转,30,度对方回答:,“,请对面船只左转,30,度我是美国海军上校,右转,30,度我是加拿大海军二等兵,请左转,30,度舰长生气了:,“,听着,我是,‘,列克星顿,’,号战列舰舰长,这是美国海军最强大的武装力量,右转,30,度!,”,,,,“,我是灯塔管理员,请左转,30,度四、如何利用,“,囚徒困境,”,触发策略,如果没有外部强制力,这时囚徒困境中两个参与者采取什么样的策略才可以更好的维持合作的稳定性呢?,,如果一方采取不合作的策略另一方随即也采取不合作策略并且永远采取不合作策略,在博弈论里面称之为,触发策略,(,Trigger strategy,),或称冷酷策略如果对方知道你的策略是触发策略,那么对方将不敢采取不合作策略,因为一旦他采取了不合作策略,双方便永远进入不合作的困境。
因此,只要有人采取触发策略,那么双方均愿意采取合作策略触发策略,针锋相对(,tit-for-tat,)策略:以牙还牙,《,圣经,·,旧约,》,:以眼还眼以牙还牙,,我们对待自己的恋人,/,爱人是否可以用“以牙还牙”的策略?,触发策略,好的策略必须具有的一个特点是,“,清晰性,”,,能让对方在三、五步对局内辨识出来,太复杂的对策不见得好针锋相对策略就有很好的清晰性,让对方很快发现规律,从而不得不采取合作的态度针锋相对策略的优越性向我们充分展示了一个纯粹自利的人何以会选择善,只因为合作是自我利益最大化的一种必要手段触发策略,在爱情中的博弈原则应该是:,,善意而不是恶意地对待恋人;宽容而不是尖刻地对待恋人,关键是能够彼此宽容,既宽容对方的缺点;强硬而不是软弱地对待恋人,就是要在我永远爱你的善意的前提下,做到有爱必报,有恨也必报,以眼还眼,以牙还牙,以其人之道,还治其人之身比如对恋人与其他异性的亲热行为,要有极其强烈的敏感与斩钉截铁地回报;简单明了而不是山环水绕地对待恋人在博弈中过分复杂的策略使得对手难于理解,无所适从,因而难以建立稳定的合作关系,明晰的个性、简练的作风和坦诚的态度倒是制胜的要诀。
触发策略,人家打你一巴掌,你还把另一边脸转过去,等于鼓励对方再占你便宜无条件的合作不仅伤害你自己,而且伤害了这个成功的剥削者接着要遇到的无辜者无条件合作将会宠坏对方,并为社会留下了改造被宠坏者的负担对敌人的仁慈就是对自己的残忍如何利用“囚徒困境”,利用囚徒困境模型,通过巧妙的布局设计,人为创造出一种囚徒困境,迫使对方做出对自己有利的行动《,战国策,》,伍子胥的故事,,楚平王怀疑太子“外交诸侯,将为人乱”,遂迁怒于伍子胥的父亲太子太傅伍奢,将其杀害伍子胥只身逃往吴国在逃亡中,伍子胥在边境被守关的斥侯抓信了斥侯对他说:“你是逃犯,我必须将你抓去面见楚王!”,,伍子胥说:“你知道楚王为什么抓我吗?是国为有人跟楚王说,我有一颗宝珠楚王一心想得到我的宝珠,可我的宝珠已经丢失了楚王不信,以为我欺骗他我没有办法,只好逃跑现在你抓我去见楚王,那我将告诉楚王是你夺去了我的宝珠,并吞到肚子里去了楚王为了得到宝珠就一定会先把你杀掉,并剖开你的肚子,把你的肠子一寸一寸地剪断来寻找宝珠这样我活不成,而你会死得更惨斥侯信以为真,非常恐惧,赶紧把伍子胥放了伍子胥被抓后,处于一种绝对的劣势地位于是伍子胥采取威协策略,抢先宣布自己将无条件地进行报复。
伍子胥故意利用信息不对称,把斥侯置于类似囚徒困境的局面死,,,死,),,(,-10,,,-10,),(,死,,,升官,),,(,-10,,,10,),斥侯,伍子胥,不,诬陷,押送,释放,诬陷,(,活,,,0,收益,),,(,10,,,0,),如何利用“囚徒困境”,伍子胥将,“,囚徒困境,”,中的同时出招抢先改变为相继出招,并告知斥侯自己的招数(如被押送,则将会诬陷)对于伍子胥而言,在斥侯采用,“,押送,”,的策略下,无论是否采用,“,诬陷,”,策略,结局均是,“,处死,”,斥侯也十分清楚这一结局,因此伍子胥的威胁是可信的面对可能出现的潜在危机,人们总是抱着,“,宁可信其有,不可信其无,”,的态度,这是一种预期的支付,以保证自己免于陷入困境这种预期支付心理,恰恰给了处于显性困境以机会创造一种困境,使对主陷入与你一样无法全身而退的困境如何利用“囚徒困境”,如燕昭王薨,惠王自为太子时,不快于乐毅田单乃纵反间曰:“乐毅与燕王有隙,畏诛,欲连兵王齐,齐人未附故且缓攻即墨,以待其事齐人唯恐他将来,即墨残矣惠王闻之,即使骑劫代将,毅遂奔赵田单守即墨,想除掉燕将乐毅,用的是挑拨离间的手段,散布乐毅没攻下即墨,是想在齐地称王,现在齐人还未服从他,所以他暂缓攻打即墨。
齐国怕的是燕国调换乐毅燕王果然中计,以骑劫代替乐毅,乐毅只好逃到赵国去了齐人大喜,田单以火牛阵大破燕军离间计,,三国时期,赤壁大战前夕,曹操号称的八十三万大军善马战而不善于水战正好有两个精通水战的降将蔡瑁、张允可以为春训练水军曹操把这两个人当作宝贝,优待有加一次东吴主帅周瑜见对岸曹军在水中排阵,井井有条,十分在行,心中大惊他想一定要除掉这两个心腹大患 曹操一贯爱才,他知道周瑜年轻有为,是个军事奇才,很想拉拢他曹营谋士蒋干自称与周瑜曾是同窗好友,愿意过江劝降曹操当即让蒋干过江说服周瑜反间计,采用反间计的关键是“以假乱真”,造假要造得巧妙,造得逼真,才能使敌人上当受骗,信以为真,作出错误的判断,采取错误的行动周瑜见蒋干过江,一个反间计已经酝酿成熟他热情款待蒋千,酒席筵上,周瑜让众将作陪,炫耀武力,并规定只叙友情,不谈军事,堵住了蒋干的嘴巴周瑜佯装大醉,约蒋干周床共眠蒋干见周瑜不让他提及劝降之事,心中不安,哪里能够入睡他偷偷下床,见周瑜案上有一封信他偷看了信,原来是蔡瑁、张允写来,约定与周瑜里应外合,击败曹操这时,周瑜说着梦话,翻了翻身子,吓得蒋干连忙上床过了一会儿,忽然有人要见周瑜,周瑜起身和来人谈话,还装作故意看看蒋干是否睡熟。
蒋干装作沉睡的样子,只听周瑜他们小声谈话,听不清楚,只听见提到蔡瑁、张允二人于是蒋干对蔡瑁、张允二人和周瑜里应外合的计划确认无疑他连夜赶回曹营,让曹操看了周瑜伪造的信件,曹操顿时火起,杀了蔡瑁、张允等曹操冷静下来,才知中了周瑜反间之计反间计,如何利用“囚徒困境”,利用囚徒困境模型,设计改变博弈参与者的格局,造成一种压力,促使他们合作最常用也最为有效的一种策略,就是有意制造信息的不对称两位学生在杜克大学修化学课两人在小考、实验和期中考试中都表现甚优,都是,A,在期末考试前的周末,他们非常自信,于是去参加弗吉尼亚大学的一场聚会聚会太尽兴,睡过了头,结果没赶上周一上午的化学期末考他们向教授撒了个谎,说他们本已从弗吉尼亚大学往回赶,但途中轮胎爆了由于没有备用胎,他们只好整夜呆在路边等待救援现在请求教授允许他们隔天被考教授想了想,同意了两人好好准备一番,胸有成竹地来参加补考教授安排他们分别在两间教室作答第一页只有一条题目,占,10,分,非常简单两人都写出了正确答案,心情舒畅地翻到第二页第二页只有一个问题,占了,90,分题目是:,“,请问破的是哪只轮胎?,”,,结果不言而喻,两个学生只好乖乖地向教授认错。
如何利用“囚徒困境”,,《,明史,》,的故事,,崇祯元年,朱由检初登帝位,发出,“,官员不爱钱,”,的号召户科给事中韩一良对这种号召不以为然,上疏奏曰:,“,如今何处不花钱?哪个官员不爱钱?本来就是用钱买来的官位,不爱钱如何赚回来?,……,我这两个月辞却了别人送我的出书费五百两银子,我交往少尚且如此,其余的可以推想了伏请陛下严加惩处贪官崇祯召见群臣,让韩一良当众念其奏疏读罢,崇祯升韩一良为佥都御史这时,史部尚书王永光请求皇帝,让韩一良点出具体人名,哪些是贪官,是谁送他银子韩一良吞吞吐吐,不愿告发崇祯准其密奏,可是等了五天,韩一良谁也没告发崇祯再次召见群臣,当面追问韩一良然而韩一良就是不肯点名,最后推说风闻有人要送崇祯大怒,撤其官职用道德来保持均衡,,《,明史,》,的故事,,韩一良宁可皇帝撤其官职,断送前程,甚至顶着被治罪的风险,硬是不肯告发行贿他的人是什么力量让他这样做?,,是怕得罪人?作为给事中,检举起诉和得罪人乃其分内事其实,是一种外在规则的压力,或者说外在规则在其内心形成的,“,道德,”,在起作用,使其坚决不肯背叛行贿他的人用道德来保持均衡,,《,笑林广记,》,的故事,,,有人去剃头,剃头匠给他剃得很草率。
剃完后,这人却付给剃头匠双倍的钱,什么也没说就走了一个月后,这人又来剃头剃头匠觉得此人阔绰,便竭力上心,周到细致,多用了一倍的工夫剃完后,这人反而少给了许多钱剃头匠不愿意,说:,“,上次我为你剃头,剃得很草率,你尚且给了我很多钱;今天我格外用心,为何反而少付钱呢?,”,这人答道:,“,今天的剃头钱,上次我已付给你了;今天给你的钱,正是上次的剃头费说罢大笑而去假装不知道有尽头,,。