电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

博弈论与信息经济学初步剖析.

240页
  • 卖家[上传人]:今***
  • 文档编号:107178751
  • 上传时间:2019-10-18
  • 文档格式:PPT
  • 文档大小:3.92MB
  • / 240 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、导言 博弈论概述,引言,博弈的思想古已有之 博弈理论是当代经济学不可或缺的重要组成部分 博弈思想及理论已被广泛应用于对各类经济和社会现象的分析中 博弈理论丰富了人们认识世界的角度和工具,第一节:博弈的定义和实例,博弈论(Game Theory)又名对策论 博弈理论原本是运筹学的一个重要分支。 目前博弈论已发展为一门备受关注的独立学科。 博弈的定义 “博弈”指当两个或多个决策主体之间存在相互作用,任何一方的决策策略(Strategy)都不能完全独立于其他各方策略时,各方的决策过程及均衡问题。,博弈实例1:锤头、剪刀、布,博弈参与者:两名同学 博弈过程: 两人在“锤子、剪刀、布”三种策略中选择一种。 如果两人的策略一样,则平局。 出“锤子”一方胜过出“剪刀”一方。 出“剪刀”一方胜过出“布”一方 出“布”一方胜过出“锤子”一方 博弈双方策略相互依赖,不独立。,博弈实例2:聚会,博弈参与者:两个人 博弈过程: 两人在校门口集合,一起逛博物馆 博弈策略和结果 两人都去南门,成功碰面 两人都去北门,成功碰面 同学甲去南门,同学乙去北门,两人错过 同学甲去北门,同学乙去南门,两人错过 博弈双方策略

      2、相互依赖,不独立。,其他博弈实例,棋类比赛:象棋、围棋等。古人“对弈”。 寡头市场: 产量博弈模式 价格博弈模式 领先者、跟随者博弈模式 大国之间关于汇率政策的博弈 经典博弈实例:囚徒困境(Prisoners Dilemma),囚徒困境,警方逮捕了甲、乙两名犯罪嫌疑人 警方分开审讯两人 根据“坦白从宽、抗拒从严”的原则: 如甲、乙均坦白,则两人将分别被判处 5 年有期徒刑 如甲坦白、乙不坦白,则甲被判 1 年、乙被判 10 年徒刑 如甲不坦白、乙坦白,则甲被判 10 年、乙被判 1 年徒刑 如甲、乙均不坦白,则两人将分别被判处 2 年有期徒刑,甲、乙二人独立决策 对甲而言,不管乙选择坦白还是不坦白,甲的最优策略都是坦白。 对乙而言,不管甲选择坦白还是不坦白,乙的最优策略都是坦白。 结果:甲、乙均选择坦白,分别被判处 5 年有期徒刑 甲、乙如均不坦白,则分别被判处 2 年有期徒刑 个体理性与集体理性的冲突 囚徒困境,中国古人思想中的“博弈”智慧,战国策:田忌赛马 马分为上、中、下三等 我方上等马 vs. 对方中等马 我方中等马 vs. 对方下等马 我方下等马 vs. 对方上等马 三局两胜

      3、,田忌胜出 正确运用战略,也是取胜的重要因素之一,第二节:博弈的构成要素,完整的博弈通常包含四个构成要素 博弈参与者(Player) 博弈策略(Strategy) 博弈的收益(Payoff) 博弈的均衡(Equilibrium),一、博弈参与者(Player) 博弈参与者指参与博弈的主体 在“锤头、剪刀、布”博弈中,博弈参与者是玩游戏的两个人 两名同学去相约去博物馆博弈中,博弈参与者是两名同学 在“囚徒困境”博弈中,博弈参与者是两名犯罪嫌疑人 博弈参与者可能是单个的个人,也可能是组织或集体 企业、社会团体、国家 博弈参与者可能多于两方,三方或多方博弈参与者,二、博弈策略(Strategy) 博弈策略指博弈参与者可以采取的行动 在“锤头、剪刀、布”博弈中,博弈参与者所能采取的博弈策略均为“锤头”、“剪刀”或“布” 两名同学去相约去博物馆博弈中,博弈参与者所能采取的博弈策略均为“去学校南门集合”或“去学校北门集合” 在“囚徒困境”博弈中,博弈参与者所能采取的博弈策略均为“坦白”或“不坦白”,三、博弈的收益(Payoff) 博弈收益指不同博弈策略给博弈参与者带来的利益 在“锤头、剪刀、布”博

      4、弈中,博弈参与者得到的收益是:赢、平局、输三种可能的结果。 两名同学去相约去博物馆博弈中,博弈参与者得到的收益是:能够相遇、不能够相遇两种可能的结果。 在“囚徒困境”博弈中,博弈参与者得到的收益是 如果甲、乙都坦白,则甲、乙均得到 5 年徒刑 如果甲、乙都不坦白,则甲、乙均得到 2 年徒刑 如果甲坦白、乙不坦白,则甲得到 1 年、乙得到 10 年有期徒刑 如果甲不坦白、乙坦白,则甲得到 10 年、乙得到 1年有期徒刑,四、博弈的均衡(Equilibrium) 博弈的均衡指所有参与者最优策略的组合 两名同学去相约去博物馆博弈中,博弈均衡有两个 两个同学都去学校南门 两个同学都去学校北门 在“囚徒困境”博弈中,博弈均衡有一个 嫌疑人甲和嫌疑人乙都坦白,博弈的思想古已有之 孙子兵法、三国演义等中国古典名著都蕴含着丰富的博弈智慧 当代博弈理论的研究源于西方 一、博弈理论的发展历史 20 世纪初,塞梅鲁(Zermelo)、鲍罗(Borel)和冯 诺依曼(Von Neumann)开始研究博弈的数学表达方式,第三节:博弈论的发展历史和分类,一、博弈理论的发展历史(续) 1944 年,冯 诺依曼( V

      5、on Neumann)和经济学家奥斯卡 摩根斯坦(Oskar Morgenstern)合作发表了博弈理论与经济行为一书,使博弈的理论和思想进入经济学领域。 1950、1951 年,约翰 纳什(John Nash)利用不动点定理证明了博弈均衡的存在性,为博弈论奠定了坚实的理论基础。 20 世纪 70 年代,约翰 海萨尼(John Harsanyi)和莱因哈德 泽尔腾(Reinhard Selten)等将不完全信息理论融入到博弈论的研究中。 20 世纪 90 年代之后,博弈论作为一种方法被普遍运用到经济学、政治学、生物学、军事学、统计学等领域中。 博弈理论已成为当代经济学理论不可分割的重要组成部分。,根据博弈参与者能否达成相互合作的和约束性协议 合作博弈(Cooperative Games) 非合作博弈(Non-Cooperative Games) 完全信息静态博弈(Static Game with Complete Information) 完全信息动态博弈( Dynamic Game with Complete Information) 不完全信息静态博弈(Static Game wi

      6、th Incomplete Information) 不完全信息动态博弈( Dynamic Game with Incomplete Information),二、博弈的分类,约翰 纳什(John Nash)1928 年 6 月出生于美国一个中产阶级家庭 纳什自幼便显露出过人的数学天赋 1948 年,纳什在普林斯顿大学攻读博士学位 1950 年至 1953 年,纳什撰写了多篇在博弈论研究领域颇具开创性和奠基性的论文。 纳什的论文对合作博弈和非合作博弈进行了明确定义和区分,博弈论大师约翰 纳什简介,纳什对非合作博弈均衡进行了独到精辟的阐述 对合作博弈的博弈过程及策略选择进行了系统的归纳和证明 纳什的思想对日后博弈理论的发展影响深远 以纳什的名字命名的“纳什均衡” 尽管不得不时常与医院、药物和孤独为伴,但纳什仍然一如既往的进行着他所痴迷的研究工作。 1994 年,因为在博弈理论方面的突出贡献,纳什获得了当年度的诺贝尔经济学奖,1多人博弈的均衡(Equilibrium points in n-person games) 国家科学院学报(Proceedings National Academy

      7、 of Sciences),36: 48 49,1950年。 2非合作博弈(Non-cooperative games),纳什就读于普林斯顿大学数学系的博士毕业论文,1950年。 3讨价还价问题(The bargaining problem)。计量经济学杂志(Econometrica)18: 155 162,1950年。 4非合作博弈(Non-cooperative games)数学年报(Annals of Mathematics),54: 286 295,1951年。 5两人合作博弈(Two-person cooperative games)。计量经济学杂志(Econometrica),21: 128 140,1951年。,纳什的代表作,第一部分 完全信息静态博弈,在完全信息静态博弈中,博弈各参与方同时行动,且对博弈相关信息完全了解。 “划横线法”是求解完全信息静态博弈的常用方法。 通常说来,完全信息静态博弈都存在“纳什均衡”或“混合策略纳什均衡”。,第一节 定义和求解方法,一、完全信息静态博弈的定义和实例 完全信息静态博弈指:博弈各方同时决策,任何博弈参与者对博弈信息均完全了解。博

      8、弈信息包括:博弈过程、博弈结果、博弈各方的策略集、收益等。 可以通过支付矩阵(Payoff Matrix)寻找完全信息静态博弈的均衡。 以“囚徒困境”为例,介绍支付矩阵的构造方法和应用。,1囚徒困境,在“囚徒困境”博弈中,有两个博弈参与者:嫌疑人甲和嫌疑人乙。 将嫌疑人甲标识在支付矩阵左侧,将嫌疑人乙标识在支付矩阵上方 。 嫌疑人甲有两个策略可以选择:坦白、不坦白。将嫌疑人甲可能的策略纵向排列在博弈支付矩阵左侧。 嫌疑人乙也有两个策略可以选择:坦白、不坦白。将嫌疑人乙可能的策略横向排列在博弈支付矩阵上方。,“囚徒困境”博弈的支付矩阵,矩阵左上方的(5,5)表示:当嫌疑人甲选择“坦白”、嫌疑人乙选择“坦白”时,两名嫌疑人能够得到的收益。按照惯例,括号内逗号前面的数字“5”表示嫌疑人甲的收益。括号内逗号后面的数字“5”表示嫌疑人乙的收益。,矩阵左下方的(10,1)表示:当嫌疑人甲选择“不坦白”、嫌疑人乙选择“坦白”时,两名嫌疑人能够得到的收益。 矩阵右上方的(1,10)表示:当嫌疑人甲选择“坦白”、嫌疑人乙选择“不坦白”时,两名嫌疑人能够得到的收益。 矩阵右下方的(2,2)表示:当嫌疑人甲

      9、选择“不坦白”、嫌疑人乙选择“不坦白”时,两名嫌疑人能够得到的收益。,2智猪博弈,猪栏里养了两头猪,一头大猪、一头小猪。 在猪圈的一端有一个盛食槽。 在猪圈的另一端有一个按压式开关。 开关每被按压一次,就有固定数量的食物出现在盛食槽中。 大猪和小猪都在思考是否去按压开关。,如果大猪和小猪都去按压开关,然后两头猪从开关处奔向猪圈另一端的盛食槽。由于大猪跑的快,小猪跑得慢,因此大猪会比小猪早到达盛食槽并把盛食槽内的食物吃光。小猪付出了按压开关的劳动却没有吃到食物。在此种情况下,大猪的收益为 5,小猪的收益为 -1。 如果大猪去按压开关,小猪在盛食槽旁等待。那么当大猪按下开关后,盛食槽内出现食物,小猪立即开始吃,大猪则需要花一定时间从猪圈一端跑到另一端。当大猪到达盛食槽后,身强力壮的大猪会把小猪挤到一旁,吃光剩余的食物。在这种情况下,大猪得到的收益是 4,小猪得到的收益是 2。,如果小猪去按压开关,大猪在盛食槽旁等待。那么当小猪按下开关后,大猪开始吃,即使当小猪从开关处跑到盛食槽旁后,大猪仍然会霸占着食物,将食物全部吃光,小猪只能无可奈何地被挤在一旁。在这种情况下,大猪可以不劳而获,得到的收益为 10。小猪徒劳无功,看到大猪不劳而获,更增加了小猪的郁闷,小猪得到收益 -2。 如果大猪和小猪都不去按压开关,则大猪和小猪都无法吃到食物,大猪和小猪均得到收益 0。,“智猪博弈”的支付矩阵,二、划横线法,1通过“划横线法”求解“囚徒困境”博弈的均衡,如果嫌疑人乙选择坦白,那么嫌疑人甲应该如何选择? 理性的嫌疑人甲会选择坦白。 在嫌疑人甲选择坦白所对应的收益“5”的下方划一道短横线。 类似可分析其他情况,2通过“划横线法”求解“智猪博弈”的均衡,如果大猪选择按开关,那么小猪应该如何选择? 理性的小猪会选择等待。 在小猪选择等待所对应的收益“2”的下方划一道短横线。 类似可分析其他情况,第二节 纳什均衡,一、纳什均衡的定义 给定其他参与者在博弈均衡时的策略,任何博弈参与者都没有动机改变自己在博弈均衡时的策略选择。这样的均衡被称为“纳什均衡”(Nash Equilibrium)。,“囚徒困境”博弈的纳什均衡为:(嫌疑人甲选择坦白、嫌疑人乙选择坦白)。 给定嫌疑人乙在纳什均衡的策略选择:坦白;嫌疑

      《博弈论与信息经济学初步剖析.》由会员今***分享,可在线阅读,更多相关《博弈论与信息经济学初步剖析.》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2 2022年小学体育教师学期工作总结 2022年家长会心得体会集合15篇
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.