
2023年基于博弈论的竞赛学习对学生学习动机影响研究.doc
7页基于博弈论的竞赛学习对学生学习动机影响研究*肖达信摘 要:本文从经典的博弈理论出发,运用“合作与竞争”的思想解决存在矛盾与冲突的问题,设计“矩阵游戏”与“竞猜硬币”的竞赛学习模型,并进行实验研究,分析学习者在学习模式中最优策略的选择,探讨竞赛学习对学生学习动机的影响结果显示,竞赛学习模式激发学生学习动机,提高自身竞争力,改善学习绩效 关键词:竞赛学习,博弈论,合作,竞争,学习动机博弈论,又名对策论(英文是Game Theory),是应用数学的一个分支,其研究具有斗争或竞争性质行为(即博弈行为)的数学理论和方法[1]在这类行为中,参与斗争或竞争的各方具有不同的目的或利益,为了达成各自的目的和利益,各方必须考虑对手的各种也许行为,并力图选取对自己最为有利或最为合理的方案博弈论的思想在我国有着悠久的历史,古代的《孙子兵法》就不仅是一部军事著作,并且算是最早的一部博弈论专著,如今在经济、管理、政治、军事、公共选择等方面都已经得到广泛的应用竞赛学习是通过竞赛或竞争的形式习得知识的学习模式,是基于游戏学习的一种竞赛学习策略结合协作学习,基于项目、问题、游戏的学习等理论,激发学生的学习动机,改善学习绩效。
本文运用博弈论的思想设计竞赛学习策略,将其与计算机程序设计课程的学习相结合,对比学生不同时期的学习反馈与效果,探讨“竞赛学习”这一具有游戏特性和教育意义的学习模式对学生学习动机的影响一、“囚徒困境”与“反复博弈”博弈行为通常由个人、团队或组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,同时或先后、一次或多次从各自允许选择的行为或策略进行选择并加以实行,并从中各自取得相应结果或收益的过程[2]运用博弈行为中的合作博弈与非合作博弈分析竞赛学习中尤为凸显的协作与竞争,探究策略选择问题囚徒困境”是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团队最佳选择,是典型的非合作博弈模型,囚徒困境的主旨为,警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人有罪于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监2023若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年若二人都互相检举(互相“背叛”),则二人同样判监2年[3]如图1所示,囚徒们虽然彼此坚不吐实,可为全体带来最佳利益,但由于出卖同伙可为自己带来利益,也由于同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。
因此在“囚徒困境“一次性的博弈中,双方都选择背叛是一个纳什均衡, 但显然不是顾及团队利益的解决方案以全体利益而言,假如两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳但根据以上假设,二人均为理性的个人,且只追求自己个人利益均衡状况会是两个囚徒都选择背叛,结果二人判监均比合作为高,总体利益较合作为低,这就是“困境”所在B 合作 B 背叛A 合作-1, -1-10, 0A 背叛0, -10-8,-8图1 “囚徒困境”博弈“囚徒困境”的博弈次数只为一次,博弈双方并不选择合作而选择彼此认为利益最大的背叛,但当“囚徒困境”扩展为多人博弈时,就出现很多矛盾与问题,共有的资源是有限的,当每个人都试图从有限的资源中多拿一点儿时,就产生了局部利益与整体利益的冲突艾克斯罗德做了个实验,他规定每个参赛者把追求得分最多的策略写成计算机程序,然后用单循环赛的方式将参赛程序两两博弈,以找出什么样的策略得分最高他邀请很多人来实验,得分规则和“囚徒困境”矩阵同样,什么时候结束游戏是未知的第一次比赛时共有15个策略(程序)参与,艾克斯罗德将每一策略分别和所有策略对弈,运转200步,结果得分最高的程序是加拿大学者罗伯布提交“TFT策略”(即“一报还一报”(tit for tat)),该程序第一次对局采用合作的策略,以后每一步都跟随对方上一步的策略,你上一次合作,我这一次就合作,你上一次不合作,我这一次就不合作。
为了进一步验证上述结论,艾氏决定邀请更多的人再做一次游戏,并把第一次的结果公开发表第二次征集到了62个程序,加上他自己的随机程序,又进行了一次竞赛结果,第一名的仍是"一报还一报"艾氏总结这次游戏的结论是:“一报还一报”仍是最优策略[4]反复博弈”实验证明了在博弈被反复地进行中,每个参与者都有机会去“处罚”另一个参与者前一回合的不合作行为这时,合作也许会作为均衡的结果出现欺骗的动机这时也许被受到处罚的威胁所克服,从而也许导向一个较好的、合作的结果二、关于游戏学习动机的研究学习动机是影响学习的重要内部因素,是教育理论和心理学研究的一个重要主题学习动机是指个体由一种学习目的或对象引导、激发和维持学习活动的内在心理过程或内部动力来自于17173的2023年“第七届中国网络游戏市场调查报告”数据显示,30%的游戏玩家玩游戏的重要目的是纯粹娱乐;另一方面是消遣时间和交朋友,其比率分别为14.66%和14.38%;以从游戏中获得现实收益的只占13%;随后的游戏目的是消遣时间(9%)和在游戏中成为高手受人尊重(5%)[5]此时游戏玩家玩游戏的最重要目的是娱乐,另一方面是交朋友和锻炼智力2023年调研参与用户游戏目的分析显示,娱乐和交友所占比例最高,分别达成了56.5%和42.1%;而游戏中成为高手受人尊重和从游戏中获得现实收益比例有所上升,分别为22.4%和17.8%[6]。
说明人们在面对游戏时,娱乐目的最为明显,但逐渐在游戏中增长交流与沟通,玩家可通过游戏交友和收益知识,可见,游戏“有助于学习”的特性逐渐增长影响学习者学习动机的因素很多,诸如学习者的需要,对学习活动的好奇心、爱好,胜任感和成就感等[7]学习者在学习活动中感受到的乐趣越多,就越乐意积极参与并完毕任务,学习动机就越高,除此之外,具有挑战性活动能激发学习者学习爱好,和谐的竞争活动能增强并提高自身竞争力,这些动力能促进学习者更好的完毕活动内容竞赛学习这种以游戏形式呈现给学习者的学习模式,在挑战与竞争中引发学习者正面且高涨的情绪,在知识性与趣味性结合的活动过程中完毕知识学习三、竞赛学习模式的设计及实验研究本研究选取徐州市北大青鸟2023年开设的计算机软件程序设计实验课为例,跟踪调研使用竞赛学习模式的两门课程,通过介绍竞赛学习过程,提交小组最佳程序设计以及学生对该课程学习爱好及结果的反馈,探索竞赛学习对学生学习动机的影响一)“矩阵游戏”在课程的学习中,设计使用基于P2P模型,由N个参与者参与的文献下载矩阵游戏,将参与者分为G个小组,每个成员为一组,规定彼此运用智慧与技巧与对方实现文献互换,计数方式参考“囚徒困境”矩阵。
模拟文献的互换过程,一方面定义一个2X2的矩阵,竞赛双方可有两个选择:合作(C)或背叛(D),每次背叛行动的一方即不共享资源在互换文献的过程中得分规则如图2所示,彼此分享各自的资源即可获都获得5分,若一方保守(不分享资源)一方共享,则共享者获得0分,另一方获8分,若彼此都不共享资源则获得0分甲 分享 甲 保守乙 分享5, 50, 8乙 保守8, 00, 0图2 矩阵游戏的“囚徒困境”若一方的分享无条件地被另一方吸取时,游戏双方也许都不乐意无条件地分享资源,矩阵游戏的各小组都想获得更大的利益,导致双方疏离甚至封闭所以他们宁愿选择“保守,保守”,不共享资源这是竞赛游戏的“困境”所在,而通过实验并分析学习者最优策略的选择, 在提交的最优策略的算法程序中,绝大多数学生是将罗伯布的TFT策略算法加以修改,其中有一最佳算法,重要内容为:在起初的四个轮回中使用TFT策略,随后应用以下方法,若有连续两个轮回对方选C我方选D,则继续选D;若连续两个回合双方均选C,则继续使用TFT策略;若最后一个回合对方选D,那么我也选D,若非,则保持当前选择在课程结束后对41名学生学习爱好与结果的调查反馈中得知,学生相称支持基于博弈的竞赛学习方式,但对于与其他成员的互动,多数学生保持中立。
如表1所示表1 “下载文献竞赛游戏”学习爱好反馈数据1分2分3分4分5分均分该竞赛游戏是否有趣03915174.04竞赛能否促进小组互动1197962.82竞赛学习模式能否激发学习爱好02122283.81该游戏与学习内容是否匹配04128204.00在学习中是否希望使用博弈02141993.79(二)“竞猜硬币”游戏中每个参与者手中有0-3个硬币,共N个参与者,每人有权藏0-3个硬币,因此当每个人都藏完,即被隐藏的硬币就有0-3*N个此时,第一个选手报出他认为的隐藏硬币个数,依次下去,每个玩家报的数字不得和上一个玩家相同裁判说其中某选手的报数为对的答案时,该选手离开游戏,直到剩下一个选手为止,游戏结束该算法课重要训练学生应用记录学方法编写程序胜利的玩家运用大数定律,这些“有规律的随机事件”在大量反复出现的条件下,往往呈现几乎必然的记录特性,在实验不变的条件下,反复实验多次,随机事件的频率近似于它的概率[8]所有的对的结果呈正态分布,而最也许的值是位于最小值与和最大值之间 如表2,在对40名学生学习爱好与结果的调查反馈中得知,学生相称支持基于博弈的竞赛学习方式,且较前一次实验课比,学生之间的交互有所增强,由于每一轮游戏都有多名学生共同参与,而非两人之间的博弈。
表2“竞猜硬币”学习爱好反馈数据1分2分3分4分5分均分该竞赛游戏是否有趣0577214.10竞赛能否促进小组互动2128543.15竞赛学习模式能否激发学习爱好06155143.67该游戏与学习内容是否匹配05313194.15在学习中是否希望使用博弈04129153.87(三)竞赛游戏的评价综述在对上述两节实验课的调查中,影响学生是否选择竞赛学习模式完毕程序学习的几个维度:*竞赛学习模式能否加强知识的掌握;*竞赛学习是否会给学生带来压力;*设计的竞赛游戏是否有趣;*通过竞赛进行学习能否不断激起学习的爱好;*学习的过程中加入竞赛能否提高彼此的竞争力;*能否在竞赛学习中促进彼此合作,增强人际关系;*在竞赛的过程中能否培养学生的奉献精神;*学习中是否需要不断思考,引发新的学习创新;对两个实验样本平均结果的进行对比分析显示,如表3,调查问题2的普适性最低,不同的样本对该项调查的反馈意见不集中结合学生考虑参与竞赛游戏的学习动机,发现这些动机能让学生学到更多的(涉及专业知识以外)知识表3样本调核对比表下载文献竞赛游戏竞猜硬币差值比例问题14.044.100.061.2问题22.823.150.336.6问题33.813.670.142.8问题44.004.150.153.0问题53.793.870.183.6通过测试,并对比上一个月学生学习程序设计的学习结果,竞赛学习模式下学生对知识的掌握情况较好,如表4所示,基于竞赛学习,学生完毕任务情况普遍超过90%,但这并不意味着竞赛学习比其他任何学习策略好,它作为一种学习技术来激发学生的学习爱好,在合作、竞争中不断思考。
表4 学习结果对比表。












