
面向教育大数据的知识追踪研究综述.docx
29页面向教育大数据的知识追踪研究综述 魏廷江 倪琴 高荣 郝煜佳 白庆春摘 要: 介绍了知识追踪(KT)的相关概念与任务,梳理其发展脉络,综述KT的原理、相关算法和数据集,分析了不同结构的KT模型的优缺点.在此基础上,对KT领域未来发展方向进行了深入探讨,提出了数据表征、认知建模、模型可解释性三个重要的发展方向,并作出了一定的展望.Key: 知识追踪(KT); 教育数据挖掘; 个性化学习; 学习者建模: TP 18 文献标志码: A : 1000-5137(2022)02-0171-09WEI TingjiangNI QinGAO RongHAO YujiaBAI Qingchun(1.College of Information, Mechanical and Electrical Engineering, Shanghai Normal University, Shanghai 201418, China;2.Shanghai Engineering Research Center of Open Distance Education, Shanghai Open University, Shanghai 200433, China)In this paper, firstly common models and datasets in the field of knowledge tracing (KT) were organized and the development and progress of them were collated. Secondly, the correlative theory as well as principles and datasets were overviewed. The advantages and disadvantages of KT models with different structures were analyzed. Moreover, the future development directions of the KT field were discussed, and three important directions of data representation, cognitive modeling, and model interpretability were proposed respectively, and the prospect for the future was predicted.knowledge tracing (KT); educational data mining; adaptive learning; learner model0 引言在線教育使得学生能够随时随地学习不同来源的课程,也为个性化学习、因材施教带来新的机遇和挑战.对于学生而言,面对海量学习资源会遇到选择困难、碎片化学习、学习进度控制难等问题;教师对于学生的学习需求、学习效果难以进行准确评估.数据驱动下的知识追踪(KT)模型通过大数据分析学习过程和学习行为,能够精准识别学习者的个性特征,动态监控学习过程,实时预测学习趋势,有效评价学习结果,给予学习者个性化的干预和自适应的指导.KT算法将学生的知识掌握程度随着时间的推移建模预测,从而能够准确地预测学生在未来互动中的表现,据此有针对性地为学生订制不同的学习路线,提升学习效率.学生通过学习平台进行学习交互,形成答题行为时间序列,KT算法通过对学习者和序列联合建模,预测其对于新知识的认知概率分布,进一步推理出学习者的技能和认知水平.根据学生答题记录评估学生的知识状态是当前KT建模领域重要的研究内容.其核心思想是根据学生学习轨迹来自动追踪学生的知识水平随着时间变化的过程.早期KT技术主要依赖于概率模型,将知识的掌握程度预测看作“掌握/未掌握”的概率分布推理问题,如隐马尔可夫模型(HMM)、贝叶斯KT(BKT)模型.HMM可以根据学习者历史知识状态预测隐变量的概率分布,并刻画状态之间的转移情况.KT领域采用的深度学习方法最早出现在2015年,PIECH等提出了经典的深度KT模型(DKT),其核心思想是基于学习者练习数据是典型的序列数据的特性,利用循环神经网络(RNN)可以相对有效地捕捉到时间序列前后的关联性.随着相关研究的进展,在KT领域,注意力机制的方法也逐渐被引入神经网络中,并在性能和可解释性方面取得了突破.本文作者主要综述了采用传统方法和深度学习方法对KT建模方面的研究成果,通过讨论上述模型的优劣,对KT领域的研究作出了展望.具体来说:1) 对KT领域目前主要的问题进行了梳理,全面总结了KT领域当前的研究进展;2) 深入剖析了目前主流KT模型,从问题表征、因素关系表示、认知和遗忘机制方面阐述KT的过程;3) 通过分析和对比主流KT模型,在数据表征、认知遗忘、可解释性方面展望了未来研究方向.1 KT问题2 传统KT方法传统KT方法主要基于概率模型,追踪的过程可以划分为基于BKT模型的方法和基于因素模型的方法.基于BKT模型的方法主要关注于学习者交互序列预测,而因素分析模型更加偏重于解释KT过程中所涉及的各种学习因素.基于模型的方法 BKT模型的目标是将学生的表现(可观察的变量)映射到对知识水平(不可观察或潜在变量)的估计,标准BKT模型建模过程中将知识点设置为“永不忘记”,并且假设一个题目只对应一个知识点.贝叶斯KT模型如图1所示.贝叶斯KT模型具有简单易用、可解释性强的优势,并且也是KT领域的经典方法.但是,贝叶斯KT模型并未考虑到不同学生的初始知识水平存在差异的情况,缺乏对于题目难度的建模与评估.另一方面,模型假定学生不存在遗忘的情况并不符合实际认知规律.除此之外,使用二元组表示知识状态并不符合实际认知状态情况,并且由于隐藏状态和练习做题之间的映射关系较模糊,很难充分预测每个练习和具体知识概念的关系.因素分析方法 因素分析方法是通过对学习者知识水平中的细粒度影响因子建模,预测答对的概率.CEN等认为一个好的认知模型应该能够捕捉到课程中的细粒度知识点,提供合适的反馈和提示,选择难度与学生个人相匹配的问题,最终提高学生的学习水平.CEN等提出了学习因素分析(LFA)相关模型,该模型的主要目的是从学生的学习数据中,寻找一个能够量化因素的认知模型.LESZCZENSKI认为LFA是评估和比较许多潜在的学习认知模式的一种通用解决方案,并扩展了其在大型数据集上的应用.LFA继承和发展了心理测量学中用于评估认知的矩阵,并扩展了学习曲线分析理论.LFA模型通过对认知模型空间进行启发式搜索,使研究者可以评估一套知识点的不同认知表征方式,即同一组知识点会在不同学生身上表现出不同的因素依赖.传统上基于逻辑回归的LFA模型可以表示为:为了探寻学习者数据中的时间序列特征,CEN等进一步提出了加性因素模型(AFM)模型,AFM模型可以应对KT过程中出现多个知识点的情况,可以连续渐进式地追踪学习者的学习情况,能够设计适合学习者的知识点难度系数和学习速率.PAVLIK等对AFM模型进行进一步的扩展,提出了绩效因素分析(PFA)模型,PFA模型将学习者学习过程中的交互过程分为积极和消极两个方面,AFM模型可被看作是PFA模型的一种特例.因素分析方法在KT领域表现出了极强的可解释性,能够处理多种学习者特征.但大规模教育数据中数据维度太多,特征编码和额外信息来源较为复杂,模型拟合难度也较高,相较于深度模型来说,潜力有限,无法做到真正的大规模、自适应且动态地追踪.3 KT过程分析问题表征3.1.1 知识关系领域知识模型对应用领域的组成元素及其结构进行描述,表示内部各组成元素及其之间的相互关系,其组成主要包括语义网络、层次结构、领域本體、知识图谱等技术.知识图谱是由Google在2012年为改善搜索引擎而提出的一个新的概念,可以将其简单理解为多关系图.在领域表示学习方面,目前的绝大多数研究都基于关联主义学习理论,把精力聚焦于对通用知识图谱的构建上.知识点具有天然的图关系属性,近年来利用深度学习处理图结构数据的图神经网络,受到了广泛关注.NAKAGAWA等提出无预先知识图结构的情况下,构建知识图谱并进行KT的方法,并且该方法基于图结构,提高了模型预测的可解释性.TONG等引入了问题模式的概念,构造了一个分层的练习图,可以对学习依赖关系进行建模,并采用两种注意机制突出学习者的重要历史状态.SCHLICHTKRULL等提出了基于关系图卷积神经网络(CNN)的知识图谱构建方法.LI等在R-GCN的基础上,利用学生互动过程,构建了“学生—互动—问题”网络,提出了R2GCN模型,适用于异构情况下的网络学习.YANG等提出了一种端到端的DKT框架,能够利用“高阶问题—技能”关系,缓解数据稀疏性和多知识点问题.从认知维度出发构建认知图谱,更能理解学习者学习过程,从而在认知层面对学习者进行建模.但是通过分析研究发现,以上大多数研究都集中在对表层学习概念和关系链接的表征上,缺乏关于实体重要性、隐性知识链接、隐性知识与显性知识相互作用对学习能力的影响等方面的研究,并且对于自动构建认知图谱缺乏相关的研究,还无法真正实现对学习者认知状态的识别.3.1.2 因素关系处理 深度学习技术逐步应用到了KT领域,IRT模型也被重新改造,以适应深度学习方式,通过融入学生能力状态,提升网络性能.典型的实例有Deep-IRT,它是IRT模型与DKVMN模型的结合.HUANG等提出知识熟练度追踪(KPT)模型和练习关联的知识熟练度(EKPT)模型,应用于知识估计、分数预测和诊断结果可视化三个重要任务.VIE等综合IRT,AFM,PFA等模型,提出了知识追踪机(KTMs)框架,KTMs利用所有特征的稀疏权值集,对学习者答题结果的概率进行建模.IRT模型特别是其衍生出的MIRT模型,存在的较大问题是模型有效训练难度高,所以在实际中并不常用.从IRT到AFM以及PFA模型的演化过程,实质上是在逐步将学习者数据中的各种特征纳入分析的过程,但是以因素分析为基础的特征分析模型对于动态数据建模能力相对较弱,无法跟踪学生的认知状态,对于大规模自适应学习缺乏足够的技术支持.3.1.3 学习者认知机制和遗忘机制 目前KT领域绝大多数模型都会关注到学习者的认知过程和知识遗忘过程,对这两个维度高效建模是进行有效认知诊断的关键.WANG等提出了一种通用的神经认知诊断框架,摒弃人工特征,将神经网络集成到复杂的非线性交互模型中,解决认知诊断问题,并且结合CNN,提出了Neural CDM+模型,通过自动提取系统中的知识点信息,补充知识点相关度矩阵,避免了主观性甚至错误.关于记忆研究方面,最为经典的是艾宾浩斯遗忘曲线,心理学家赫尔曼·艾宾浩斯通过一系列的测量实验总结了遗忘规律,近似表示为指数函数,但艾宾浩斯曲线是建立在经验之上的,并且测量的范围相对宽泛.MURRE等通过数学证明了如果学习率的分布遵循伽玛分布、均匀分布或半正态函数,幂函数为指数函数的平均结果,即在大规模的知识点学习过程中,学习过程的整体遗忘性规律可以被认为遵循幂函数分布.DKT模型使用RNN一定程度上实现了对记忆过程模拟,但是仍然没有真正意义上模拟人类思维习惯.LI等提出的学习与遗忘追踪(LFKT)模型,在RNN的基础上成功模拟了一定程度的思维遗忘机制;DKVMN模型通过类似于计算机内存管理的方式,建立知识记忆遗忘矩阵,在模型可解释性上取得了很大的进步;GHOSH等提出的模型不仅在问题细分方面取得了进步,还在基于Transformer的模型框架上引入了注意力衰减机制,模拟全局遗忘行为,从而取得了较好的模。
