
《软件工程》课程本体知识库构建方法研究及应用.docx
7页《软件工程》课程本体知识库构建方法研究及应用 摘要:课程本体知识库的建立,对学生掌握本专业课程知识体系和相关概念具有重要的参考价值本文针对《软件工程》课程本体知识库的构建,基于维基百科数据,采用七步法本体构建方法,使用Protégé本体构建工具,实现了《软件工程》课程本体知识库的构建实践证明该本体知识库的构建,有助于提高学生对《软件工程》课程整体知识结构的理解关键字:软件工程 本体 维基百科 Protégé 七步法1. 前言本体(Ontology)是一个哲学概念,在信息科学领域,它的定义为:形式化的,对于共享概念体系的明确而又详细的说明[1]在现实生活中,对于很多概念,人们往往都是在理解上具有统一认识的,也即不同的人对某一事物有共同的认识,但是往往地区差异、年龄层次差异等方面的因素,导致人们对同一事物的认识不同对于信息领域来说,计算机对某个事物的认识必须是唯一的且准确的,或者虽然不唯一,但需要明确同一概念的不同叫法或解释之间要有对等的关系原因在于计算机并不能像人一样进行区别,因此,需要通过本体技术来构建计算机统一的知识库,以方便计算机更好的为人们服务。
这就是本体引入信息科学领域的意义在信息科学领域中,课程领域知识的相关概念具有权威性和广泛的传播性,其领域本体知识概念的统一,对人们的生活、工作等方面具有重要的影响意义因此,构建课程领域本体知识库,是十分必要的基于以上考虑,本文采用维基百科作为语料收集平台[2],本体构建方法采用七步法[3],使用Protégé本体构建工具[4],来构建《软件工程》课程本体知识库,为《软件工程》课程的教学提供统一的课程概念基础2. 课程领域本体知识库构建思路2.1 整体思路本体知识库的构建需要以概念及概念关系数据获取为基础,以此来构建原始数据库;然后确定领域概念和原始数据库的数据表中的字段之间的关联关系,并提取出领域概念的上下级关系;最后通过比对概念库与相应领域内容,进行相关修正,从而构建课程领域的本体知识库[2]1.2. 相关内容及技术介绍1. 维基百科维基百科语料内容丰富,具有严谨的条目化数据结构,同时维基百科是一个面向全世界的百科知识库,其维护的条目内容也是被全世界各领域都承认的,兼具统一性、完整性和权威性因此,本文研究的领域概念及概念之间关系数据的获取,选取维基百科平台2. 本体知识库构建方法从国内外对本体构建技术的研究来看,常用的有以下几种方法:七步法、“骨架”法、MethOntolog工程法、TOVE法、KACTUS法。
在这几种方法中,由美国Stanford University医学院提出的七步法是目前应用最为广泛的本体构建方法其七个步骤为:1.确定研究领域本体的范畴;2.整合复用现有的本体;3.列举研究领域的术语;4.定义类和类的等级关系;5.定义类对象属性;6.定义类的数据属性;7.创建实例经过以上七步,即可构建出领域的本体知识库鉴于七步法的广泛应用性,本文采用七步法来构建本体知识库[2]3. ProtégéProtégé是一个免费的、开源的本体构建工具,它提供了一套用来构建领域模型和基于知识的本体化应用程序Protégé提供了本体概念类、关系、属性和实例的构建,并且屏蔽了具体的本体描述语言,用户只需在概念层次上进行领域本体模型的构建Protégé基于Java语言开发,自推出以来,被国内外研究人员广泛应用由于Protégé能很好的支持中文,所以本文选用Protégé来作为构建本体知识库的工具[4]3. 《软件工程》课程知识库构建过程1. 概念及概念关系获取1. 从维基百科数据库下载页面,下载维基百科备份数据库,保存到本地数据库;2. 对(1)中的本地数据库数据结构进行分析,确定表之间和字段之间的关系,并从中提取出软件工程领域相关的概念;3. 根据(2)中概念及数据表中字段的关联关系,确定软件工程领域概念的上下级关系,并利用维基百科的重定向机制,获取软件工程领域概念之间的同义概念;4. 将(3)中得到的概念,与软件工程课程相关教材所列概念进行对比,对其内容进行修正。
2. 本体知识库构建软件工程本体知识库的构建是按照七步法构建步骤,结合Protégé工具进行由于概念及概念之间的关系构建方法已在3.1节描述,对此部分不再赘述具体构建步骤如下:1. 确定软件工程本体的范畴《软件工程》课程本体知识库构建目的是为了用于教学,使学生们能够了解到最准确的概念及相关解释因此基于维基百科数据库,对《软件工程》课程领域研究范畴进行界定,从数据库中剔除掉与教学无关的概念2. 在Protégé中编辑将软件工程相关概念及概念间的关系,在Protégé工具中进行编辑和处理,可以得到初步的本体类以及类之间的关系模型3. 概念及概念之间关系修正参照目前《软件工程》权威教材,对概念及概念间的关系进行文字修正,对于没有获取到的概念和概念关系进行补充,从质量上保证概念及概念之间关系的准确性4. 概念(课程知识)对象属性的定义对于本研究来说,概念即课程知识将概念映射到课程本体中,也即映射成为类,概念之间的关系映射也即类之间关系的映射所涵盖的关系包括:同义关系、兄弟关系、上级关系、下级关系确立以上层次关系之后,即可定义每个类对象的属性5. 创建实例在经过以上步骤之后,为了帮助学生更好的理解概念,可以使用类的实例标签,为部分概念添加相关的实例。
经过以上步骤,即可构建出《软件工程》课程领域的本体知识库4. 结论《软件工程》课程是软件工程专业的基础课程,学生们对于本课程概念的理解对学生掌握本专业技能来说至关重要本文利用维基百科的数据,结合七步法本体构建步骤,使用Protégé本体构建工具,实现了《软件工程》课程领域本体知识库的构建该知识库的建立,可以帮助软件工程专业学生更好的掌握本专业的概念及知识体系结构,为从事本专业工作打下良好的理论基础参考文献1. 童名文,牛琳,杨琳等.课程本体自动构建技术研究[J].计算机科学,2016,43(11A),108:112.2. 杨建萍.基于维基百科的《网络安全》课程本体构建及应用研究[D].新疆师范大学,2016.3. 刘雁昆.基于本体的软件工程领域知识库构建方法研究[D].北方工业大学,2015.4. 胡海斌,李青,胡章荣.基于Protégé的学科本体构建研究[J].福建电脑,2017,(10):7+17. -全文完-。
