好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

(毕业设计论文)关于非相关文献知识发现方法在航天科技情报研究中的应用分析.doc

10页
  • 卖家[上传人]:zhuma****mei1
  • 文档编号:54413037
  • 上传时间:2018-09-12
  • 文档格式:DOC
  • 文档大小:36.50KB
  • / 10 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • l关于非相关文献知识发现方法在航天科技关于非相关文献知识发现方法在航天科技 情报研究中的应用分析情报研究中的应用分析论文关键词:知识发现 非相关文献 航天科技情报 情报研究 应用研究 论文摘要:概述了非相关文献知识发现方法的原理以及国内外应用现状,总结了该方法的发现流程以及开发人机交互系统所需要的关键技术,对比分析了非相关文献知识发现方法应用于生物医学领域及航天科技情报研究领域的异同点,人工模拟了用该方法发现新型飞行器隐身技术的知识发现过程,验证了非相关文献知识发现方法用于航天科技情报研究领域的可行性,揭示了规模应用的努力方向 1 非相关文献知识发现方法对于航天情报研究的重要意义 作为科技情报研究领域中的一个分支,航天科技情报研究既有与其他专业情报研究相同的一面,也有其保密性强、难以从公开渠道获取等特点一直以来,航天情报研究多采用定性分析为主、定量分析为辅的方式,分析方法也局限于传统的情报研究方法,因此检索前沿技术发展动向时,会出现“巧妇难为无米之炊”的现象,难以发现有价值的文献,无法为科研决策提供有效的情报支持 1986 年,Don.R.Swanson 在研究时偶然发现以雷诺病生理改变作为中间词,可将以鱼油和雷诺病为主题词检索到的两组原本无联系的文献联系起来,得出鱼油有助于雷诺病的治疗的结论。

      于是lSwanson 认为,对于两组非相关文献 A 和 C,可以通过某中间词或中间文献 B 建立起二者的关联,上述发现 A、C 关联的过程称为非相关文献知识发现方法1997 年,Swanson 在描述知识发现的过程中,提出了开放式和闭合式两种方法(如图 1 所示,该方法 2001 年被 Weeber 正式命名)在科学假设的形成阶段主要采用开放式方法,以感兴趣的主题 C 为初始点,发现中间集合 B,通过中间集合 B 与文献集合 A 之间的关系,确定 C 与 A 之间的关联在科学假设验证阶段主要采用闭合式方法,从 C、A 两端同时开始进行检索,产生相互交叉的词汇集合 B这种知识发现方法的诞生,不仅对情报学的学科建设具有重大意义,同时可有效解决一般检索方法无法发现有价值文献的问题,为航天情报研究者指明了努力的方向,具有里程碑意义 与 Swanson 提出的非相关文献概念相比,本文中的非相关文献概念有所扩展,是指文献之间不彼此引用、没有被共引且也不共引其他文献…、不能用主题检索等常规检索方法同时被检索出来的彼此间相对独立的文献非相关文献知识发现则是指以揭示隐含于非相关文献中的尚未被人们认识或发觉的知识片段的逻辑联系,从而提出知识假设,以便专业研究人员进一步证实,促使新知识的产生为目的的情报研究过程。

      2 非相关文献知识发现方法的应用现状及发展 Swanson 提出非相关文献知识发现方法后,很多学者在其基础上进行了方法的改进和应用领域的拓展,使得该方法在其他学科的l移植应用成为可能 1993 年,Z.Chen 在 Swanson 理论的基础上提出一种整合分散在文献内部知识片断间逻辑关联的方法,为建立不同专业领域间的知识关联开辟了新途径1996 年,M.D.Gordon 创建了基于短语的词频统计方法,并建立起中介文献的概念,将非相关文献的发现应用扩展至学科和领域之间,拓展了基于非相关文献知识发现应用的广度航天情报领域与物理、化学、材料等领域密切相关,非相关文献知识发现方法的跨学科、跨领域性使其可以用于发现不同学科和不同领域之间的隐含逻辑联系 Swanson 本人也尝试将该分析方法向数据库移植,1999 年专门针对医学数据库 Medline 设计了人机交互检索系统 Arrowsmith,用于自动检索联系两组非相关医学文献的中间文献Arrowsmith 系统除可以模拟整个非相关文献知识发现过程外,还提供了生物医学文本挖掘工具列表和以作者为入口的检索模块等 8 个模块,提高了实现过程的效率,使该方法在某些学科的大规模应用成为可能。

      2001 年,Weeber 提出了基于“概念”的非相关文献发现方法,并开发出专门用于 MetaMap 的基于概念的自然语言处理系统——DAD系统 J同年,M.D.Cordon 和 Lindsay 研究了该方法在万维网中的应用,积累了网络应用经验Kostof 研究小组将 Swanson 理论的应用范围拓展到决策服务领域中,使其更具实践价值 2001-2003 年间,P.Srinivasan 等也开展了对开放知识发现过程的研究柏林自由大学医学图书馆的 J.Stegmann 等开始尝试用共l词聚类分析来模拟知识发现的过程,寻找从来源文献到目标文献的路径和规律2001-2005 年问 Hristovski 等将该方法用于遗传学领域]2006 年,Swanson 以 Medline 为目标数据库,在回顾其以往基于非相关文献发现研究的基础上探讨了如何提高获取文献 B 的准确度的问题,认为根据特定主题事先获取文献 A 和 C 时应该优先考虑使用标题字段和 MeSH 主题词表术语 在方法改进的同时,非相关文献知识发现方法的应用领域也在不断扩展,可以用于 Biosis,Embase,Scisearch,Intemetdatabases等数据库中,但仍限于生物医学领域。

      直到 1999 年 K.A.Cort 将其用于 Wilson 人文数据库隐含知识关联的挖掘,利用该方法揭示了此前从未被人文领域知晓的现代诗人 R.Fomt 同古希腊哲学家Cameades 之间的思想关联,非相关文献知识发现方法的应用领域得到实质性拓展 国内对 Swanson 情报学方法及 Arrowsmith 软件的介绍始于2000 年,多数文献是对 Swanson 方法的评价、简介和相关性算法改进,实践方面限于网络版的 Arrowsmith 的利用和设计中文系统重现Swanson 知识发现过程,也有文献探讨了该方法向中医药领域拓展的可行性和数据集构建等问题目前,基于文献的知识发现方法已经成为国内情报界研究的热点,先后有 20 余篇文献在各种刊物上发表,种种改进使非相关文献知识发现方法日趋成熟和完善,为该方法用于航天科技情报研究领域奠定了基础 3 非相关文献知识发现方法应用于航天科技情报领域可行性分l析 3.1 领域比较 非相关文献知识发现方法在人文领域的成功应用证明了该方法的普适性因此,将该方法用于航天领域有其可能性与医学领域相比,航天领域有以下异同(见表 1) 相似点:有特定的检索需求;有独立的情报研究机构和情报研究人员;有比较完善的主题词表;有相对完善、独立的数据库;有专业词典。

      不同点:没有开展过类似的研究;没有一体化的语言系统;没有专门的人机交互系统;保密要求,不能及时获取全部文献;政治原因,人工处理,消除文献间联系 3.2 发现流程及关键技术分析 分析 Swanson 知识发现方法的原理和 Arrowsmith 系统工作原理,可将非相关文献知识发现流程分为 5 个步骤(见图 2) 第一步:主题确定即确定初始检索词,依据何种主题词表选取初始检索词;是否对文献类型进行限定;确定初始文献集选取范围等第二步:发现中间词集具体包括自然语言处理、相关性判定、过滤修剪、确定非相关性几个方面自然语言处理主要是建立通用语言知识库和专业语言知识库,用于自动抽词、分词相关性判定可依据词共现、概念共现或二者相结合的方式来选取中间词,此部分算法的改进是学者研究的重点过滤修剪有很多方法,如停l用词表过滤、语义网络过滤、词频过滤、日期过滤、排序过滤、人工过滤,等等,确定非相关性可利用引文分析法第三步:找出关联词集与发现中间词集方法类似第四步:验证关联利用闭合式知识发现原理进行验证第五步:判定过程结束可通过设定阈值、统计参数限定或发现不到新概念作为结束发现过程的标志 综上所述,无论是在生物医学领域还是航天领域应用非相关文献知识发现方法,其原理与技术是相同的,如果建立起相应的语义映射机制,设计算法,在航天领域应用非相关文献知识发现方法进行情报研究是完全可行的。

      4 可行性验证 为了验证非相关文献知识发现方法在航天领域应用的可行性,人工模拟验证了等离子体技术应用于飞行器隐身方面的知识发现过程 ·背景:20 世纪 60 年代起,苏联开始研究新型飞行器隐身技术,到 80 年代左右取得一定进展美国于 20 世纪 90 年代也开始了相应研究,研究成果处于保密假定 1995 年左右,希望通过非相关文献知识发现方法发现有价值的研究方向·数据库选取:鉴于技术的保密性,航天领域专用数据库中难以检索到有价值的文献因此选取 IEE 出版的 INSPEC 数据库进行检索该数据库收录了包括物理、电子工程和信息技术等领域的 3500 余种期刊,1500 余种会议记录以及大量图书、报告、学位论文的摘要和索引 l·检索平台:THOMSONISI 公司的 Webof Knowledge 平台 ·检索时间段:1967-1994 年 ·初始主题词(C):StealthMaterial(隐身材料) ·检索方式:主题检索、通用检索 主题确定过程:初始考虑 StealthMaterial、StealthCover(隐身涂层)、StealthCoat(隐身层)、StelathTechnology(隐身技术)4 个主题词,考虑到与检索需求最为接近选取 StealthMaterila 作为主题词。

      检索结果有 14 篇文章发现中间词集过程:上述 14 篇文章的受控标引词共计 50 个进行概念聚类后按照出现频率进行统计,剔除无意义中间词后的结果见表 2 进一步修剪并确定非相关性:根据隐身技术原理,TemperatureControl 原理确实可应用于隐身(如红外隐身)但属于已知技术,故可在筛选中间词时剔除而 Antennas 和 RadarCross—sections 出现频率极高,经判定与隐身技术具有相关性属于相关文献,故中间词集可确定为 MelectromagneticWaveAbsorption 和SuperconductingDevices考虑到 Magnetohydrod)namic 和SuperconductingDevices 本身可作为隐身技术,其原理在于降低运动阻力,降低噪声,从而减小被发现的概率,继续检索意义不大,故终止以两个词为出发点的知识发现过程最终ElectromagneticWaveAbsoprtion 词作为中间词集 找出关联词集过程:考虑到 ElectromagneticWaveAb.soprtionl含义的宽泛性和人工模拟的可行性(进行主题检索得到 7928 篇文章),此处人为缩小检索范围,仅将文献集检索范围限定在标题上,检索到文章 79 篇,重复中间词集发现过程,得到受控主题词 227 个,剔除与 Elec.tromagneticWaveAbsorption 相关的词,利用词性修剪,剔除非名词及非名词短语,利用领域修剪,剔除生物等非相关领域名词,并进行概念聚类后得到 19 个关联词,将阈值设定为 2,按出现频率排序后结果见表 3。

      进行进一步阅读以判断是否有新的知识发现 Plasma 单独出现 23 次,与 ElectromagneticWave 共同出现 27 次,高度相关,阅读分析后发现,Plasma 可以吸收或发射电磁波,从而避免雷达探测,用于隐身(见图 3)Semiconductor 也可影响电磁波的吸收和发射,用于隐身IndiumAntimonide 未见于电磁波吸收明显相关supedattices 主要研究电磁波在超晶格中的传播、耦合等现象,未见明显相关Excitons 等离激子可吸收电磁波,用于飞行器隐身 过程结束:将 ElectromagneticWaveAbsorption 作为中间词 B,成功发现了关联词 Plasma 和 Semiconductor(A)结论:Plasma 和Semiconductor 具有 ElectromagneticWaveAbso。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.