
文献信息分析软件RefViz的使用与实践.ppt
40页文献信息分析软件文献信息分析软件RefViz的的使用与实践使用与实践 云南大学图书馆云南大学图书馆陈陈 强强2011年年11月月16日日“金钥匙讲坛金钥匙讲坛”文献管理软件系列之四文献管理软件系列之四前言:科研工作者的四项信息修炼前言:科研工作者的四项信息修炼图书馆资源图书馆资源检索基本知识检索基本知识常用数据库常用数据库RSS订阅订阅搜索引擎搜索引擎EndNote X4NoteExpress 2.6QuosaHistCiteTDACitespaceRefVizOmniVizMendeleyZotero共享协作平台共享协作平台…………导入:数字化时代科研人员的导入:数字化时代科研人员的“困扰困扰”o传统的文献存储方式:遗忘丢失,重复下载传统的文献存储方式:遗忘丢失,重复下载o低效的文献阅读方式:耗力费时,无法整合低效的文献阅读方式:耗力费时,无法整合o落后的论文写作方式:手工编排,枯燥易错落后的论文写作方式:手工编排,枯燥易错“困扰困扰”的根源和解决方案的根源和解决方案内容提要oRefViz简介、作用、适用人群oRefViz工作原理o软件下载与安装o主界面介绍o从EndNote、Reference Manager无缝导入数据o关键词分析o其他功能(同义词定义工具)o上机实习o小结1.1 RefViz简介oRefViz 是由是由 Thomson 公司和公司和 ominiviz 公司公司合作开发用于文献信息分析的软件。
合作开发用于文献信息分析的软件o网络可以帮助我们获取大量的信息,当信息多到一网络可以帮助我们获取大量的信息,当信息多到一定的程度的时候,我们不可能逐一阅读;另外,即定的程度的时候,我们不可能逐一阅读;另外,即使文献的数量不是太多,可以阅读,也会耗费大量使文献的数量不是太多,可以阅读,也会耗费大量的时间,同时也会大幅降低我们获取信息的效率的时间,同时也会大幅降低我们获取信息的效率o怎样从这些信息中快速找到相关的信息,怎样快速怎样从这些信息中快速找到相关的信息,怎样快速把握这些信息的主要内容,是当今每位科研工作者把握这些信息的主要内容,是当今每位科研工作者都面临的问题都面临的问题1.2 RefViz的作用oRefViz 可以帮助我们分析、组织和管理大量的文可以帮助我们分析、组织和管理大量的文献通过采取与我们阅读文献类似的方式:通读所献通过采取与我们阅读文献类似的方式:通读所有文献、找出关键信息,然后进行归类,并以有文献、找出关键信息,然后进行归类,并以可视可视化的图形方式化的图形方式将归类的结果展示出来将归类的结果展示出来o可以帮助我们发现研究热点,找出文献间的相互关可以帮助我们发现研究热点,找出文献间的相互关系,快速了解某一领域的整体情况等。
系,快速了解某一领域的整体情况等o可以帮助我们确定研究方向,开拓研究思路,寻找可以帮助我们确定研究方向,开拓研究思路,寻找新的解决方案和突破口等新的解决方案和突破口等o不管你是初涉科研的学生,还是一位资深的研究人不管你是初涉科研的学生,还是一位资深的研究人员,我们都建议你去学习和掌握这款软件它可以员,我们都建议你去学习和掌握这款软件它可以帮助你快速处理海量信息,让你在竞争中领先一步帮助你快速处理海量信息,让你在竞争中领先一步 1.3 RefViz的适用人群o第一次接触陌生课题第一次接触陌生课题o研究生撰写开题报告研究生撰写开题报告o老板突发奇想,让我们做一些老板突发奇想,让我们做一些“开创性的工作开创性的工作”o平时有文献管理需求的师生平时有文献管理需求的师生o想要读博或继续深造的师生想要读博或继续深造的师生o不想淹没在科研大军中,一辈子不想淹没在科研大军中,一辈子 “默默无闻默默无闻”,如何出,如何出奇制胜,增加文章的被引次数,投稿到影响因子较高的期奇制胜,增加文章的被引次数,投稿到影响因子较高的期刊刊o……2.1 RefViz工作原理o与平时阅读文献的过程类似,与平时阅读文献的过程类似,reading-finding-dividingo并不是单纯通过词频来统计,而是通过一种并不是单纯通过词频来统计,而是通过一种数学模式找出哪些词是最重要的,哪些是次数学模式找出哪些词是最重要的,哪些是次重要的,哪些是无关紧要的,然后利用这两重要的,哪些是无关紧要的,然后利用这两种词对每篇文章进行标识,再通过标准的聚种词对每篇文章进行标识,再通过标准的聚类方法将这批文献分成若干组类方法将这批文献分成若干组(Group)2.2 RefViz的软件架构2.3 RefViz能告诉我们什么?o通过图示的方式将这些组的文献根据相互间通过图示的方式将这些组的文献根据相互间的关系呈现出来,每个文件夹图标表示一组的关系呈现出来,每个文件夹图标表示一组文献,每组文献之间根据相互的类似程度进文献,每组文献之间根据相互的类似程度进行排列行排列o图标的大小代表文章数的多少,分布的位置图标的大小代表文章数的多少,分布的位置靠得越近,内容越相似;文件夹越密集,说靠得越近,内容越相似;文件夹越密集,说明这些方面的文献越多,是这批文献中研究明这些方面的文献越多,是这批文献中研究的热点方向的热点方向Galaxy图示Pop-up浮动窗口3 软件下载与安装oEndNote X4超级试用版oRefViz 2.1超级试用版o安装运行比较简单,从网站(http://www.RefV)下载试用版,或购买正式版,点击RVINSTALL.EXE即可进行安装。
o第一次运行会提醒你输入序列号4 RefViz主界面介绍o第一次运行软件,程序会自动打开第一次运行软件,程序会自动打开sampleview的文件的文件o主界面分为四部分:主界面分为四部分:Ø1—显示分析结果的窗口,有两种视图显示方式,显示分析结果的窗口,有两种视图显示方式,Galaxy视图和视图和Matrix视图视图Ø2—topic区域,从左往右是区域,从左往右是major topic、、minor topic、、descriptive termsØ3—当前选择的所有文献列表当前选择的所有文献列表Ø4—软件的提示区域,帮助信息软件的提示区域,帮助信息5.1 三种来源文献的分析o执行联网检索执行联网检索 File-new view->create new view->searching datebase(s) using reference retrievero直接分析文献管理软件中的数据库直接分析文献管理软件中的数据库(推荐推荐) EndNote 7以上的版本、以上的版本、Reference Manager 11以上的版本以上的版本o利用文件进行分析利用文件进行分析 File-new view->create new view-> Using reference file(s)选择预存的文件选择预存的文件从EN或RM无缝导入数据oRefViz 可以实现与Endnote 和RM 的无缝连接,即我们可以将手头的 Endnote 数据库和RM 数据库直接导入。
oRefViz 的PDF Help 中介绍了通过下载多种数据库文件后建库的方法,不再赘述从EN或RM无缝导入数据o这里介绍一下与参考文献管理软件之间嵌入的方法o在 RM 或Endnote 的安装目录下,均有一个文件Configure DataViz.exe,运行此文件后,按照Wizard 的提示,找到 RefViz 安装目录下的RefViz.exe 文件,然后按照提示就可建立链接o打开RM,可以看到工具栏中已经出现RefViz 的链接工具,点击该工具栏,RefViz会开始自动建立相关数据库(注意此时新建的数据库自动保存在X:\RefViz\datasets文件夹中)o此外,可以通过导出RM 或Endnote 数据库为RIS 格式的文本文档,然后在RefViz 中导入 方法一:在方法一:在EndNote(版本版本7以前以前)文件下,找到文件下,找到Configure DataViz.exe,然后按照提示建立,然后按照提示建立链接链接方法二:方法二:EndNote X4->Tools->Data Visualization5.2 视图创建的过程o词库的创建词库的创建Ø移除终止词移除终止词(about/either/also/very/who/these等等)Ø安装目录下安装目录下stopwords文件夹,文件夹,default.stop.txt是设置终止词的默认文是设置终止词的默认文件,一行一词件,一行一词o主词提取主词提取Ø计算不同词的权重,确定主词和辅词计算不同词的权重,确定主词和辅词Ø分辨同义词,识别主词之间的相互关系分辨同义词,识别主词之间的相互关系Ø主词仅由标题和摘要中的词决定,若无摘要则调用主词仅由标题和摘要中的词决定,若无摘要则调用Notes中的内容中的内容Ø作者不会出现在主词中作者不会出现在主词中o创建文件组创建文件组(根据标准聚类分析的方法创建文献组根据标准聚类分析的方法创建文献组)o视图展示视图展示(根据文献亲近关系,排列在根据文献亲近关系,排列在Galaxy视视图和图和Matrix视图中视图中)5.2.1 Galaxy视图o打开打开Galaxy视图视图oGalaxy视图中的信息视图中的信息oGalaxy视图中的操作视图中的操作Ø选择文献和文献组选择文献和文献组(Edit->Select All、、Ctrl+A)Ø取消选择取消选择(Edit->Clear Selections、、Ctrl)Ø显示文献和文献组信息显示文献和文献组信息Ø基本操作基本操作(移动、放大缩小、全窗口、复位到初始状态移动、放大缩小、全窗口、复位到初始状态)Ø利用利用Galaxy视图挖掘信息视图挖掘信息Ø创建子视图创建子视图(File->Create Subset View)Ø反选除掉边缘文献反选除掉边缘文献(Edit->invert selections)Ø直接检索直接检索(topic窗口,窗口,search tool)Ø直接阅读文献信息直接阅读文献信息(reference viewer窗口,双击打开详细信息窗口,双击打开详细信息)p个性化设置个性化设置(Edit->Preferences,设置,设置Galaxy视图的颜色视图的颜色)5.2.2 Matrix视图oMatrix视图显示的是文献组与主词或主词与主词之间的相互关系o列总是代表主词,而行既可以代表文献组也可以代表主词o可以快速了解到主词在不同组中被讨论的情况,快速发现哪些概念通常在一起讨论,哪些概念之间有相似性等5.2.2 Matrix视图o当行代表文献组时当行代表文献组时(默认设置默认设置),,Matrix视图提供视图提供的信息是每个概念会在哪些组中被讨论的信息是每个概念会在哪些组中被讨论o可以选择颜色代表相关性,也可以用颜色代表文献可以选择颜色代表相关性,也可以用颜色代表文献的数量的数量o默认设置用颜色代表相关性,即主词与每组所有文默认设置用颜色代表相关性,即主词与每组所有文献之间或主词之间相关联的程度献之间或主词之间相关联的程度o红色表示关联性强,蓝色表示没有关联红色表示关联性强,蓝色表示没有关联o如果用颜色表示数量,则白色表示零,黑色表示最如果用颜色表示数量,则白色表示零,黑色表示最大。
白色表示没有相关性,黑色表示强相关性大白色表示没有相关性,黑色表示强相关性5.2.2 Matrix视图oMatrix视图的排序oMatrix视图的操作o利用指示窗浏览Matrix视图o判断行列主题间的相关性6.1 RefViz的其它功能o分类之后,还可以通过一系列的工具去影响它的分类,如通过调整major topic,或者定义同义词thesaurus等,可实现交互式的分类o也可以通过辅助工具找出某些概念之间的相互关系,以及与某篇文章相关的其它文献等6.2 RefViz的其它功能o主词工具主词工具(topic tool)Ø通过主词影响文献分类通过主词影响文献分类o搜索工具搜索工具(search tool)Ø如何进行检索如何进行检索Ø快速检索快速检索(quick search)o同义词同义词(tool->thesaurus)Ø终止词和其它词汇终止词和其它词汇同义词定义工具例1:利用RefViz分析“转基因食品”的研究趋势7.1 实例演示(I)1. 从EndNote中导入题录Note:可能有部分文献因无题名或无摘要而无法导入(默认设置,View Creation Preferences中可修改)导入完成后,进入RefViz1975-2011年转基因食品研究趋势1975-1999年年1975-2009年年1975-2011年年例2:利用RefViz分析SELEX的发展趋势7.2 实例演示(II)例2结果解读o由上图中可以看出,红色椭圆选中的区域是 2007 年明显占优势的区域,2007 年在该领域发表的文章远远超过了 1992-2006年文章的总和。
o分别查看红色框中的主题词分布和所有文献的主题词分布,如下图所示: 例2:利用RefViz分析SELEX的发展趋势例2结果解读o比较排列在前面的主词,可以发现 2007 年排在 1、2 位的主词在所有文献中分列 3、1位,变化不大;2007 年排在 3、4 位的主词,在所有文献中列在 11、12 位,有较大提前;比较明显的变化是 2007 年排在第五位的 detection,在所有主词中排在很靠后的位置;这表明 detection 是 2007 年这些文献中的一个热点进一步查看文献信息发现 2007 年发表的文章中有相当大的一部分是关于检测(detection)的 o可以通过以下途径验证以上判断,分别检索 2007 年发表的文章共 181 篇,所有关于detection 的文章 81 篇,包含 detection 或2007 年发表的文章共计 215 篇,由此可以得出 2007年发表的关于 detection 的文章有 181+81-215=47 篇,占 47/81=58%,即关于 detection 的文章 2007 年发表的文章占总 detection文章数的 58% o所以通过以上途径,我们可以很快把握科学发展的动向。
知道哪些是当前比较热门的方向,从而为自己确定研究方向服务 8 小结oRefViz简介、工作原理、软件下载与安装简介、工作原理、软件下载与安装o主界面介绍主界面介绍o三种来源文献的分析及其视图创建的过程三种来源文献的分析及其视图创建的过程oRefViz其它功能其它功能o2个实例的演示个实例的演示o答疑答疑o上机实习上机实习谢谢!欢迎大家继续关注文献管理软件系列讲座7005128@.com。












