学术研究团队合作情况的可视化研究.docx
10页学术研究团队合作情况的可视化研究林思成081111282011年5月26日【摘要】随着科学技术的迅速发展以与科学合作的日益频繁,社会对学术研究团队的评估与监测显得更为重要因此本文基于数据挖掘和社会网络分析技术对学术研究团队提出了一种可视化的识别与评估方法,将数据获取、数据挖掘以与可视化分析三者有机的结合在了一起,并且以XX维普数据库核心期刊中关键词为“技术创新扩散”的论文为例对此方法的可行性和有效性进行了验证,实现了对学术团队识别与评估的可视化和科学化关键词】学术研究团队可视化研究 数据挖掘 社会网络分析 技术创新扩散1. 研究设计1.1 研究方法 因为科技论文都具备篇名、作者、机构、摘要、关键词等基本要素,而且由于科学合作的结果一般也都会以合作研究者共同署名在学术期刊上发表论文的形式体现出来,因此通过在XX维普数据库核心期刊中以关键词“技术创新扩散”、时间段“2000-2011年”检索论文,并对论文作者和机构的统计分析,可以得到在目标时段该领域研究的主要作者、机构以与他们的合作情况再经过可视化软件netdraw处理之后进一步得到他们直接的各种特点和关联1.2 研究流程本文提出的研究方法可以分成以下几个步骤:(1) 数据收集。
在明确了研究目标的基础上,选取XX维普数据库获得数据2) 数据预处理这一阶段主要是将收集到的数据转化成能够被可视化软件识别的格式,以便进行更深入的分析3) 绘制图谱将获得的数据通过可视化软件绘制成图形,从而方便研究者的分析以与读者的理解4) 数据筛选将不符合我们研究需要的数据剔除,使图形能够更多的反映我们研究目标的特点5) 研究结论根据研究目的,用可视化软件对数据进行分析的基础下得出的一般性结论以与我们发现的一些新的特性1.3 研究中的关键技术要对检索到的论文的作者与机构的合作情况进行评估与监测,需要通过数据获取、数据挖掘以与可视化等步骤由于展示大量合作情况的背后不易采用一般方法来表现,将计算机的高效计算能力与人类的认知能力结合起来变得尤为重要本文之中最为关键的就是借助社会网络分析技术,并在可视化软件netdraw的处理下,将作者、机构的合作情况以可视化的形式呈现出来 下图(图1)为我们展示了一个用社会网络分析的方法得到的作者合作情况的可视化图形图1 论文作者合作关系图 图1中,结点代表的是作者,旁边的数字代表其所写的论文数,结点越大说明作者发表的论文数越多,结点之间的连线代表两个作者合作发表过论文,其中线条的粗细说明了合作的强度,线越粗,说明合作次数越多。
图中左边孤立的点,虽然该作者写了两篇论文,但是该作者未跟其他作者有过合作经历1.4 研究视角本文将着眼于科研合作网络规模的大小以与他们各成员之间的关系;他们的主要带头人与其特征;论文产量以与团队合作密切程度几个方面进行分析和研究2. 案例:以XX维普数据库核心期刊中关键词为“技术创新扩散”的论文为例2.1 数据来源本文研究数据来源于XX维普数据库核心期刊中2000-2011年度以关键词为“技术创新扩散”检索的论文于2011年5月21日,经检索共得到98篇论文的详细信息,包括论文题名、作者、刊名、机构、文摘、ISSN、CN号、关键词、分类号、馆藏号等据初步统计,这98篇论文中,共出现了140个作者其中,没有与其他作者合作过的作者有15个(显然,这不排除他们和除图中140个作者以外的作者合作过,下同),只与单个作者合作过的作者有56个把下载得到的作者目录的格式修改为可被可视化程序netdraw读取的格式,然后绘制如下(图2)的关系图 图2 作者初始关系图通过图2我们能看到有不少作者没有和其他作者合作过在图2中,这些作者属单点型子网(排在图2左上部分),可能他们的水平不是很高,也有可能他们的课题没有能激起他人的研究兴趣。
2.2 合作关系网由于本文重点在于研究学术团队之间合作的密切程度,而图2又过于复杂,不便于我们的观察和理解,因此我们需要剔除单个作者发表论文的情况,无论他发表过多少篇文章,也与我们的研究目的不符之后我们得到如下图(图3)所示的部分图3 初步筛选后的合作关系网2.12.22.3 学术研究团体合作网为了进一步反应作者间的合作情况,我们认为那些只有两个作者且这两个作者发表论文数为一且合作次数也只有一次的情况不重要,于是再将其剔除,这样一共得到了77位作者,这样我们就得到下图(图4) 图4学术研究团体合作网 图4中的每一个结点代表一个作者,结点越大说明该作者发表的论文越多,结点之间的连线代表两个作者合作发表过论文,其中线条的粗细说明了合作的强度,线越粗,说明合作次数越多,反之则合作次数越少 由图4可以看出:(1) 在统计期间发表论文数超过2(不包含2)的作者有潘成华、万谦、胡宝民、汤长安、路小成、罗新星、康凯、徐玖平等2) 较典型的两人合作型子网有X颖和段维平,李同升和X笑明等3) 较典型的三人合作型子网有X小斌、罗建强和韩玉启,曹兴、徐磊和汤长安,路小成、杜静和罗新星,X志颖、康凯和苏建旭等。
4) 人数较多的合作网络有XX工业大学和XX农业大学,其中XX工业大学子网中的主要成员有胡宝民、X秀新、康凯、X志颖、苏建旭、王丽丽、李子彪、于新凯等,XX农业大学子网中的主要成员有马永青、X志鹏、陈曦、杨忠娜、陶佩君、X淑云、X月辰等2.4 主要研究机构的合作网把下载得到的机构目录的格式稍作修改,并将其用可视化程序netdraw展示出如下(图5)的关系图 图5 机构初始关系图 从图5中我们能看到大多数的机构并未与其他机构在我们研究的X围内有所合作,这些机构属于单点型子网(排在图中左侧部分)显然,由于图5过于复杂,不便于我们对机构间合作情况的进一步分析和研究,于是我们根据不同的研究目标对图5进行过滤、切割、放大等处理比如为了简化图5,可以先将单点型子网删除掉,这样就得到了图6与图7 图6 机构合作关系图(机构名) 图7 机构合作关系图(论文数) 由图6、7我们不难发现还是有很多机构属于双机构合作型子网,并且只有过一次合作且两机构都只出过一篇论文的占了双机构合作型子网的2/3因此,为了更好的反映机构之间合作的密切程度,我们将只有一次合作的双机构型合作子网也剔除掉,得到如下图(图8)所示的合作网 图8 主要机构的合作网由图8可以看出:(1) 在统计期间发表论文数超过2(不包含2)的机构有中南大学商学院、XX商学院、西北大学城市与资源系、XX石油大学人文学院、XX工业大学管理学院、XX大学工商管理学院XX农业大学农学院。
2) 较典型的双机构合作型子网有中南大学商学院和XX商学院,西北大学城市与资源系和XX石油大学人文学院等3) 涉与较多机构参与合作的一个合作子网里有XX农业大学农学院、XX农业大学人文学院、XX农业大学科技管理处、XX大学管理学院、XX广播电视大学经管学院等2.5 参与合作活跃的作者与机构结合图4和图8,我们发现两个合作子网的合作密切度比较高,他们分别由两位核心作者组成,见下图(图9) 图9 两个有核心作者的合作群落 这两个合作子网的共同点在于社团网络基本成中心辐射型,并且处在中心的核心作者都是高产作者不同点在于胡宝民合作子网中的其他几位作者之间也有关联,但徐玖平合作子网中的其他几位作者之间却没有任何联系于是我推断胡宝民是一位资深学者,在我们检索的领域具有比较高的威望,能够吸引许多研究者与之合作,而且时常有规模比较大(大于两人)的合作发表论文而徐玖平可能是一位硕导或者博导,他所带的研究生可能经常涉与类似课题,而且研究生论文的作者一般都只有导师和自己事实验证了我的推断,通过网络我们发现胡宝民所在的机构为XX工业大学,他曾在1999年9月破格晋升为教授,是一位在“追赶与创新系统管理”领域有着突出贡献的学者。
自2000年以来,他作为项目负责人,先后完成了XX省自然科学基金、XX省社会科学基金、XX省科学技术研究与发展计划和XX省教育厅科研计划项目共计19项,这充分说明了与他合作的机构很是广泛,也就是说,与胡宝民合作发表论文的作者很有可能同时有几个或者其他作者有时撇开胡宝民相互合作的但是胡宝民所在的XX工业大学并不是与其他机构密切合作的,这是因为胡宝民常常只有在与本校学者共同发表论文的时候才注明所属机构,他与其他机构合作时常常都是以个人的名义参与的,故XX工业大学并非是一个与其他机构合作密切的单位而另外一个合作子网的核心作者徐玖平,是XX大学的教授、博导,虽然也在很多机构兼有职位,但是从他的主要事迹中,我发现了一条“为研究生、本科生讲授不同类别课程60余门;编著的《管理经济学》、《管理运筹学》著作被评列为国家十一五规划教材,并被评为国家精品教材;1994年至今为国家培养应用数学、运筹学与控制论、管理科学、技术经济与管理等专业的硕、博士200余名他指导过如此多的研究生,而研究生论文不得抄袭,这也也就很容易解释为什么在我们检索的领域中与他合作发表论文的其他作者之间为什么没有关联了徐玖平的合作对象也往往都是本校的研究生,因此XX大学也不是常常与其他机构合作。
下面我们来分析一下涉与较多机构参与合作的那个合作子网,如下图(图10)所示 图10 合作最为密切的子网我们发现,这个子网中有3个机构都属于XX农业大学,只是三个不同部门,于是我们将属于XX农业大学的作者列出来,他们分别是:马永青(1篇)、X志鹏(1篇)、X月辰(1篇)、杨忠娜(2篇)、陶佩君(2篇)、陈曦(2篇)、X淑云(1篇),他们虽然每个人写的论文不多,但是我们借助网络发现这个学校本身就与很多个机构有着合作协议,也就是说,这所学校比较推崇合作研究,也就解释了为什么XX农业大学在我们检索的领域中最为活跃3. 进一步的小结和讨论对学术研究团队合作情况进行可视化的识别、评估和监测等研究有着多方面的意义比如,就教育部而言,它可以帮助我们选择那些结构合理、论文产出较高的学术研究团队,对他们加以扶持、培养;就学术同行而言,它可以帮助我们与时跟踪他们所关注的课题,同行团队成员的结构组成以与不同学科之间科研合作的模式;就读者而言,他还可以帮助我们研究学科之间的关系和发现那些跨学科的作者本研究通过把数据获取、数据挖掘以与可视化分析在社会网络分析的技术下有机的融为了一体,初步建立了基于科技文献数据库数据挖掘和社会网络分析技术的科研合作网络的可视化研究方法。
本研究的局限在于:结果完全来自于对所选文献的数据挖掘,显然这样的研究结果会随着所选择期刊以与统计时间等的不同而产生一些变化,例如本次检索在2011年5月21日检索得到98篇论文,而在2011年5月26日的时候检索得到的已是99篇了另外本文的案例分析中也没有进一步对作者署名次序的不同以与文献质量的不同进行区分显然,如果能构建起一套能自动、高效、与时地跟踪并监测这种科研合作网的理论、方法和技术,然后将这些数据挖掘的结果和可视化图形进一步同专家对上述这些问题的分析判断结合起来,就可以取得更好的效果参考文献】[1] 汤建民. 《情报学报》学术研究团队的可视化识别与评估方法研究:以科学。

卡西欧5800p使用说明书资料.ppt
锂金属电池界面稳定化-全面剖析.docx
SG3525斩控式单相交流调压电路设计要点.doc
话剧《枕头人》剧本.docx
重视家风建设全面从严治党治家应成为领导干部必修课PPT模板.pptx
黄渤海区拖网渔具综合调查分析.docx
2024年一级造价工程师考试《建设工程技术与计量(交通运输工程)-公路篇》真题及答案.docx
【课件】Unit+3+Reading+and+Thinking公开课课件人教版(2019)必修第一册.pptx
嵌入式软件开发流程566841551.doc
生命密码PPT课件.ppt
爱与责任-师德之魂.ppt
制冷空调装置自动控制技术讲义.ppt


