h指数研究及应用概述.doc
11页刘合艳巴房俊民I,苑彬成(1 •中国科学院国家科学图书馆成都分馆,四川成都610041; 2. 中国科学院 研究生院,北京100080)H指数研究及应用概述摘要:本文从指数的改进和应用两个角度阐述了 H指数的研究和发展现状,总结了用H指数进行实证分析的步骤,指岀了 H指数今后可能的研究和应用重点,以期为H指数的继续发展和应用提供借鉴和参考II指数;计量指标;文献计量学Abstracts: This articlc expatiates the research and dcvclopmcnt status of H-index from the index improvement and eipplication perspective^ sums up the steps of empirical analysis, points out the future research and application focus for H-index, with a view to provide reference for the successive development and application of H-index.Keywords: II-index; bibliometric index; Bibliometrics2005年,美国物理学家J. E. Hirsch[1]提出了一个测度科学家个人科研成绩的 新指标——H指数。
H指数将数量和质量很好地结合起来,在讲质量的基础上求 数量,可以遏制片面追求论文数量的不良倾向,同时又能够激发科研人员探索深 层次科学问题的激情⑵这篇关于H指数的文章的发表引起了文献计量学家的强 烈反响国内外学者们围绕H指数的优点、缺点、有效性、指数改进、应用等开 展了一系列研究目前,对于H-index的理论和应用研究已经成为信息计量学领 域的研究热点之一1 H指数概述1.1 H指数的定义J. E. Hirsch提出H指数时,将H指数定义⑷为:“在一个科学家发表的叫篇 文章中,如果有h篇的被引次数都大于等于h,而其他(Np-h)篇被引频次都小 于等于h,那么他(她)的指数值为hRonald Rousseau随后从操作层面上给出了 H指数的定义叫 以科学家S发 表的论文(包括合作论文)为例,将其论文按照引文数从高到低的顺序排列,相 同引文数的论文具有不同的序列号(对此并没有严格限制,最好按照时间倒序排 列),当且仅当排序前h篇论文每篇论文的引文数至少为h,同吋排序第h+1篇 论文的引文数严格小于h+1时则科学家S的Hirsch指数为Ho1.2 H指数的特点从H指数定义中,可以明显看出H指数的一大特点:它包含了科学家的论文 数和引文量两个因索,并有效地将两者结合起来。
从理论上讲,这要比单纯的数 量类指标(如论文总数)和质量类指标(如总被引次数、平均被引次数等)更为 全面地反映科学家的科研成就的犬小其次,H指数计算简单方便,只需将论文被引次数按从高到低排列,往下核 对,直到某篇论文的序号大于该论文被引次数,那个序号减去1就是II指数再次,H指数对高被引和低被引文章均不敏感,对单纯论文数量增长也不敏 感H指数对低被引文章和单纯的论文数量的增长不敏感,这是H指数设计的一 大优点,避免了对发表了大量低水平文章的科学家的过高评价而H指数对高被 引文章也不敏感,而这显然是不合理的最后,从指数变化上看,H指数随吋间而增长,不会出现下降的情况H指 数的增t有两种情况:一是增长主要靠以前发表的论文不断获得引用,没有或者 很少出现新的被引用量较高的论文二是大量新的高被引文章的出现促进的II 指数增长,这种情况是我们希望看到的从上面分析可以看出,H指数在科研评价上有着明显的优点,但同时也不可 避免地存在着一些问题针对H指数可能存在的一个或者多个缺陷,学者们从不 同的角度提出了一些H指数的衍生指数下面对一些重要的H指数衍生指数进行 总结并对其相关性进行阐述2 H指数的衍生指数及相关性2.1 G指数、W指数、H⑵指数1)G指数H指数对低被引文章和少数几篇很高被引的文章都不敏感。
Egghe认为,对 低被引文章不敏感,这是H指数的优点,但是它应该对高被引文章敏感根据H 指数的定义可知,一旦一篇文章按被引次数排名在前H篇文章之中,那么它的被 引用量保持不变或者成倍增长,都已不再重要,都不会对以后计算的H指数值产 生任何影响Egghc认为,度量指标应当反映出这些高被引论文针对这一问题, 2006年,Egghe提出了 G指数⑷,定义为:论文按被引次数排序后相对排前的 累积被引至少才次的最大论文序次g,亦即第(g+1)序次论文对应的累积引文数 将小于3+1尸从定义町以看出,G 2 H,而按被引量排序靠前的文章的被引次 数越大,G指数越大2) W指数2008年,中国科大管理学院副教授吴强博士提出W指数⑸,对II指数进行了 重要改进定义为:一个科学家的w值,等于当且仅当在他/她发表的论文中有w 篇论文每篇获得了不少于lOw次的引文数,而其余每篇论文的引文数都小于10(\v+l)W指数在继承H指数简洁易懂特点的同时,更关注高引用次数的论文, 能更准确地反映出一个科学家代表作的综合影响力,而且减少了一定量的信息挖 掘时间3) II⑵指数和II (x)指数2006年,Marek Kosmulski提出了 H(2)指数⑹,定义为:使得被引频次最高 的H(2)篇文章毎篇被引次数至少为[H(2T]次的最大的口然数。
与G指数和W指 数一样,它给高被引文章以更大权重Kosmulski考虑到了一个在指数计算过程 中都会碰到的问题——作者身份的确认,而这是一项非常费吋的工作H指数计 算时需要进行的作者身份的确认比计算总被引次数时少很多,而这也是H指数的 优势之一很明显,H(2)值要比H指数值小,计算H(2)指数时确认作者身份的 工作量要比计算II指数时少,Kosmulski认为,这是11(2)的优势所在此外,他 还将H(2)-般化,提出了 H(x)指数,定义为使得被引频次最高的H(x)篇文章毎 篇被引次数至少为[H(x)2]次的最大的自然数2.2建立在“Hirsch核心”基础上的改进指数1) R指数、AR指数、A指数金碧辉、Rousseau Ronald等引入"H核(Hirsch core) ”⑶的概念,即被 引量排序前II的论文形成II核并基于II核,针对II指数在科学家个人科研绩效 评价中的三个缺陷,即缺乏灵敏度,缺乏区分度,缺乏波动性,提出了 A指数、 R指数和AR指数⑺等R=红眄,比i表示绩效核内第j篇论文的被引频次R即为H指数划定 的绩效核内的论文的引文数的和的平方根作者指出,H指数只给出了论文数量 与被引频次数量相交叉的阈值,而没有对阈值内绩效核的不同强度作进一步的测 定。
R指数对H指数无力染指的h核进行了强度的测量,解决了H指数对绩效核 内的变化缺乏灵敏度的问题⑺AR;臨晋,其中円为论文j的发表年龄AR指数随时间变化会上升或者 下降,解决了 H指数只升不降的问题即为绩效核内论文被引用量的平均值■ ■2) m指数Lutz Bornmann等⑻在"H核”概念的基础上,提出了 m指数的概念m指数 即为H核内被引量的中值2.3乩指数用H指数评价普通科研工作者时,常常会由于各个被评价人的分值聚集在一 些较低的分值上,而无法实现评价口标,为克服这一局限,张学梅对H指数进行 了修正,提出了比指数叫HfH+严,快为某作者的总被引次数使用比指数 评价作者时,由于绝人多数情况下能够给每位作者一个独特的分值,所以在评价 普通学者时也能收到良好的效果只有比指数和总被引次数都相同的两个 人,才能得到相同的比指数,这时可认为他们各自的业绩是不分上下的2.4考虑科学家科研时间长短的指数1) H指数序列和H指数矩阵H指数不能反映出科学家从事科研时间长短的差界,针对此,Liming Liang 引入了 H指数序列和H指数矩阵他的概念,从而能够揭示出H指数的不同的增 长模式和增长机制,并使得从事科研吋间不同的科学家间可以进行比较。
H指数 序列是指由某科学家的不同时间区间的H指数组成的序列,比如,基于某科学家 2004年发表的文章数量和文章发表后获得的引用次数,得到H1,而基于2003 年到2004年发表的文章数量和文章发表后获得的引用次数,得到112,依次类推, 从作者发表笫一篇文章开始到2004年,基于其文章数量和引用次数,得到比, 而Hl、H2、……、比就组成了该科学家的II指数序列将多位科学家的II指数 序列根据年代区间排列在一起,就形成了 H指数矩阵2) m商为了消除科学家科研生涯的时间长度对H值的影响Hirsch捉出了 m商⑴, m商二包,其中,h即代表H指数值,y指从发表第一篇文章以来的年数m商根据 y科学家从事学术生涯的年份对H指数进行划分,从而解决了 H指数的大小与科学 家从事学术研究的时间长短直接关联的问题通过比较m值的大小,就可以对科 研生涯时间不同的科学家进行评价22.5乩指数——针对不同领域可比性提出的指数H指数具冇很强的学科性,不同学科领威H指数差异很大,针对此,Pablo D. Batista提出了 H】指数问已二用/汕⑴,其中汕⑴指H篇文章的作者的总数 当科学家独自发表了这H篇文章吋,他(她)有讯篇文章至少被引用了 Hi次。
与H指数相比,此指数使得不同学科领域间可以进行比较综上所述,H指数提出后,众多学者从不同角度提HITH指数衍生指数那 么,H指数及其众多衍生指数的相互关系如何,这些衍生指数是否在H指数基础 上有所改进呢? Bornmann[s]对此进彳亍了实证研究和分析通过对693名申请徳国 海德堡欧洲分子生物学研究机构的长期奖学金项目的中请人H指数和儿种重要 的H指数的衍生指数进行分析,Bornmann试图发现这些指数是否在原先的H指 数基础上冇所改进,尤其是考察他们准确预测同行评估结果的能力结果,他发 现存在两种基木类型的指数:第一种是能够更好地反映核心作詁集的数量的指 数,包括H指数、ni商、G指数、H(2)指数;第二种是能够更好地反映核心作品 集的影响力的指数,包括A、叭R、AR等指数所谓核心作品集是指落入到II 指数范围的文章而回归分析的结果显示“反映核心作品集的影响力的指数”能 够比“反映核心作品集的数量的指数”更好地预测同行评议的结果两种类型的指数代表了科学家研究产出的不同维度,但是他们却能够很好地 相互补充研究表明,从每一类别中分别选择一个指数,将两者结合来进行科 研评价更为合理⑻3 H指数应用3.1个人或团体学术成果评价1) 个人学术成就评价J. E. Hirsch提出H指数的初衷便是对于科研人员个人科研成就进行评价, 在文章中,他对物理学家的H指数进行研究,发现H指数可以作为科学家科研成 就评价的一个有用的标尺。
并11他预计,对于某位科学家,其H指数随着吋间变 化会呈现近似线性的增长趋势在文章最后,他测算了生物学和生物医学领域科 学家的H指数,他同时发现,该领域科学家的H指数要远远大于物理学领域科学 家的II指数另外,在两个领域科学家的II指数分布中,高端值的差异要大于 整体均值的井界Hirsch指出,对不同学科领域H指数分布并界性和和似性的 比较将成为今后研究的一个热点⑴此后,又冇许多学者利用H指数对其他一些领域科研人员进行了评价 OppenHeim将H指数应用于英国图书情报学领域-些资深专家的评价呵许新军 用H指数对国内39位经济学领威高被引学者进行了绩效评价I⑷在对II指数随时间变化的趋势的研究方面,张哓阳和金碧辉以TSIIIighl。





