博卉网 | 知识让人进步-every thing

顶级研究成果为何外流美国? 被操纵的“影响因子

原创版权 文化纵横公众号作者: 字体大小选择: [ ]

长期以来,以“影响因子”为学术价值衡量标准的风气,在学术界十分盛行,人们对一风气也诟病已久,争议主要集中在“SCI和影响因子是否合理”和“不依赖SCI和影响因子,我们能依赖什么”两个问题上。在本文作者看来,以上两个问题都偏离了要点,真正重要的是追问:为什么我们最优秀的科研成果不能在本国的学术期刊上发表?

  【导读】长期以来,以“影响因子”为学术价值衡量标准的风气,在学术界十分盛行,人们对一风气也诟病已久,争议主要集中在“SCI和影响因子是否合理”和“不依赖SCI和影响因子,我们能依赖什么”两个问题上。在本文作者看来,以上两个问题都偏离了要点,真正重要的是追问:为什么我们最优秀的科研成果不能在本国的学术期刊上发表?

  作者指出,“影响因子”游戏所影响的世界分为三个部分:美国和英语西方国家是最大的获利者,他们在权威期刊评价体系中占尽先机,坐拥市场暴利;非英语的西方国家是游戏的小玩家或旁观者,玩不玩这一游戏都无所谓;而中国和其他发展中国家却由于盲目的“影响因子”崇拜,正在陷入一场巨大的学术灾难。崇拜的根源,是第三世界的科技管理者普遍希望本国科学界在西方主导的世界里“跟得上趟”,因此鼓励、甚至催促本国科学家们在“国际顶级科学期刊”上多发文章。

  这给发展中国家造成了三种严重的学术灾难:一是本国最新、最顶级的科研成果,首先被用英文写成,提升了美国和英语西方国家的杂志质量,却不能及时被本国公众接触、了解和应用;二是不利于本国期刊的发展,本国学术杂志由于长期缺乏最新最好的成果刊载,而失去读者和未来更多的优秀稿件,陷入恶性循环;三是巨额的本国科研经费作为发表费用持续流向美国和英语西方国家期刊的囊中,却没有对本国科学家的国际声誉或国际交流做出实际贡献。作者认为,在这样的困境下,发展中国家要谋求真正的出路,必须另外制定一套不同于SCI和影响因子游戏的学术规则和标准,并且尽快在国内推广使用。

  本文主文部分原载《编辑学刊》2020年第3期,原标题为《为何影响因子崇拜是发展中国家的学术灾难》;延伸阅读部分原载《读书》2016年第5期和第9期。仅代表作者观点,特此编发,供诸君参考。

为何影响因子崇拜是发展中国家的学术灾难?

  (本文原载《编辑学刊》2020年第3期)

  2020年2月,教育部、科技部《关于规范高等学校SCI论文相关指标使用,树立正确评价导向的若干意见》,引爆了一波对SCI和影响因子关注的热潮。从已有的大量相关急就章来看,人们的关注点主要集中在“SCI和影响因子是否合理”和“不依赖SCI和影响因子我们能依赖什么”这两方面,而这恰恰偏离了要点。

  要点是什么呢?要点是——科学家应该将论文写在祖国大地上。此事说来话长,但其理至明,本文拟简要述之。

  SCI和影响因子游戏面对的三个世界

  首先,当然应该先解决“SCI和影响因子是否合理”这个问题。本文作者近年来的一系列工作已经集中解决了这个问题,结论基本上可以概述为:SCI和影响因子游戏并非完全不合理,但是引发的问题非常严重。

  人们当然希望决定我们应不应该依赖SCI和影响因子。不幸的是,我们无法做出“应该”或“不应该”这样简单的选择。因为SCI和影响因子游戏的合理性问题,以及它们引发的后续问题,对于世界各个部分是不一样的。

  简单来说,加菲尔德发起的SCI和影响因子游戏,面对的世界可以分成三个部分:美国和英语西方国家;非英语的西方国家;中国和其他发展中国家。

  对于美国和英语西方国家来说,SCI和影响因子游戏相当合理,虽然也存在问题,但无伤大雅,甚至只是瑕疵而已。这部分国家是SCI和影响因子游戏最大的获利者,尤其是美、英两国——美、英科学期刊不仅办刊水平一流(两国SCI期刊合计5000余种,占比超过全球一半),在权威期刊评价体系中占尽先机,学术出版巨头更是坐拥市场暴利,竞争力在全球范围遥遥领先。

  对于非英语的西方国家来说,SCI和影响因子游戏不很合理,因为这个游戏只对英文期刊开放。但由于自己已经是发达国家,所以这个游戏不让玩也无所谓。况且实在想玩也可以办些英文杂志去玩一玩,有的国家英文杂志还办得不少,比如荷兰、德国、法国、瑞典、日本等国家,尽管SCI期刊数量和美、英差距明显,但其中也有影响因子较高的期刊。这部分国家基本上可以说是SCI和影响因子游戏的小玩家或旁观者。

  而对于中国和其他发展中国家来说, SCI和影响因子游戏不仅很不合理,而且正在越来越成为一场学术灾难,科学期刊普遍处于急欲自救却不得其门径的困境中。

  发展中国家迄今为止的应对思路

  为什么是这样呢?原因很简单:第三世界的科技管理者(他们中有很大的比例是从美国和英语西方国家留学归来的),普遍希望自己的国家、自己的科学家群体在西方世界面前能够“跟得上趟”。而在SCI和影响因子游戏面前,“跟得上趟”意味着什么呢?在他们眼中有两条路:

  第一条路:自己办英文杂志,努力获得SCI和影响因子游戏的入场券,加入这个游戏并且设法取得好成绩。在实际操作中,这条路是“望山跑死马”的漫漫征途,第三世界国家新办的英文杂志要想在这条路上出人头地,几乎是不可能的任务。我们只要指出下面两点,就足以想见这条路的艰难:

  目前中国人办的英文期刊中有接近200种加入了SCI和影响因子游戏,其中影响因子最高的一种达到了17,而这已经是“史诗般的成就”,它的影响因子在第三世界国家的SCI期刊中已经是一骑绝尘了。但是现今全球9000多种SCI期刊中,常年盘踞在前20名的“国际顶级科学期刊”中,目前最高的影响因子是223.68,最低的也有34.65!

  在影响因子前20名的期刊中,《自然》(Nature,目前影响因子43.07)在2019年庆祝了它创刊150周年,而《柳叶刀》(Lancet,目前影响因子59.10)在2020年迎来了它创刊200周年的庆典!如此悠久的传统和品牌,在出版资源、作者人脉、社会知名度等等方面的积累,岂是第三世界国家新办的刊物所能望其项背?

  既然第一条路漫长无际,那就剩下第二条路了:用政策鼓励、驱使自己的科学家在“国际顶级科学期刊”上发文章,发得越多越好。而这正是造成灾难的原因!

  对第三世界国家期刊的灾难性后果

  先想一想,“国际顶级科学期刊”在哪里?在SCI和影响因子游戏中,盘踞影响因子前20名的期刊已经多年不变(只是每年在影响因子前20名内排名稍有变化),其中美、英两国的期刊基本上平分天下(20家期刊中Nature及其子刊竟占了10家)。

  这个富有象征性的事实表明:几乎所有高影响因子的期刊都在美国和英语西方国家,所以第二条路实际上就是:要求本国的科学家拿着本国纳税人的钱,将在本国做出的最好的科研成果,去发表在美国和英语西方国家的杂志上。这种政策长期推行的恶果是:

  第一,本国最新、最顶级的科研成果,首先被用英文写成,用来提升美国和英语西方国家的杂志质量,推高这些杂志的影响因子,却不能及时被本国公众接触、了解和应用。比如中国作者关于在2019—2020年之交新冠肺炎疫情的论文,发表在《新英格兰医学杂志》和《柳叶刀》上,就未能被国内有关人士和媒体、公众及早注意到。

  第二,长此以往,本国的科学杂志因为缺乏最新最好的成果刊载,就更加缺乏读者,也就更加没有作者愿意将优秀稿件投给它们。本国的科学期刊将在这种恶性循环中万劫不复。

  第三,为了能够在国外高影响因子期刊上发表文章,还有巨额的本国科研经费,作为发表费用,持续流向美国和英语西方国家期刊的囊中,更不用说境外那些以骗钱为目的的“掠夺性期刊”每年骗走的巨额科研经费了——本文作者的研究表明,这些“不明不白之冤钱”既没有提高中国科学家群体的国际声誉(不损害就算万幸了),也没有起到所谓的“国际交流”的任何作用,只是给外国骗子们留下“中国人傻钱多”的恶劣印象而已。

  对此我们可以剖析在巴西——典型的发展中国家——发生的实际事例,以见一斑。

  巴西教育部的政策实例

  2009年,巴西高等教育发展联合委员会颁布实施新的学术考评制度“科技文献评级系统(QUALIS)”。官方的解释是,为了对巴西的科研项目成果展开更有效的评估。

  该“科技文献评级系统”以美国私人商业公司“科学情报研究所”(ISI,当时还在汤森路透旗下)每年发布的“期刊引用报告(JCR)”中的影响因子排名为主要标准,把巴西各学科论文发表期刊分为A、B两级共7档,每3年考评一次,用这种期刊分等的方式来评估巴西接受资助的研究项目发表成果的等级。

  2000年巴西SCI期刊有14份,2008年增加至28份,其间直到2006年,才有2份医学期刊影响因子超过1.0。在新制定的评级系统中,巴西本土医学期刊几乎全部处在最低的三个等级中(B3以下)。

  显而易见,在新的评级系统导向下,研究者为了在评估中获得高分,只能将论文投向高影响因子的欧美医学期刊,这对本来已处劣势的巴西本土医学杂志而言不啻雪上加霜,它们被推落到一个恶性循环之中:由于在本国的分级体系中处于“垫底”位置,杂志肯定得不到优质的论文稿源;没有优质稿源,杂志的地位就会进一步下降……如此循环往复,本土期刊还有出头之日吗?

  巴西教委官方则表示,他们已经考虑到了这一后果,并且已有相应的弥补措施,措施竟是这样的:设置各个等级之间的换算:2篇B1论文=1.2篇A1论文,1篇B1+1篇A2论文=1.4篇A1论文,3篇B2论文=1.2篇A1论文……如此等等。但这种换算关系,进一步强调了巴西本土科学期刊的“劣等刊物”身份,完全是对巴西本土期刊的制度性羞辱。

  巴西“科技文献评级系统”一颁行,立刻引发巴西科学期刊主编们的集体抗议。他们认为教育部把影响因子作为考评标准,是极为武断粗暴的做法,根本不考虑巴西本土科学期刊的发展。而巴西教育部官员辩解称:“世界上几种有影响力的学术评级系统,都把影响因子作为主要参考指标。”在这样的辩解中,希望在西方世界面前能够“跟得上趟”的奴化心态跃然纸上。

  巴西期刊界的集体抗议

  次年(2010年),巴西期刊界反对“科技文献评级系统”的意见声势浩大,60家科学杂志的主编联名请愿,并在各自期刊上同步发表了倡议书:“QUALIS期刊分级标准——迫切需要改变的标准!”

  这份倡议由巴西期刊编辑、研究项目基金会、科学研究人员三方代表共同提出,他们对说服巴西教育部改变QUALIS体系下的期刊分级标准还抱有最后一丝希望,提出8条倡议:

  1.对巴西期刊的评价体系中,不应把影响因子作为学术水平的唯一评判标准。

  2.不同学科的专业特性应该得到充分的考虑和尊重。

  3.巴西学术出版主要从大学及科学学会获得支持,这和欧美以私营出版为主不同。

  4.巴西期刊需要更多的支持和激励,要点如下:对期刊主编支付更优厚的报酬;对期刊给予更大的资金支持;采用更全面的标准评判期刊优劣;提升巴西期刊的国际能见度;把支持和激励措施具体落实到每份期刊。

  5.推动巴西科学期刊的国际化。

  6.期刊在QUALIS评价体系中实行一年一评。

  7.巴西相关科学学会应积极参与教育部制定学术评估标准的过程。

  8.学者在高影响因子刊物上发表论文外,还应在一定比例的巴西刊物上发表论文。

  上述倡议中,有些是实施细则。第3条强调了巴西学术出版主要依靠国家层面的拨款和资助——这种情况和包括中国在内的大多数第三世界国家一样。其中真正核心的意见是第1和第8条,第1条敦促巴西教育部收回成命,第8条提出了具体可行的建议——本国学者发表论文时须兼顾国际、国内刊物。事实上,这条建议如果能够得到施行,巴西本土科学期刊的灾难在某种程度上就可以缓解了。可惜的是,事情的结果恰恰相反。

  60家期刊公开联名请愿,可谓声势浩大,但非常奇怪,本文作者查阅文献的结果,却发现巴西学界对此事的讨论至此戛然而止,教育部是如何回应的?一个非常大的可能是,巴西教育部将此事“捂”下去了。

  巴西教育部一意孤行的后果

  巴西教育部坚持推行“科技文献评级系统”之后,不出几年,后果已经显现。

  2014年5月,巴西圣保罗大学举行了首次中国—巴西科学期刊出版交流活动,巴西代表向中国同仁介绍他们的期刊建设成效:2003年巴西有SCI期刊17份,2013年增至107份,增长720%,其间推行“科技文献评级系统”,巴西SCI期刊数量从2008年的28份大幅增至2009年的65份,次年进一步增至89份。

  巴西代表试图以上述数据来证明,巴西教育部推行“科技文献评级系统”对本国学术期刊建设起了促进作用。然而,上述数据背后隐藏的真实情况却并非如此。

  巴西代表忽略了一个重要事实:在全球SCI期刊数量逐年增加的情况下,即使将SCI期刊数量视为一个国家期刊建设的指标(这样的指标并不合理),只看SCI期刊的绝对数量也不能准确反映该国的期刊建设成绩。

  SCI期刊名单每年都在变动,总体趋势是逐年增长。ISI公司宣称:他们当前每年大约会收到3500份杂志的申请,入选率一般控制在10%~12%。

  据2006—2016年的数据,这期间SCI期刊每年的实际增长约为200份,但其中2009和2010两年出现了罕见增幅,分别增加了767份和688份——而巴西SCI期刊数量大幅增长恰好出现在这两年!所以从全球背景来看,将此结果归功于巴西“科技文献评级系统”的实施显然不合情理,实际上只是这两年全球SCI期刊罕见增幅造成的水涨船高效应。

  不仅SCI期刊数量逐年增长,全球SCI期刊的影响因子值,整体也是持续增长的。举例来说,2009年《巴西生药学杂志》(Brazilian Journal of Pharmacognosy)的影响因子为3.4,在全球SCI期刊中还能排名961位,但由于整体水涨船高的结果,影响因子3.4的期刊到2017年只能排到1731位了。巴西本土最顶尖的SCI期刊,以全球平均水平而言,其实是处于下滑趋势中。

  巴西“科技文献评级系统” 实施以来,更严重的恶果,也是当年联名抗议的主编们最担心的事情,已经明显出现——巴西优秀学术论文几乎完全流失国外!

  本文作者对2017年度巴西学者发表的SCI热点论文和高被引论文数据进行系统整理后显示:2017年巴西共发表SCI论文5.3万篇,其中热点论文65篇,分布在全球43家刊物上,排名前4的刊物分别是:《柳叶刀》8篇,《新英格兰医学杂志》6篇,Nature杂志5篇,《物理学评论通信》4篇;高被引论文355篇,分布在全球208家刊物上,排名前4的刊物依次为:《柳叶刀》19篇,《新英格兰医学杂志》12篇,《物理学评论通信》12篇,Nature杂志10篇。

  形成鲜明对比的是,这年巴西的热点论文和高被引论文,没有一篇发表在本土刊物上!

  值得警醒的是,中国科学期刊也几乎是同样状况!据2017年《中国科技期刊发展蓝皮书》中的数据:2007—2016年,中国作者发表高被引论文18974篇,占同期全球高被引论文总数的14.33%,但在中国本土期刊上发表的高被引论文只有447篇,仅占同期中国作者高被引论文数的2.3%。

  发展中国家在这个问题上的出路

  当初加菲尔德发布SCI报告(1964),发起影响因子排名游戏(1975),他多半没有想到他搞的这一套东西居然会极大地改变全球的学术生态。从我们现有的研究结果来看,加菲尔德应该并无符合阴谋论的动机,但是对于包括中国在内的发展中国就来说,却在实际上产生了非常符合阴谋论的效果。

  近几年来,本文作者对SCI期刊和影响因子研究成果次第问世,产生了相当范围内的影响,经常有人问道:你们说SCI和影响因子游戏不合理,那合理的评价指标在哪里?如果我们不再依赖SCI和影响因子,那你让我们依赖什么?

  事实上,上面这种问题的提问思路,完全偏离了问题实质上的重点!

  先让我打一个也许不太贴切的比方:如果有人用核武器威胁讹诈我们,我们除了指出这种大规模杀伤性武器的反人类性质的道德缺陷之外,出路是什么?难道是去研发一种尽善尽美毫无道德缺陷的武器吗?不,我们的出路是搞出自己的两弹一星。

  更何况,正如我们在上文强调指出的,SCI和影响因子游戏的合理性问题,不能笼统地给出回答,必须针对世界的三个部分分别考虑和回答。许多人在论及这个问题时,有意无意地将SCI和影响因子游戏在美国和英语西方国家的合理性强加给世界的另外两个部分,这不仅荒唐,而且非常天真。

  所以,只要考虑到SCI和影响因子游戏面对的“三个世界”,发展中国家在这个问题上的出路就是显而易见的——必须搞一套自己的SCI和影响因子游戏的规则和标准,并且尽快在国内推广使用。只要这套自己的标准没有比现有的SCI和影响因子游戏更不合理,就应该立即使用,哪怕它仍然有着现行SCI和影响因子游戏的种种问题。而事实上,建立一套新规则和新标准时,回避或改善旧规则旧标准中的一些问题,通常是可以做到的。

  希望教育部、科技部2020年2月的文件,能够开始扭转中国目前的局面。

“影响因子”是用来赚大钱的

——揭开“影响因子”的学术画皮(一)

  ✪  江晓原、穆蕴秋

  上海交通大学科学史与科学文化研究院

  (本文原载《读书》2016年第5期)

  影响因子在当今中国的声势

  期刊的所谓“影响因子”(impact factor),在中国当下的期刊评价体系中,特别是在科技期刊评价体系中,已经被推崇到荒谬的高度。举例来说,英国的《自然》(Nature)杂志如今在许多中国学者心目中绝对是高居神坛,而它之所以被学界捧上神坛,主要原因之一就是它在风靡全球的“影响因子”游戏中,长期遥遥领先——二〇一四年它的“影响因子”高达41.5,在SCI期刊中位居第七。几乎可以这样说,对《自然》的迷信和崇拜,就是对期刊“影响因子”迷信和崇拜的表征。

  这种迷信和崇拜可以达到什么程度?看一个例子就可见一斑: 据二〇〇六年《自然》杂志上题为《现金行赏,发表奖励》的文章中说,这年中国科学院对一篇《自然》杂志上的文章给出的奖金是二十五万元人民币,而中国农业大学的奖金高达三十万元人民币以上,这样的“赏格”让《自然》杂志自己都感到有点受宠若惊。

  在当前国人的错误认识中,普遍将期刊“影响因子”看成理所当然的权威学术评估手段,视为一种“学术公器”,用于衡量个人、学术团体、研究单位,甚至国家的整体学术水平。许多科研机构的管理部门,长期强调并用各种考核手段要求科研人员尽可能将论文发表在国外的高影响因子刊物上,却完全没有看到,这种要求不仅在学理上极为无理,而且正在实际上对中国学术造成极大伤害。

  影响因子的商业性质

  一位《中国科学报》的资深女记者,在和我们讨论有关问题时, 曾非常自然地问:“影响因子”难道不是国际科学界对科研成果公认的最客观评价吗?她这样问,当然反映了她对“影响因子”公正性的深信不疑。让笔者稍感吃惊的是,在我们的思想认识中,作为一位《中国科学报》的资深记者,她按理应该在这个问题上有着比一般公众及文科学者更为专业和清醒的认识。结果我们看到连她这样的专业人士都受害如此之深,可见“影响因子”的神话已经误人到什么程度了。

  当时我们忍不住告诉她:你要是知道“影响因子”其实是美国一家私人商业公司推出的一项盈利产品,你就不会那样问了!

  非常奇怪的是,国内学界对期刊“影响因子”的历史形成过程, 几乎没有人去关注,而且几乎完全没有人注意到它纯粹的商业性质。出现这种状况的原因,主要是因为人们普遍从一开始就是跪倒在“影响因子”面前的,将它误认为是国际科学界的“学术公器”。

  让我们先“剧透”一点调查结果:“科学情报研究所”(Institute for Scientific Information,通行的简称是ISI )逐年发布的“科学引用索引”(Science Citation Index ,简称SCI)和“期刊引证报告”(Journal Citation Report,简称JCR),被当今科学界视为两种最权威的学术评估数据。SCI可用来检索科学论文被引用的情况,JCR本质上是SCI的衍生产品,它是基于对SCI(后来包括SSCI和A&HCI)“引用索引”数据进行整合处理后得到的结果,就是期刊的“影响因子”。许多人误以为它们是由“国际权威科学机构”发布的,而实际上这家“科学情报研究所”从一开始就是一家地地道道的私人商业公司,一九九二年又被汤森路透(Thomson Reuters)收购。只是ISI的这一性质,多年来一直不太为普通公众和许多学界人士所知。

  但是且慢,“科学情报研究所”难道会是私人商业公司吗?

  是的,对于习惯于“循名责实”、“名实相副”的中国公众来说,这太出人意表了。但是别忘记,这家公司是在美国。公司创始人尤金·加菲尔德(Eugene Garfield)最初曾使用“尤金·加菲尔德学会”的名称,听上去有点“伪学术”味道,但在一九六〇年改名为“科学情报研究所”之后,听起来就完全像一家政府科学机构了。晚年的加菲尔德功成名就之后,对于自己的“成功之道”也不用那么讳莫如深了,他曾在文章中非常坦率地承认, 他要的就是这种容易引起混淆的效果:“特别是在国外,‘科学情报研究所’这样的叫法,很容易被当成一家非营利机构。”但在美国,他这样做并不违反法律方面的任何条规,而在中国公众所习惯的观念中,那甚至有可能涉嫌欺诈了。

  我们知道,对于长期跪倒在“影响因子”面前的人来说,仅仅指出它是由一家私人商业公司发布的,可能仍然不足以动摇他们对“影响因子”的崇敬之情,要真正理解“影响因子”的商业性质,就有必要进一步了解它的前世今生。

  尤金·加菲尔德的创业

  SCI和JCR这两种数据行用半个世纪,已经极大地改变了国际科学界的学术生态和发表机制。他们的创立者尤金·加菲尔德不管历史功过如何,已经足以名垂青史。

  加菲尔德一九二五年生于纽约布朗克斯区,从哥伦比亚大学获化学学士学位(一九四九)和图书情报学硕士学位(一九五四),从宾夕法尼亚大学获结构语言学博士学位(一九六一)。一九五六年,还在攻读博士学位的加菲尔德已经注册成立了一家小公司,推出了第一款信息产品《目录快讯》(Current Contents,简称CC),是一种对管理类杂志目录进行定期汇编的小册子。除了零售散卖,贝尔实验室(Bell Lab)成为他的第一家企业用户。加菲尔德后来回忆,为了完成贝尔的订单,需要先投入五百美元作为印刷费,而这在他白手起家的早期不是一笔小数目,他从私人银行贷款才勉强渡过难关。

  一九六〇年加菲尔德迎来了他事业的转折点。这年他将公司改名“科学情报研究所”,与美国国家健康学会合作,获得国家科学基金(NSF)三十万美元,共同承担建设“基因文献引用索引库”(Genetics Citation Index)项目。该项目对一九六一年二十八个国家出版的六百一十三种期刊两万册以上的一百四十万条参考文献建立引用索引,进行编目,最终结果共五卷,其中基因类文献引用索引独立成一卷。一九六三年该项目顺利结项,加菲尔德原指望国家科学基金继续提供资助,将余下四卷一起出版,但他的申请未获批准。加菲尔德于是决定自己来干,独立出版,并将五卷统一命名为“科学引用索引”,即科学界现今奉为圭臬的SCI。

  SCI收录一定范围数量的期刊——通常被称为“源刊”(source journals),通过在源刊文本和源刊参考文献之间建立“引用索引”(Citation Index),可提供检索学者的 SCI论文发表数量和被引用次数——在理工科领域,对学者学术水平的评判现今主要取决于这类数据。1964年加菲尔德首次出版一九六一年的SCI报告,此后逐年出版,延续至今。他又先后在一九七三和一九七八年开始推出“社会科学引用索引报告”( Social Science Citation Index ,简称SSCI)和“艺术及人文科学引用索引报告”(Arts & Humanities Citation Index,简称A&HCI),完全套用了 SCI 的产品思路和模式。

  从起源上看,“引用索引”的想法并非加菲尔德首创,它是受到美国一种判例援引法律工具书的启发。美国法律遵照“判例”原则, 法院进行判决时,必须与本院或上级法院此前对相似案例做出的判决保持一致。一八七三年,芝加哥法律出版商谢帕德(F. Shepard)开始出版一种他自己编印的工具书,在判例和援引案例之间建立索引, 统一编列并标记判例是否已被推翻、撤销、修改或加入限制条件。这种工具书能帮助律师快速了解一个判例是否仍然适宜援引,出版后大受欢迎,法律界人士几乎人手一本。谢帕德的名字甚至衍化出一个法律术语“Shepardize”,意为“查阅《谢帕德引证》”。

  而作为一种期刊评估手段,JCR的思想源头可追溯至格罗斯(Gloss)夫妇一九二七年发表在《科学》(Science)上的一篇文章。他们试图解决这样一个问题:在图书馆预算有限的情形下,应该参照什么标准为学生购买供查阅的化学期刊?最简便的方法,当然是找一个权威专家为图书馆开列一个目录清单,但这会受到专家个人局限的左右。格罗斯夫妇的解决方案,是选取知名刊物《美国化学学会杂志》,对它一九二六年发表的两百四十七篇文章的三千六百三十三条参考文献进行统计,按引用次数对所有被引刊物进行排序,刊物重要性与排序结果直接对应,图书馆可参照此清单进行购买。这种筛选方式操作简便,且不存在太高专业“门槛”,很快被其他信息科学家借鉴推广到别的学科领域。

  SCI 作为 JCR 的数据基础,相较前人有所突破的地方在于,不再区分学科类别,收录期刊海量增加。但根本区别在于,格罗斯夫妇及其后继者们对期刊进行筛选时,还保持着非常“纯洁”的动机, 为的是服务学术,而SCI和JCR却不是这样,它们从一出生就是商业信息产品,“赚钱”是它们与生俱来的属性。

  讲个故事推销产品: “影响因子”预测诺贝尔奖

  加菲尔德白手起家,从最初五百美元都要靠私人银行贷款,发展到今天至少在科学界俨然有君临天下之势的“信息帝国”,确实堪称科学、信息、资本三者结合的传奇。这个帝国的所作所为是好是坏,“影响因子”本身是不是合理,还不是本文打算讨论的内容,要留待以后再说。但加菲尔德在推销他的产品时,手法高明而且不遗余力, 却不可不提。这里也姑举一例以见一斑。

  加菲尔德千方百计要让他的信息商品位居高端,乃至凌驾于学术之上,他的关键手法之一是讲了一个动人的故事——SCI可以预测诺贝尔奖。

  一九六五年,即SCI推向市场的次年,在美国海军研究办公室(Office for Naval Research)主办的一次学术会议上,加菲尔德做了大会报告。当时他迫切需要打开SCI的市场,所以这次大会报告很大程度上成为一次不失时机的产品推介。加菲尔德宣称,SCI有五项功能: 一、便于学者了解前人工作;二、可作为评估研究成果的手段;三、便于追踪研究成果的发表来源;四、可用于计算期刊的“影响因子”; 五、为科学史研究提供一种辅助手段。

  在阐述第二项功能时,加菲尔德选择了最能撩拨学界敏感神经的“诺贝尔奖预测”来进行论证。他利用1964年首次出版的一九六一年度SCI报告,统计了一九六一年二十五万七千九百位学者的成果被SCI论文引用的情况,又统计了一九六二、一九六三年产生的十三位物理、化学和医学诺贝尔奖获得者的论文引用情况, 数据表明,该十三位学者在获得诺贝尔奖的前一年,他们的成果被SCI论文引用的平均数量和次数远高于一般水平。

  从表面上看,这确实表明优秀科学家群体有着更高的SCI论文被引用数,但这并不足以支撑加菲尔德的论断:SCI论文引用数可以反过来用于评估单个学者的学术水平。

  事实上,就在两年前的一篇文章中,加菲尔德还主动发出警告, 利用论文引用次数评估科学家和科学成果可能存在风险,理由是“论文的影响和论文的重要性及意义是两码事”。他甚至非常恰如其分地引用了苏联李森科的例子,说明如果引用次数最多的作者应该获得诺贝尔奖,那就会得出李森科是苏联最伟大科学家的荒谬结论。而且在加菲尔德举例的十三位诺贝尔奖获得者中,已有一个明显反例: 按照加菲尔德的统计,一九六三年度物理学奖获得者约翰内斯·詹森(J. H. Jensen)一九六一年三篇论文的SCI引用才四次,连引用次数的平均值(5.51次)都未达到。

  但是,加菲尔德在随后持续打造SCI产品“学术形象”的过程中, 却似乎完全忘记了自己当初发出的警告。从一九六五至一九八三年间,他先后撰写了三十多篇文章,力图证明SCI论文引用可以“预测”诺贝尔奖。

  在一九九〇年的一篇综述文章中,加菲尔德引用他此前鼓吹此事的三十多篇文章,力图将所谓“高引作者名录”和诺贝尔奖联系起来。我们详细研究了加菲尔德这篇文章所提供的数据,发现他对数据的处理和使用至少存在着三个问题:

  第一,加菲尔德非常明显地对数据进行“选择性呈现”。每年新增SCI论文数以万计,这些论文产生的引用会让SCI“高引作者名录”各年大不相同,因此截取年限不同,结果就不一样。加菲尔德提供的六组数据中,起始年份各不相同,截止都在一九九〇年(该文写于这年),截取年限依次为一年、一年、十一年、十四年、十三年和十五年,并无章法可循。事实上,一九六一至一九九〇年的三十年间,所有可能截取的年限共有四百六十五种,对应的“高引作者名录”就应该有四百六十五份——而加菲尔德仅仅给出了其中六份,呈样率不到1.3%,对于如此明显的选择性呈现,加菲尔德却没有交代任何理由(哪怕宣称是“随机抽取”)。

  第二,加菲尔德没有说明“高引作者名录”人数的选取标准。因为名单越长,出现诺贝尔奖得主的概率也就越大。加菲尔德的六组数据,名单人数从最初的五十扩大到了后来的一千,却没有给出任何解释理由。

  第三,没有明确预测的有效年限。通常,预测事件发生是有时限要求的。加菲尔德六组数据的预测年份截止于一九九〇年,只是因为他的文章写于这一年,这意味着预测的有效期限可能止于任何年份,这完全背离了“预测”的基本要求。

  加菲尔德之后,有学者采用相同路径加入“预测”行列,这些工作对引导学界相信 SCI 论文“高引”可预测诺贝尔奖起了推波助澜的作用,而客观上则是在自觉或不自觉地帮助SCI推销产品。但对于这种“预测”,学界至今还存在相当大的异议。下面仅举一例:

  学者金格拉斯(Y. Gingras)和华莱士(M. Wallace)二〇一〇年发表一项研究,他们对比物理和化学领域的两组数据:逐年统计一九〇一至二〇〇七年排名前五百的高引作者的被引用情况,和一九〇一至二〇〇七年三百三十位诺奖得主的被引用情况。统计结果显示,一九〇〇至一九四五年间,诺贝尔奖得主在获奖当年的平均被引用次数确实高于其他高引作者,出现一个突出的峰值;但是从一九四六至二〇〇七年,这样的峰值再未出现。这意味着,一九〇〇至一九四五年间,成果引用或许可以看作预测诺贝尔奖的有效风向标,但是从一九四六年以后,试图从“高引作者”中鉴别出诺贝尔奖得主已经完全没有可能。他们对这种变化提出的解释是:五十年代以来科研人数在急剧增加;同时专业分支在不断细化。如果他们的研究结论成立,那就表明:早在SCI作为一种商品被销售之前的大约二十年,它在“预测诺贝尔奖”这件事上就已经失效了。

  一个对金格拉斯和华莱士两人上述研究结论非常有利的最新证据是:“科学情报研究所”二〇一四年公布的“高引作者名录”中, 尽管包括了多达三千二百一十六位科学人士,但该名录二〇一四年的诺贝尔奖“预测”命中率为零。

  然而这并不妨碍“高引作者名录”继续受学界追捧。因为在“SCI引用”风行整个学界的今天,能进入该名录已经被当成学术水平突出的象征。更何况,鼓吹“预测诺贝尔奖”本来只是加菲尔德当年推销SCI产品时的一个手段,如今时移世易,SCI和“影响因子”的声势已经如日中天,能不能预测诺贝尔奖早已无关紧要了。

  ISI“信息帝国”的惊人利润

  在加菲尔德创业之前,美国的科技情报工作,倒是和今天中国公众想象的十分接近 :通常由政府学术机构牵头采集、整理和公布。套用一句今天的时髦话头,可以说是加菲尔德一手开创了科技情报的商业化经营模式。所以《科学》杂志一九七八年的一篇文章中称加菲尔德为“将信息王国建立在脚注上的百万富翁”。

  对加菲尔德而言,1964年投产SCI完全是背水一战的商业冒险。为了弥补资金缺口,他把公司20%的股权以五十万美元价格卖给华尔街风投。老年加菲尔德回顾自己创业时的峥嵘岁月,在一次访谈中告诉记者,当年SCI的发售价格为每份七百美元,它的第一份订单来自美国中央情报局(CIA)图书馆,出人意料的是第二份订单——它来自红色中国。

  事实证明,加菲尔德对SCI的产品决策堪称“高风险高收益”。SCI从1964年推向市场到一九七一年,ISI的利润连年以年均27.5% 的幅度增长,随后又开发了十余款新产品,公司业务迅速拓展到全球,最终成为世界第一大科技信息服务咨询公司。

  除了SCI和JCR这样的“灵魂产品”,ISI 开发的其他知名产品还包括 :《目录快讯》(CC),一九五六年首次面市,只对管理类期刊进行汇编,翌年起将汇编对象拓展到医药、化学、生命科学等领域的学术期刊。作为ISI开发的第一个产品,CC在 SCI出现之前一直是公司最赚钱的产品。《化合物索引库》(Index Chemicus,简称IC),该数据库有助于研究者了解新出现化合物的相关研究数据,还可获得重要有机化学期刊对它的评价结果,但一九六〇年推出后一直只赔不赚,然而加菲尔德却对它倾注了巨大热情,手下四名主要副手集体辞职也未能迫使他终止。不过IC如今已成为汤森路透的又一热门产品。

  一九八八年,加菲尔德把“科学情报研究所”超过50%的股权卖给JPT出版公司(JPT Publishing)。一九九二年四月,汤森路透以二点一亿美元价格收购了JPT出版公司。据汤森路透首席运营官说,这项交易主要是为了得到“科学情报研究所”,当时“科学情报研究所在全球拥有三十万客户,每年净利润约为一千五百万美元”。而到了今天,据统计,汤森路透和英国里德·爱斯维尔集团(Reed Elsevier)、荷兰威科集团(Wolters Kluwer),三巨头共占据了全球情报市场份额的90%。

  至于如今汤森路透旗下“科学情报研究所”的盈利规模,笔者姑且披露一所我们熟悉的国内著名“985”高校的有关情况以见一斑: 该校目前订阅了汤森路透七种信息产品:Web of Science(包括SCI、SSCI、A & HCI 等)、JCR、BIOSIS Previews(生物科学数据库)、CC、Derwent Innovations Index(德温特专利情报数据库)、EssentialScience Indicators(基本科学指标,ESI)、ISI Emerging Market(ISI新兴市场信息服务),该校每年为此支付的费用超过两百万元人民币。

  想想全中国有多少所类似的高校,全世界又有多少所类似的高校,而且国外许多高校在购买此类数据库时往往比国内高校更为慷慨,再想想“科学情报研究所”在一九九二年就有三十万客户,就不难想象加菲尔德创建的“信息帝国”如今的盈利规模了。

  上面这段故事,还只是我们打算讲述的关于“影响因子”江湖故事中的第一段。这个故事总体来说好有一比—不知电视剧《琅琊榜》是否已经家喻户晓到如此地步了:加菲尔德就好比学术江湖的梅长苏,“科学情报研究所”就好比学术江湖的江左盟,而他们卖信息赚大钱的行事倒很像琅琊阁;那么“麒麟才子,彼岸加郎”有没有暗中辅佐的靖王殿下呢?至少在客观效果上也是有的,那就是Nature杂志了——但这要且听下回分解。

  文化纵横

  倡导文化重建,共同思想未来,发掘不一样的深度阅读。

  919篇原创内容

  公众号

 

 

影响因子是可以操弄的

——揭开“影响因子”的学术画皮(二)

  ✪  江晓原、穆蕴秋

  上海交通大学科学史与科学文化研究院

  (本文原载《读书》2016年第9期)

  拙文《影响因子是用来赚大钱的——剥开影响因子的学术画皮(一)》在《读书》今年第五期刊出后,反响颇大,有点出乎我们的意料。也许这和“A类期刊”风波恰好在此时发生也有关系。这些反响让我们感觉到,不妨将原先计划中第二篇文章的写作稍稍提前一点。

  友人告诉我们,本刊第五期上的拙文已经“严重伤害”了某些人士朴素的感情——他们是如此热爱美国《科学引文索引》(SCI)和影响因子,以至于当他们发现任何打算“诋毁”影响因子的企图时,都会产生由衷的义愤,而拙文就被认为具有这种企图。

  关心此事的读者想必还记得,拙文第一篇其实只完成了一个任务——揭示影响因子游戏背后的“科学情报研究所”(ISI)的纯粹商业性质。这一点之所以有必要揭示出来,是因为国内学者、官员、管理人员和广大公众都长期忽视了这一点,所以笔者认为有必要提请各方注意到影响因子背后的商业性质。

  然而,热爱影响因子的人士对拙文的质问有一个共同点:商业化就必然不公正吗?非商业化而不公正的例子不是也很多吗?

  但是,仔细阅读拙文第一篇,其中有任何一句话可以被解释为“商业化就必然不公正”这样的意思吗?当然没有——因为笔者并不这样认为。事实上,那篇文章根本没有涉及影响因子的公正性问题。既然如此,上面的质问岂非无的放矢?

  让我们言归正传,本文的任务是:揭示影响因子可以如何被操弄。先声明一点:限于篇幅,关于影响因子游戏的种种问题,包括它的不合理、不公正之处,并非本文所能尽举,笔者准备在下一篇文章中进一步揭示。

  虽然商业化并不必然导致不公正,但具体到影响因子游戏,它的这些不公正之处和商业性质之间,则既有表面的直接联系,更有内在的本质联系。所以热爱影响因子的人士在阅读本文之前有必要做好思想准备——你们热爱的对象,行将遭到进一步的“诋毁”。

  两栖化:中国读者不熟悉的杂志形态

  《自然》(Nature)、《科学》(Science)之类的西方科学杂志,能够在学术江湖中获得“顶级”的名头,确实有一些中国公众不熟悉的“神功”。其中一项,简单地说,就是让杂志两栖化——既刊登学术文本(包括原创的论文以及综述文章),也刊登各种各样的大众文本。

  就以《自然》杂志为例,目前它每期刊登的文章中,属于学术文本的仅三个栏目:论文(article)、归类于“原创研究”的通信(letter)以及综述评论(review)。通信比较简要,是对某项科研成果的初步介绍,论文篇幅稍长,是对某项研究工作更全面的介绍。但是一定要注意,《自然》杂志还有另外的十五个栏目呢!它们是:

  消息和评论(News and Comment)

  读者来信(Correspondence)

  讣告(Obituaries)

  观点(Opinion)

  书籍和艺术(Books & Arts)

  未来(Futures,就是那个发表科幻小说的栏目)

  书评(Book Reviews)

  消息和观点(News & Views)

  洞见(Insights)

  评论和视野(Reviews and Perspectives)

  分析(Analysis)

  假想(Hypothesis)

  招聘(Careers)

  技术特征(Technology Features)

  瞭望(Outlooks)

  那么,前三个栏目和后十五个栏目的篇幅比例如何?从SCI数据库逐年统计的文章篇数来看,《自然》杂志目前大致是一比二,也就是说,学术文本只占总篇数的三分之一左右。

  这或许会使许多一直跪倒在“国际顶级科学期刊”面前的人大跌眼镜:不会吧?按照中国读者习惯的观念,这样的杂志不就几乎是一本“科普杂志”了吗?

  许多人一直习惯将《自然》和《科学》当成“国际顶级科学期刊”,在他们心目中,这样的杂志应该是何等的“学术”!

  这里不妨先看看中国人自己办的科学期刊,在二〇一五年的影响因子游戏中,成绩最好的是《细胞研究》(Cell Research),影响因子为14.8,这仅比《自然》杂志同年影响因子的三分之一稍稍高一点。而二〇一四年能够“有幸”加入影响因子游戏的一百七十三份中国期刊(二〇一五年增至一百八十五份)中, 90%以上的影响因子都低于3.0,当真是瞠乎其后。可是这些中国科学期刊都是极度、完全、纯粹学术的,通常没有任何非学术文本。那些影响因子数倍、数十倍于中国科学期刊的“国际顶级科学期刊”,难道不应该比低影响因子的中国科学期刊更“学术”数倍、数十倍吗?

  相信许多跪倒在“国际顶级科学期刊”面前的人心里,一直就是这样想当然的吧。“国际顶级科学期刊”怎么可能三分之二都是非学术内容?

  但是事实就是如此。不仅《自然》是如此,《科学》和《柳叶刀》(Lancet)也是如此。这个名单中还可以加上《美国医学会杂志》(Journal of the AmericanMedical Association)、《新英格兰医学杂志》(The New England Journal ofMedicine)……它们都是在影响因子游戏中遥遥领先的“国际顶级科学期刊”。

  再看看这几个影响因子游戏“顶级玩家”的成绩吧,下面是它们二〇一五年的影响因子数据(四舍五入保留一位小数):

  《自然》:38.1

  《科学》:34.7

  《柳叶刀》:44.0

  《美国医学会杂志》:37.7

  《新英格兰医学杂志》:59.6

  在这几个“顶级玩家”中,说实话《自然》杂志相对已经要算最“规矩”的了——如前所述,它的学术文本目前好歹还占到了约三分之一(这个比例在它的历史上曾经有过大幅变动),《柳叶刀》和《新英格兰医学杂志》就更放得开了,它们的学术文本只占约四分之一到五分之一(文章篇数)。

  对数字较为敏感的读者是不是已经开始有一点朦胧感觉了:莫非杂志的两栖化和杂志的影响因子之间有着某种神秘关系?你看:《自然》杂志非学术内容约占三分之二,影响因子38.1;《柳叶刀》非学术内容约占四分之三,影响因子44.0;《新英格兰医学杂志》非学术内容约占五分之四,影响因子59.6……

  当然,事情不像你想象的那样简单。这里先看一组尚不过时的数据:

  二〇一四年全球被SCI收录的科学杂志共八千六百五十九种,其中影响因子最高的二十种杂志中,符合我们中国学者想象习惯的“纯学术杂志”,即只刊登原创科学论文的杂志,只占一种!其余十九种杂志中,两栖类占九种(上面提到的五种都在其中,《自然》杂志名列第七);综述类,即全部刊登综述文章的杂志,占据十种。

  二〇一五年的影响因子数据已经新鲜出炉,SCI收录的期刊增加到了八千七百七十八种,前二十名“顶级玩家”名次稍有浮沉,比如《自然》杂志下降到了第九名,《柳叶刀》仍保持在第四名,但总体上没有多少变化。

  常识告诉我们,能够在影响因子前二十名中占据九席,无论如何不可能是偶然现象,这一数据至少强烈提示了这样一点:两栖化是提高影响因子的“王道”之一。至于具体怎么提高,机制如何作用,详见下文。

  中国改革开放已逾三十年,许多国外杂志出版了中文版,中国学者在图书馆或网上阅读国外杂志也越来越容易了,按常理来说,中国的读者,中国的杂志编辑或出版人,应该不难注意到上述“国际顶级科学期刊”的两栖色彩,为什么未见中国杂志起而仿效呢?

  笔者对二〇〇〇年以来被SCI收录的中国科学期刊中影响因子前二十位的刊物做了考察,发现全部是以发表原创研究论文为主的论文类期刊。我们估计即使对目前被SCI收录的中国科学期刊全部考察一遍,也还是相同的结果。事实上,中国几乎不存在《自然》《科学》《柳叶刀》这种类型的两栖杂志(这一现象将在下文的讨论中显现出更为重要的意义)。

  国内对影响因子计算公式表述的普遍错误

  现在我们终于不得不面对影响因子的计算公式了。这个公式甚至在《读书》第五期上的拙文中也没有来得及提到。

  尽管这个公式每年都会在ISI发布的JCR报告(期刊引证报告)上被表述一遍,但国内许多学者和媒体在表述这个公式时,却普遍是错误的。举例来说,在二〇一六年六月二十日(本文撰写中的日子),从百度上搜索对这个公式的表述,包括“百度百科”中的表述,几乎全是错的(只有维基百科表述正确;至于它们为何都错,详见下文)。

  影响因子计算公式的准确表述,当然应该以ISI每年发布的JCR报告上的文本为准,是这样的:

  一份期刊前两年中发表的“源刊文本”在当年度的总被引用数,除以该期刊在前两年所发表的“引用项”文章总篇数,即为该期刊当年度的影响因子数值。

  这个公式从提出到今天,中间曾有过修改;公式中“两年期限”的合理性,多年来也在学术界备受质疑和争议。但为了保持我们思路的简洁,这些都将留待下一篇文章中讨论。此处我们先要注意的,是这个公式中分子部分的措辞。

  上述公式中分子部分的“源刊文本”一词,迹近“学术黑话”,其实就是“杂志上刊登的全部文章”。而“源刊文本”又被区分为“引用项”和“非引用项”两类,在通常情况下,“引用项”对应着学术文本,“非引用项”对应着非学术文本。

  公式的意思是:在分子部分,它包括了该期刊上前两年所刊登的全部文本在当年度所产生的全部引用。

  这就是说,对于《自然》《科学》《柳叶刀》这类两栖杂志而言,占据杂志大部分篇数的非学术文本所产生的所有引用,都会被计入影响因子计算公式的分子值中。

  这首先会产生这样一个问题:《自然》《科学》《柳叶刀》这类杂志上的非学术文本,会产生SCI引用吗?

  这个问题并非没有意义,因为对于长期跪倒在“国际顶级科学期刊”面前的人来说,他们习惯性的想象是:这些杂志的全部篇幅都是用来刊登“高大上”的学术论文的,这些杂志之所以有很高的影响因子,是因为它们刊登的学术论文质量高、影响大,所以人人引用。对这些人士来说,《自然》或《柳叶刀》这样的杂志上,竟然会有三分之二以上甚至五分之四的文章是非学术文本,已属难以想象;更难以想象的是,这些非学术文本(比如十一岁小姑娘写的幻想小说),难道也会产生SCI引用?

  答案竟是肯定的。

  两栖杂志上非学术文本对影响因子的直接贡献

  上述影响因子计算公式中,关于“引用项”和“非引用项”两类文本的区分虽然至今仍不无争议,但对于公式中的分子部分则一直没有争议,因为规则定得非常简单明确:所有文本(即无论是“引用项”还是“非引用项”)所产生的引用全部计入分子。

  加菲尔德一九七五年开始出版JCR报告,最初确立上述分子规则时,理由是“非学术文本很少会被引用”。然而有意思的是,在一九八一年一篇介绍《自然》的文章中,他自己开列了一九六一至一九八〇年间杂志被引用排名前二十的物理学文章,其中就有一篇被引一百九十六次的文章属于“非引用项”,这就表明,《自然》上“非引用项”也能产生可观的引用次数。

  关于“非引用项”对影响因子的贡献,多年来一直受到学界诟病。二〇〇五年加菲尔德受邀出席在芝加哥举行的同行评审及生物医学出版国际会议,做了题为《影响因子的历史及其意义》的报告,其中他为自己制订的规则辩护,这次他提出了两条理由:

  第一,“非引用项”虽然也会被引用,但主要集中在文章发表的当年,所以不会对影响因子的计算结果产生明显影响(因为上述公式中需要计入的是文章发表后第二、第三年产生的引用)。

  第二,影响因子公式尽管包括了“非引用项”的被引用次数,但只会对小部分杂志的影响因子产生相当有限的影响——他估计的幅度在5%—10%。

  但是加菲尔德在上述报告中,并未提供任何数据来支持他的辩护。没有数据支持,他的辩护是否可信?学术界当然不会人人都信。事实上,已有学者对此进行过专门研究,他们用实际数据表明:加菲尔德上述两条辩护理由都不能成立。

  先看学者海内伯格(P. Heneberg)二〇一四年发表的研究成果:他选择了十一家高影响因子刊物——

  《自然》

  《科学》

  《自然医学》(Nature Medicine)

  《自然免疫学》(Nature Immunology)

  《科学信号》(Science Signaling)

  《细胞》(Cell)

  《细胞代谢》(Cell Metabolism)

  《细胞干细胞》(Cell Stem Cell)

  《新英格兰医学杂志》

  《美国医学会杂志》

  《柳叶刀》

  测算它们二〇〇九年发表的各栏目文章,在当年度和接下去两年的被引用情况。结果表明,加菲尔德的第一个辩护理由完全不能成立。这些期刊上非学术文本,比如“社论”“读者来信”“消息”,甚至“更正”之类,在发表后第二、三年度产生的有效引用,普遍明显高于当年度的引用。也就是说,这些引用必然对影响因子的计算结果产生明显影响。

  另一项研究成果则明确否定了加菲尔德的第二条辩护理由。一九九六年,学者莫伊德(H. F. Moed)等人为了验证ISI关于“可引用项”定义的合理性,挑选了一九八八年的三百二十份SCI期刊,将“非引用项”的引用次数从影响因子算式分子中完全排除,对“可引用项”(文章、评论和技术通信)的影响因子进行单独计算。结果表明,其中一些刊物上的“非引用项”栏目,其实对影响因子有着很大贡献。

  文章着重列出十家知名杂志(包括《自然》),它们的“非引用项”对影响因子的贡献,比值在6%—50%。其中《自然》算是非常小的,也有11.28%,而《柳叶刀》则高于50%,十家杂志中有九家大幅超出了加菲尔德所宣称的5%—10%的限度。

  值得注意的是,莫伊德等人的论文,发表于加菲尔德二〇〇五年的报告之前九年,而且颇有影响,“谷歌学术”统计显示它在正式刊物上被引已达两百余次。但奇怪的是,加菲尔德在报告中对莫伊德等人研究的结论居然只字未提——很难想象加菲尔德会对此一无所知,因为仅仅一年之前(二〇〇四),加菲尔德和莫伊德两人还合作发表过论文!

  操弄影响因子的捷径:减少分母!

  上一节只是揭示了两栖化杂志上的非学术文本对于杂志影响因子的直接贡献,而实际上两栖杂志的这些非学术文本,对于影响因子还有非常重要的隐性贡献,本文暂且将其放上一放。但是热爱影响因子的人士心中可能仍然不服,他们的义愤正在一系列设问中酝酿起来:好吧,就算我们顶礼膜拜的“国际顶级科学期刊”《自然》《科学》是两栖化期刊,就算它们的影响因子中有非学术文本的贡献,那总还有学术文本的贡献吧?就算非学术文本对《柳叶刀》影响因子的贡献高达50%,那至少还有一半来自学术文本吧?再说了,两栖化又怎么了?两栖化就不公正吗?

  笔者当然也可以故伎重演,反问在本文中有任何一句话可以被解释成“两栖化就不公正”这样的意思吗?当然没有。不过在影响因子这个问题上,规则到底公不公正,到底什么是公正,请先抛弃成见,请先压抑一下对影响因子热爱的情怀,看看下文再下结论。

  笔者在上一节已经指出,国内对影响因子计算公式的表述普遍是错误的。想想许多热爱影响因子的人士,其实连自己热爱的对象是什么都没搞清楚,也真是够悲摧的。而造成这种普遍错误的根本原因,则是因为在中国不存在两栖化的杂志,所以影响因子计算公式的表述者们,都想当然地将分母中的“引用项”数等同于分子中的“源刊文本”数。

  也就是说,对于中国杂志而言,如果是学术杂志,那在绝大多数情况下,它的全部文本都是“引用项”,所以“源刊文本”数就等于“引用项”数;而如果它不是学术杂志,那它的“引用项”就是零,因而也就不可能加入影响因子游戏——因为这将导致在影响因子计算公式中分母为零。

  中国人将公式理解错了,但洋人们可没理解错,尤其是那些影响因子游戏的“顶级玩家”,它们不仅正确理解了公式,而且从公式中看出了操弄影响因子的捷径!

  根据公式,影响因子是一个分数值,要将一个分数值变大,途径当然有两条:一条是增加分子的数值,在影响因子游戏中,就是设法追求更多的引用;而另一条则是减小分母的数值——在影响因子游戏中,这可以通过减少“引用项”数量来达到。

  为此笔者考察了被中国学界顶礼膜拜的《自然》杂志。简而言之,《自然》杂志大幅提升影响因子的捷径之一,就是利用影响因子的计算公式的分母规则,逐渐减少“引用项”(即学术文本)的数量。对《自然》这样的周刊而言,它还有先天的优势—庞大的发表数量,使得它可以在不引人关注的情形下,逐年减少引用项数量。如果把多年数据进行逐年统计和对比,结果颇为惊人,数据表明:

  从“科学情报研究所”(ISI)开始出版JCR报告至今,《自然》杂志一直在持续减少“引用项”的数量,从一九七四年的一千五百零二篇,减少到二〇一四年的八百六十二篇。

  与引用项大幅减少形成鲜明对应的是,过去四十年里,《自然》杂志的影响因子一直在逐年攀升,一九七四年为2.3,二〇一四年为41.5。对应《自然》杂志的影响因子排名,一九七四年位列第五十五,八十年代后期开始跃升,一九九〇年至今一直稳居前十的位置。

  减少学术文本数量可以提升影响因子,原是显而易见的,事实上并非仅《自然》一家有此做法。据二〇〇七年《皇家医学会杂志》(Journal of the RoyalSociety of Medicine)上的一项研究,一九九四至二〇〇五这十余年间,《内科学年鉴》(Annals of Internal Medicine)、《英国医学杂志》(British Medical Journal)、 《美国医学会杂志》《新英格兰医学杂志》《澳大利亚医学杂志》(Medical Journal ofAustralia)、《加拿大医学联合会杂志》(Canadian MedicalAssociation Journal)等著名医学期刊,学术文章数量都在逐年大幅下降。

  这项研究还考察了一个学术文本数量直接左右影响因子的典型案例:《柳叶刀》的学术文本在一九九七至一九九九这三年间曾大幅增加,结果《柳叶刀》影响因子随之大幅下滑,从一九九六年的17.9下降到一九九九年的10.0,排名则从第二十名下降为第五十六名。

  《柳叶刀》主编后来在《自然》杂志上发表文章谈论此事,说此事纯属意外。一九九七年杂志把原本不计入影响因子公式分母的“通信”(letters),分为读者来信(Correspondence)和研究通信(Research Letters),前者不计入公式分母,后者由于走同行评审程序,ISI就将其归为“原创论文”计入分母,这直接导致杂志的“引用项”数量大幅增加。

  《柳叶刀》二〇〇〇年原本计入“引用项”的数量是八百二十一项,经与ISI讨价还价“沟通”之后,“纠正”为六百八十四项。此后《柳叶刀》及时进行“矫正”,大幅削减学术文本数量,影响因子随之一路回升,二〇〇〇年为15.0,二〇〇五年升至23.8,二〇一四年高达44.0,跻身影响因子游戏“顶级玩家”之列。而二〇一四年《柳叶刀》的“引用项”已经减少到只剩二百七十一项了。

  另一奥妙:减少哪些学术文本?

  实际上,杂志在“利用两栖性质减少学术文本以提升影响因子”的策略实施过程中,还另有隐性机制作用于其间:既然决定减少计入分母的“引用项”文章,当然就可以尽量减少以往低引作者或低引主题的文章,而这一点完全可以通过考察该杂志前几年学术文本的引用情况来做到。

  例如,《自然》杂志二〇〇五年就曾发表过一项统计表明:二〇〇四年《自然》杂志89%的引用数是由25%的文章贡献而得。二〇〇二和二〇〇三年《自然》共发表约一千八百篇引用项,其中只有不到一半的文章在二〇〇四年被引超过一百次——排名第一的文章引用超过一千次,其余绝大部分被引都少于二十次。

  上述统计结果还表明,论文引用和学科类别直接相关,从二〇〇三年度《自然》发表的论文来看,热门领域如免疫学、癌症学、分子生物学、细胞生物学的论文,引用在五十至二百次之间。而冷门专业如物理学、古生物学和气候学,论文引用通常少于五十次。

  所以,杂志完全可以多登高引文章,少登甚至不登低引文章。

  这里需要特别补充一点:一本杂志要实施上述“自主选择”,前提条件是,它不能是国内学者想象中的“学术公器”—匿名审稿并由编委会决定稿件的刊用与否。而《自然》这样的杂志恰好不是这种“学术公器”。

  《自然》杂志现任主编坎贝尔(Philip Campbell),在《〈自然〉百年科学经典》一书的前言中,对中国读者说了一段“掏心掏肺”的大实话,对于我们理解《自然》杂志的性质非常有帮助:

  我们在编辑方针上是独立的,我们应当发表什么内容由我们自己来判断。……但我们没有编委会,所以我们经验非常丰富的编辑人员可以不受约束地就哪些论文会对不同领域产生重大影响做出自己成熟的判断。完全独立的另一个好处是,在判断我们的读者喜欢阅读什么样的内容时,我们可以不必苛求意见一致,我们的学术思想可以更加灵活。

  这段话的要点是:《自然》杂志并非国内通常意义上的学术刊物——因为它既不实行学术同行的匿名审稿制度,也没有编委会。

  讨价还价和黑箱操作

  上文《柳叶刀》案例中,同一类型的文本,归入“通信”栏目就不算“引用项”,归为“研究通信”栏目就算“引用项”,还暴露了影响因子规则存在的另一漏洞:两栖刊物栏目繁多(比如《自然》目前就有十八个),而各刊物对栏目的命名并不统一,除了“综述评论”和“论文”之外,ISI对刊物其余栏目是否归属“引用项”,界定并不明确。

  《自然》和《科学》杂志就都有这种情况,加菲尔德在早年文章中,曾专门指明,除“评论”之外,《自然》归为“引用项”的栏目是“论文”和“通信”,《科学》归为“引用项”的栏目是除“评论”之外的“论文”和“报告”(report)。而对《科学》上的常设栏目“通信”不算为“引用项”的做法,加菲尔德的解释是:“不可将《科学》的‘通信’混同《自然》的‘通信’,因为后者相当于《科学》上的‘报告’。”

  按实际发表内容而不仅凭名称来决定栏目归属,虽合乎情理,但问题在于,由于人力的限制,ISI很难仔细甄别所有两栖刊物的每一期、每一栏目,这就为刊物提升影响因子留下了操作空间。

  二〇〇六年,美国《公共科学图书馆医学杂志》(PLOS Medicine)在题为《影响因子游戏》(The Impact Factor Game)的文章中披露,杂志二〇〇五年首次被SCI收录的时候,他们曾通过邮件、电话、面谈等方式展开说服工作,试图让其时已归属汤森路透旗下的ISI少算分母项,而类似做法在行内已是公开秘密,“编辑们都试图说服汤森路透减少杂志的分母数,而公司拒绝把挑选‘引用项’的过程公之于众”。几番接触下来,他们意识到,除原创论文之外,汤森路透公司对余下哪些文本应该归入“引用项”,完全含糊其辞。《公共科学图书馆医学杂志》的情形是,分母项如果只包括原创论文,影响影子将达到11,如果将所有文本全部包括在内,影响影子将直降为3。从最终结果来看,杂志的这番讨价还价似乎产生了效果,二〇〇五年它的影响因子是8。

  照这样看,为了影响因子计算公式的分母数值大小,和汤森路透讨价还价的事是经常发生的。计算公式虽然年年在JCR报告上公开表述,但具体到某本杂志,其中的分母数值到底怎么计算,却大有上下其手的空间,而汤森路透是不会将计算过程公之于众的。

  如果《公共科学图书馆医学杂志》所言,期刊和汤森路透公司之间“讨价还价”的做法已如此普遍,公司又坚持黑箱操作,则其间是否存在“权力寻租”性质的问题,很难不引人遐想。比如,我们可不可以进一步设想,作为一家精明的商业公司,这样的规则漏洞有没有可能是“科学情报研究所”最初有意留下的呢?

发表评论 (已有 条评论)

  

评论列表

    快来评论,快来抢沙发吧~