余鹏鲲:400篇论文涉嫌抄袭 ,为何大部分来自中国?

【文/观察者网专栏作者 余鹏鲲】

今年4月,法国图卢兹大学的计算机科学家Guillaume Cabanac等人发现,一些论文中作者有意回避已有的学术用语,而使用生造的同义词进行替换(www.sougou8.com)。对30个计算机短语的非学术同义词进行搜索后,他们发现有860多篇文章存在这样的问题,其中竟然有500多篇文章来自英文期刊《微处理器和微系统》。进一步的研究发现,这些论文如此反常的背后,大部分都可能存在学术不端。

毕竟,把“大数据”改为“庞大的数据”,不太可能是研究者不知情,更大的可能是混淆文本,避免查重。

Guillaume Cabanac等人7月12日将他们的发现和这些文章学术不端的证据,发表在预印本网站arxiv上,希望引起学术界更多的讨论。这一风波发酵到8月,已成为学术界较有影响的舆论事件。近期《自然》新闻(Nature News),作为学术界头部媒体,完整地将Guillaume Cabanac等人的看法和证据进行了转发,进一步将此事推向高潮。

Guillaume Cabanac等人在arxiv上公布了他们的发现和证据

针对这些情况,杂志的出版商爱思唯尔列出了在该期刊发表的400多篇可疑论文,并表示要对这些文章逐一进行“重新独立评估”。国内媒体也进行了跟踪报道,其中问题论文“大部分来自于中国”成了这些媒体标题中最刺眼的部分。中国的学术造假真的有这么严重吗?这次丑闻又会对中国科学家的学术声誉造成什么影响呢?

为何多数可疑论文来自中国作者

最初看到“大部分来自于中国”时,笔者是不愿意相信的。因为中国研究者虽然发生过“汉芯造假”、“基因编译婴儿”、“伪造博士证书当博后”等骇人听闻的学术丑闻,但总体还是相当正直的。

2019年同样是爱思唯尔针对强迫引用发起了大规模学术调查,通过对69000名论文审稿人进行追踪,爱思唯尔最终认定其中有0.1%的审稿人高度疑似强迫引用,表现可疑的总占比大约是0.8%。在这样的一个调查中,没有发现任何一个中国审稿人存在类似行为,足以说明中国科研从业者的操守,绝没有某些人想的那么差。

那为何这次多数的可疑论文会来自中国呢?直觉告诉我们,是否这本期刊的投稿者主要来自中国?是否这本期刊根本就是以学术不端为卖点呢?

可惜并不是这样,从种种角度看《微处理器和微系统》都显得十分正常,来自中国大陆的文章占比排名第二,但和后几个地区并没有很悬殊。国内给该期刊投稿的人员所属的机构也比较平均,并没有出现一家独大的情况。另一个尴尬的现实是,该杂志虽然并非什么权威的科研期刊,但确实在中科院评选出的高水平期刊的列表中。

该期刊主要投稿者所属的地区和机构(没有来自中国的机构)

问题出在哪?笔者注意到大部分可疑的文章都发表在该期刊的特刊上,而且时间大部分在今年早些时候。所谓的特刊,就是学术期刊针对某一主题发出邀约,研究者们在截止时间之前将与主题相关的稿件投给期刊,期刊进行评比并按照计划选用若干篇稿件和正刊同时进行刊发。

特刊稿件的审稿主要掌握在客座编辑(一般是与主编同等地位或该特刊主题领域内学有专精者)手中,不一定需要主编认可,很多时候也常常跳过同行评审就直接录用。

过去看特刊稿件的含金量,主要是看特刊的主题是否与学术相关,再就是特刊的客座编辑是否与多数投稿者存在需要回避的关系。一般而言,除了庆祝特刊(例如某大学成立若干周年特刊)或者给钱就能发的宣传特刊(一般是给民科的,尊重他们的“研究自由”),大部分特刊上的文章是和正刊同等看待的。

几十年来的学术发表实践证明,特刊这一发表方式是行之有效的。那些主题新颖或是社会急需的特刊,能够将尚不成熟的优秀研究内容征集出来,对后续研究者有明显的启发作用,从而带动一批高水平的研究。

因此,这次特刊出问题有其特殊的背景。首先是特刊的规模太大了,自2019年末特刊开始,到2021年第二季度结束的六期特刊甚至将整个杂志的发表量都明显拉高了,特刊收录的文章远超正刊。如此之高的收录量,必然导致文章泥沙俱下。

该期刊每一卷收录文章数量变化

另一个显著的变化是,从2019年末开始,《微处理器和微系统》的审稿时间具有统计学意义地缩短了,从审稿到录用的平均时间从202天,缩短到42天。

不同时期《微处理器和微系统》杂志审稿周期

显然这背后存在着一条利益链,学术不端的参与者、论文掮客、客座编辑和负责学术期刊运营的责任编辑都是利益链上的重要环节。负责期刊运营的编辑在利益驱使下,设立大而无当的特刊;客座编辑对存在的问题睁一只眼闭一只眼,甚至出卖自己的学术名誉;论文掮客在其中上下其手,充当了润滑剂的作用;学术不端的参与者自不必说,这样的行为是很难以无心之举掩饰过去的。

公司名称:安徽滨特尔水处理科技有限公司