财新传媒
位置:博客 > 知识分子 > 批量造假的 “论文工厂”:利益链、危害与对策

批量造假的 “论文工厂”:利益链、危害与对策

pixabay.com
 
编者按
 
2020年2月27日,《科学》(Science)杂志网站刊登了致力于揭露学术不端的伊丽莎白·比克(Elisabeth Bik)的相关文章引发争议,Bik博士和其同伴通过比对技术发现400多篇造假论文可能来自同一个 “论文工厂”。此事给各大顶级期刊带来连锁效应,一年之后(2021年3月25日),《自然》(Nature)再次发文,RSC Advances 执行编辑劳拉·费舍尔(Laura Fisher)经过一年的调查,撤下了 RSC Advances 中68篇有问题的论文;另外两个RSC的编辑也因同样的原因各撤下了一篇,截至发文时还有15篇论文仍在调查中。而这些论文,全部来自中国医院的医生。[1]
 
RSC表示,自己是 “众多遭受此类行为影响的出版社之一”。现实情况也的确如此,据《自然》的一项分析,自去年1月以来,各期刊已经撤下了至少370篇与 “论文工厂” 有关系的论文,而且未来预计还会有更多的论文被撤稿。
 
为了抵制 “论文工厂” 的论文突破审查被刊发,各大出版社采取了相应措施,如聘用专门的外部核查分析人员以及开发识别软件,但如Bik博士所言,“论文工厂” 背后原因仍被指向中国医院医生乃至整个学术圈的评价体系,拥有隐秘而成熟的利益链,需要更多的关注和干预措施。
 
撰文|裴磊 夏华向
 
责编|刘楚 王雨丹
图1 Nature出版集团对来自中国医院作者论文的数据统计图,数据截止到2021年3月18日。
 
(图源:Holly Else & Richard Van Noorden, The fight against fake-paper factories that churn out sham science, 2021, March, 23 https://www.nature.com/articles/d41586-021-00733-5.)
 
事情要回溯到2020年2月27日,《科学》(Science)杂志网站刊登了一篇题为 “A single ‘paper mill’ appears to have churned out 400 papers, sleuths find ” 的文章,该文通过调查发现400多篇造假论文可能来自同一个 “论文工厂“。这项调查背后的主角是伊丽莎白·比克(Elisabeth Bik)(图2),她出生于荷兰,此前是斯坦福大学的一名微生物学家,现在在加利福利亚森尼韦尔任职分析顾问。她因为与同事一起通过比对技术披露了400多篇造假论文可能来自同一个 “论文工厂” 而备受关注。
 
Bik与同事的调查发现,这些有问题的论文分布在不同的学科,包括儿科学、心脏病学、内分泌学、肾脏病学和血管外科等,论文的作者都来自中国的医院(《自然》统计Nature tally:Nature analysis of papers alleged to come from paper mills )。
图2 致力于识别伪造的微生物学家伊丽莎白·比克(Elisabeth Bik)
 
(图源:https://petapixel.com/2019/05/16/this-microbiologist-can-spot-your-fake-images/)
 
类似的文章一年后又刊发在了《自然》(Nature)上,内容仍直指中国的 “论文工厂”。
 
今年3月23日,《自然》(Nature)上一篇题为 “The fight against fake-paper factories that churn out sham science ” 的文章显示,RSC Advances(RSC,Royal Society of Chemistry,英国皇家化学学会)的执行编辑劳拉·费舍尔(Laura Fisher)注意到投给 RSC Advances 的一些研究论文并没有共同的作者或机构,但它们的图表和标题却惊人地相似。她心生疑窦,调查了一年后,今年1月,她撤下了 RSC Advances 中68篇有上述问题的论文;另外两个RSC的编辑也因为同样的原因各撤下了一篇,截至发文时还有15篇论文仍在调查中。而所有的这些论文,都来自中国医院(的医生)。
 
在RSC发表的声明中,他们表示自己是 “众多遭受此类行为影响的出版社之一”。现实情况也的确如此,文章显示,据《自然》的一项分析,自去年1月以来,各期刊已经撤下了至少370篇与 “论文工厂” 有关系的论文,而且未来预计还会有更多的论文被撤稿。
 
这些 “血淋淋” 的数字看起来惊人,但实际情况可能比这更糟。上述文章指出,与各 “论文工厂”斗智斗勇的出版社和研究者们怀疑,他们触及到的只是造假论文的冰山一角。国际出版伦理委员会(COPE,Committee on Publication Ethics)的编辑们称,他们曾碰到过来自计算机科学、工程、人文和社会科学等领域的 “论文工厂”。
 
但就目前而言,各期刊在撤稿的时候似乎都给论文作者保留了 “最后的颜面”:各期刊几乎从未在撤稿声明中明确表示某项研究来自于所谓的 “论文工厂”,因为这很难证明。
 
除了论文 “工厂造” 之外,文章还提到,关于论文造假的另一个问题是僵尸论文(Zombie papers):被A期刊怀疑造假的论文被拒稿后,过段时间又神不知鬼不觉地发表在了B期刊上——即便拒稿,期刊也无法彻底 “杀掉” 这篇论文,只能任由它在其他期刊任意流窜并伺机发表。
 
在FEBS出版社工作的克里斯托弗3年前在FEBS旗下的期刊发现了13篇雷同论文,期刊根据她的建议选择了拒稿。今年,她又关注到这13篇论文,发现这些论文都被其他期刊接受并发表了,只有3篇被撤稿。
 
全球最大的科学出版商Elsevier的事务负责人 Catriona Fennell 也表示,论文发表中存在的欺诈问题并不是新问题,也不仅限于中国。他们同样遇到过伊朗和俄罗斯的研究人员涉嫌 “论文工厂” 的事件。
 
利益链
 
Bik博士与很多中国学者均认为,论文造假背后的原因可能是医生为了在短期内获得晋升或者其他利益选择铤而走险,购买这些 “论文工厂” 的假论文并在国际期刊上发表。
 
不同于社会上受众较广的大众期刊,学术期刊具有学术成果评价和推广属性,作者大多是专业领域的学者或研究人员,除了要提供高质量的研究论文,往往还需要支付相应的出版发行费用(简称版面费APC)给出版社。
 
公开刊例显示,就施普林格·自然出版集团而言,可选开放获取(Open Access, OA)期刊有2051本,完全OA期刊有596本,价格在690美金-5380美金不等。爱斯维尔Elsevier的APC在150加元至6000加元之间(不含税)。[3]
 
此外,近年来,开源(OA)期刊如 “雨后春笋” 般兴起,各种形式的征稿与出版行为已被接受。
 
值得注意的是,约稿、论文查询、润色等服务宣传推广很大程度上并不是来自出版社本身,而是来自某些中介公司。许多需要发表论文的教师、医生与科研人员都会接到来自这些中介的宣传信息,询问是否需要发表论文与 “服务”。
 
中介公司并不像期刊出版社本身那样有严格的管理规定,他们中有些以自己代理许多期刊的名义,不仅冒充期刊出版社征集稿件,也进行代写、代销甚至刊发论文的业务。有些公司私下联系 “枪手” 或 “论文工厂”,通过高额有偿服务为没有时间但需要论文发表的作者提供所谓的 “一条龙服务”,帮助作者在代理刊物上发表 “假论文”。当 “假论文” 出版后,作者便可通过论文获得职业晋升或高薪职位 [4]。
 
2020年5月,一名来自国内某著名医学院的硕士研究生张同学在一份国内科学杂志上发表了他的第一篇学术文章。此后,他的电话和微信不停收到所谓的论文服务公司的推销信息,这些公司可以提供以他的名义写学术论文的服务,主题不限。推销人员向张同学承诺,只要花费约6万元人民币(9000美元),这些文章就可以在SCI医学杂志上发表。张同学认为,这些销售人员实际上可能来自一个更大、更模糊的体系—— “论文工厂”,这是一个在灰色地带不断发展的行业,致力于生产和贩卖假论文,而且形成一定规模的产业链,医生、教师和研究人员为了寻求职业晋升与经济回报,也在不知不觉推动这个行业的发展壮大(图3)。
图3 期刊出版社、中介公司、“论文工厂”、以及作者之间形成了一个错综复杂的利益链(由裴磊根据《论文买卖利益链》与《揭秘学术论文的利益链》创作)
 
危害与对策
 
实际上,在Bik博士的文章发表之前,中文论文的学术声誉和影响力相比于解放初期已大大降低,较少有被肯定有价值的学术论文被国内外同行所引用,受 “假论文” 风波的影响,大量论文结果的真实性受到质疑,这导致国内学术论文质量不被认可,学术评价标准的天秤逐渐向国际学术期刊尤其是SCI期刊倾斜,最终使得这场学术 “瘟疫” 向SCI期刊蔓延。
 
近年来,由于来自中国作者的学术论文撤稿率逐渐增加,有些期刊编辑开始对来自中国医院与科研机构研究人员的投稿给予 “特殊关照”,体现在对结果与原始数据的审查更加细致,导致中国作者的研究论文发表难度普遍增加。
 
从出版行业与期刊角度来看,为了应对 “造假工厂”,许多期刊已开始聘请 “分析师”,希望能找出有 “问题” 的稿件。例如,去年Wiley(全球历史最悠久﹑最知名的学术出版商之一)雇用并培训了11名专业人员,试图在24份期刊上已发表的论文中找出伪造的()数据结果,并希望将该项目扩展到更多的期刊与出版集团。为了提高筛选的效率与准确性,Wiley已经与研究小组合作开发了能够在已发表的论文中检测出可能造假图像的软件。
 
大型出版商需要能够大规模处理论文的软件,并能够直接对接同行评审过程,理想情况下,还能够同时比较多篇论文的大量。然而,目前大多数出版商的期刊还没有使用图像软件来对稿件进行检测,原因是检测过程既耗时又费钱,能够高效大规模筛选论文的软件还没有。
 
以色列的 Proofig in Rehovot 公司和东京的LPIXEL公司(图4)宣称,出版商可以上传研究论文到他们公司的 “云端软件桌面”,软件在1-2分钟之内就能自动对论文中的进行提取和分析,例如的复制、拼接、旋转、翻转、拉伸或过滤等信息。这两家公司现在还不愿公开客户的名字,但都表示他们在科学出版社和研究机构中已有付费客户。另一家使用软件检测的公司是位于意大利Samone的Resis。此外,美国纽约大学的一个研究小组也在开发能在多篇论文之间比对图像的软件,该软件正在给出版商试用。
图4 提供对论文中的图像进行提取和分析服务的以色列Proofig in Rehovot公司(上)和东京LPIXEL公司(下)官方网页截图
 
从政府层面看,2020年2月,中国科技部开始引入和制定(发布)迄今为止最全面的处理科研不端行为的准则。2020年8月21日,《自然》杂志网站刊发一则题为“China’s research-misconduct rules target ‘paper mills’ that churn out fake studies ” 的新闻,提到中国政府已对 “论文工厂” 生产 “假论文” 这一不端行为采取了针对性措施,并颁布了一系列法律法规。
 
这些法规列出了具体的违法行为及其惩罚措施。首先,法规适用于任何从事科学技术活动的人,包括研究人员、审查员和机构负责人。对于研究人员举报自己的违法行为或承认错误并试图改正的,将从轻处罚;但对屡教不改、掩盖不当行为或恐吓举报人的,将予以严厉处罚。惩罚措施包括警告、取消奖金、奖励和荣誉称号,严重的甚至暂时或永久禁止研究人员申请政府研究经费。
 
法规列出的违规行为首次包括了涉及论文服务的独立经营公司的违规行为,比如出售学术论文、伪造数据以及代表研究人员撰写、提交甚至发表论文。这一规定旨在对冒险使用 “论文工厂” 服务的研究人员以及 “论文工厂” 相关产业起到双重警示作用。
 
2020年2月,科技部印发了《关于破除科技评价中 “唯论文” 不良导向的若干措施(试行)》的通知(图5),强调重视分类考核评价、注重评估成果的经济社会价值和影响力等。
 
“论文造假” 倒逼科研评价体系改革,但到底什么是更好的评价体系,如何将更公平的评估落到实处,可能还需要一个逐步探索的过程。
图5 2020年2月,科技部印发了《关于破除科技评价中“唯论文”不良导向的若干措施(试行)》的通知
 
作者简介
 
裴磊,华中科技大学副教授
 
夏华向,Journal of Clinical and Translational Hepatology 主编
 
参考资料
 
1.Holly Else & Richard Van Noorden, The fight against fake-paper factories that churn out sham science, 2021, March, 23 https://www.nature.com/articles/d41586-021-00733-5.
 
2.ISOBEL COCKERELL, China’s ‘paper mills’ are grinding out fake scientific research at an alarming rate, 2020, November,9.
 
https://www.codastory.com/waronscience/china-fake-scientific-research/
 
3.SCI期刊版面费知多少https://zhuanlan.zhihu.com/p/107031643?from_voters_page=true.
 
4.闫岩,论文买卖利益链,《科学新闻》 2010.03:48-50.
 
5.杨宇勃,揭秘学术论文的利益链,《清风》 2017.(000)003:29-31.
 
6.Smriti Mallapaty, China’s research-misconduct rules target ‘paper mills’ that churn out fake studies, 2020, August, 21 https://www.nature.com/articles/d41586-020-02445-8.
 
7.Richard Van Noorden, Publishers launch joint effort to tackle altered images in research papers.2020, May, 13. doi: https://doi.org/10.1038/d41586-020-01410-9.



推荐 0