010-85800997

Science:中国“地下”论文买卖依然猖獗

2015-07-17 16:05:30   来源:    点击:



2013 年《Science》杂志曾经发表了一篇详细的调查报告,揭露了中国复杂而暴利的论文买卖产业。

现在,两位计算生物学家通过 PubMed 搜索意外发现,中国从事论文买卖的公司依然在活跃。巴塞罗那基因组调控中心的 Guillaume Filion 和 Pompeu Fabra 大学的 Lucas Carey,从 PubMed 下载了 2012 年1 月到今年 4 月的论文发表数据。他们用自然语言处理技术梳理近两百万论文的摘要,希望从中分析出2014 年的新热点。 

他们发现,提及 CRISPR、lncRNA 的文章明显增多。CRISPR 是一种基因编辑的新技术,被 Science杂志评为 2013 年十大突破之一,lncRNA 的全名是长非编码 RNA,这种 RNA 现在是基因组领域的热点话题。

在这些并不令人意外的发现之中,一个名词显得格格不入。这是一个鲜为人知的数据库,名为CISCOM(Centralised Information Service for Complementary Medicine),属于伦敦的补充医学研究委员会。巴塞罗那的两位学者发现,以前每年只有两三篇论文提及 CISCOM,但从二月份开始,这个数据库的出现频率突然上升为一周一次。

Filion 和 Carey 进一步发现,有 32 篇不同主题的文章很奇怪,它们都是分析 CISCOM 已发表数据的meta 分析或综述(也包括一些常用数据库,比如 Google Scholar、PubMed 和 Web of Science)。而且这些文章全部来自于中国,作者是分布在多个城市的 28 个不同研究团队。

Filion 在自己的博文中指出,这些文章有着“令人不安的相似性”。于是,他与 Carey 决定搞清楚到底发生了什么。他们下载了 25 篇有嫌疑的论文全文,并用剽窃检测程序 iThenticate 进行检测,结果并未发现什么问题。

然而,这些文章的讨论部分都含有类似的表述,只有很小的改动。举例来说,一篇文章写道“Importantly, the inclusion criteria of cases and controls were not well defined in all included studies and thus might have influenced our results.”另一篇写道“Importantly, the inclusion criteria of cases and controls were not well defined in all included studies, which might also have influenced our results.”

有四篇文章具有同样的语法错误,比如“our results had lacked sufficient statistical power”中多余的“had”。Filion 和 Carey 发现,这些文章似乎来自于多个模板。可以看出,文章作者主动对文段进行洗牌,这是一种规避剽窃检测软件的手法,与洗黑钱类似。

所有可疑论文都是在 2013 年年底提交的,因此不可能存在发表之后的剽窃。Filion 和 Carey 推测这些文章可能来自于同一家公司。在复旦大学遗传学家 Yao Yu 的帮助下,他们找到了一家公司。这家公司在其网站上宣传可以定制 meta 分析论文,经过联系和询问,该公司给出了报价:影响因子 2 或 3 的 meta分析文章大约 $10,000。

去年 Science 报道了历时五个月的调查,发现了十几家类似的公司。这些公司除了用客户提供的数据草拟论文,还伪造数据、提供论文加名和售卖已完成的论文。

在已完成的论文中,最受欢迎的就是 meta 分析,这可能是因为它们不需要原始数据。2013 年六月PLOS ONE 杂志发表的一篇分析文章指出,从 2003 年到 2011 年,中国 meta 分析文章的增加比美国快 16 倍。不过,Filion 和 Carey 并不打算再深入调查这个问题,“我们不是专门干这个的猎手,我们做的是大数据分析。”

附:2013 年《Scinece》对中国论文产业的调查报告,China's Publication Bazaar

标签:中国 论文