010-85800997

世界最大盗版论文网站 Sci-Hub 日益繁忙

2016-05-16 10:42:33   来源:    点击:


一个月前,春天降临伊朗。Meysam Rahimi 坐在电脑前,立刻发现一个问题:如何获取需要的科技论文。他需要为自己攻读的德黑兰阿米尔卡比尔理工大学工程学博士学位写一份研究计划。他的研究涉及操作管理和行为经济学,因此,Rahimi 需要大量资料。

但每当发现相关论文摘要后,下一步遇到的就是支付页面。尽管阿米尔卡比尔理工大学是伊朗顶尖研究型大学之一,但国际制裁和经济困境使其无法订阅大量期刊。为了阅读一篇发表于 2011 年的应用数学和计算机学论文,Rahimi 必须支付给出版商爱思唯尔 28 美元。

在看了摘要目录并计算过后,Rahimi 发现这周仅论文就需要 1000 美元,几乎与他一个月的生活费相当。而且,他将在未来数年里均以这个速率阅读论文。Rahimi 十分恼怒。「出版商并没有给作者任何东西,为何它们要收取运营杂志之外的费用呢?」

许多学术出版商都设置项目,帮助贫困国家研究人员获取论文,但只有一个名为「链接分享」的项目似乎对 Rahimi 有用。该项目要求他与作者取得个人联系,从而获得链接,而该链接在论文出版 50 天后失效。

于是,Rahimi 似乎只面临两个选择:放弃博士学位或非法获取论文。于是,与其他数百万名研究人员一样,他向全世界最大的盗版论文网站 Sci-Hub 求助。Rahimi 并未感到罪恶。在他看来,高价期刊「可能严重阻碍科学发展」。

Sci-Hub 的世界

2011 年,哈萨克斯坦神经学家 Alexandra Elbakyan 创立了 Sci-Hub。目前越来越多的研究人员正在使用 Sci-Hub,该网站已经包含 5000 万篇论文。来自伊朗的下载申请已经超过 260 万,印度 340 万。论文几乎涉及各个学科,从数十年前发表的物理实验到生物技术的最新突破。一周内,Sci-Hub 提供了近 50 万篇爱思唯尔论文的下载。

这些统计数字都来自 Elbakyan 提供的详细的服务器日志数据。但它们并未回答一些基本问题:谁是 Sci-Hub 的使用者、他们在哪里,以及他们需要什么论文。

作为一个被大公司和学术圈谴责为罪犯的人,Elbakyan 出人意料地坦诚直接。在《科学》杂志和她通过加密聊天系统取得联系后,双方建立了一个数据集以供公开发表:从 2015 年 9 月 1 日到 2016 年 2 月的 6 个月内 Sci-Hub 上每一次下载活动的记录,包括每篇文章的数字对象唯一标识符(即 DOI)。为了保护 Sci-Hub 用户的隐私,Elbakyan 先将用户的地理位置信息聚集到最近的城市,而且可用于确定用户身份的 IP 地址也没有被提供。

Elbakyan 还回答了几乎每个问题:关于网站的运营,与用户间的互动,甚至关于她的私人生活。但她不愿透露目前的所在地,因为她仍处于破产、引渡和监禁的风险之中——爱思唯尔在去年向她提起了诉讼。

可能让支持者和反对者都感到惊讶的是,Sci-Hub 的用户不仅限于发展中国家。Sci-Hub 的一些批评者曾抱怨,许多用户本可以通过他们的图书馆获取论文,但还是选择了 Sci-Hub——出于方便,而不是出于必需。相关数据显示,美国是 Sci-Hub 文章的第五大下载国,次于俄罗斯。在 Sci-Hub 收到的文献下载请求中,1/4 来自经合组织的 34 个成员国——那些理应最易获取文献的富有国家。事实上, Sci-Hub 最密集的使用,似乎就发生在美国和欧洲的大学校园里。

去年 10 月,一位美国纽约法官裁定爱思唯尔胜诉,宣布 Sci-Hub 侵犯了出版商作为期刊内容知识产权所有人的合法权利,并要求网站下线。服务器数据显示,这一禁令并没有起到多大效果。尽管 sci-hub.org 的域名在 2015 年 11 月被封锁了,但支持 Sci-Hub 网站的服务器位于俄罗斯,Sci-Hub 使用别的域名重新开张,几乎一秒也没耽误。

谁是用户?

实际上,据爱思唯尔一份发布于 2010 年的报告估计,该年所有学术出版商的下载总数约为 10 亿次,这意味着 Sci-Hub 可能只抢去了 5% 的正常流量。即便如此,许多人仍然担心 Sci-Hub 会扰乱学术出版行业的秩序。美国哈佛大学学术交流办公室主任 Peter Suber 说:「我不支持非法做法。」但他也承认:「一场诉讼不会阻止盗版论文的步伐,也没有什么显而易见的技术手段能做到这一点。」

很容易理解为何期刊出版商会把 Sci-Hub 视为威胁。它像谷歌搜索引擎一样简单,而且,只要你知道文章的 DOI 或标题,它还更有可能找到全文。Sci-Hub 收集了绝大部分曾被发表过的学术文章,并还在不断扩大:当有人搜索一篇还没有录入的文章时,Sci-Hub 就会盗版一份,并将其加入自己的文献库中。

Elbakyan 拒绝说明她究竟是如何获得这些文章的,但她承认和在线权限有关:可合法获取期刊内容的人或机构的用户名和密码。她说,许多学术界人士自愿将文章捐给他们。但出版商曾声称 Sci-Hub 会利用钓鱼邮件让研究人员上当。但 Elbakyan 提到:「我不能确定在线权限的具体来源,但我可以确定的是,我自己并没有发出过钓鱼邮件。」

Sci-Hub 的设计决定了其内容是受学者的需求指引的。Sci-Hub 还有发表在学术期刊上的新闻文章以及开放获取文章。它几乎有求必应。

该网站的活动流量还反映了研究人员的工作生活,流量在白天持续增多,随着夜幕降临逐渐减少,但从不停止。2 月,Sci-Hub 上的论文流量上升到了迄今为止的最高水平:每天超过 20 万个下载请求。

Sci-Hub 共有多少用户?下载请求来自 300 万个独立 IP 地址,但真实数字还要大得多,因为在大学里,数以千计的人共享同一个 IP 地址。Sci-Hub 下载者生活在除了南极洲以外的每个大洲。在他们聚集的 2.4 万个城市中,德黑兰以 127 万个下载请求成为 Sci-Hub 活动最繁忙的城市。

Sci-Hub 使用情况地理分布大体上就像是一张科研生产力地图,但有个别相对富有或贫穷的注重科研的国家位置颠倒了。小国家也各有各的故事。在格陵兰的努克,有人在阅读一篇关于如何最好地为原住民提供癌症治疗的文章。即使内战肆虐,利比亚的研究也没停止:在班加西,有人正在探索在电脑间隔空传输数据的方法;在塞卜哈附近有人正在钻研流体力学。

在美国和欧洲,Sci-Hub 用户集中在科研人员工作的地方。在这 6 个月期间,7.4 万个下载请求来自纽约市,这里高校和科研机构云集。1.9 万个下载请求来自哥伦布,6.8 万个下载请求来自东兰辛,这两个地方分别是俄亥俄州立大学和密歇根州立大学的老家。

弗吉尼亚州阿什本市以约 10 万个 Sci-Hub 请求位列美国城市前茅。乔治华盛顿大学的科技校区、珍利亚农场研究园区以及维基媒体基金会都在这里。但后二者的发言人表示,他们的员工不太可能是这些流量的贡献者。乔治华盛顿大学的新闻办公室则做出了自我辩护,该校最近发表了一篇有关期刊订阅价格剧增对其图书馆预算冲击的在线声明。声明中说:「学术资源不是奢侈品,可它们的定价方式却和奢侈品一样。」

盗版还是正版

尽管爱思唯尔发起了针对 Elbakyan 和 Sci-Hub 的法律斗争,但许多出版行业的业内人士都认为这一举动是徒劳的。「数量实在太大了。」在了解了 Sci-Hub 的数据后,一家大型学术出版企业的一位高级管理人员表示。「这意味着对这些研究者来说,提供合法文献获取途径的尝试几乎完全失败了。」

他说,对在无力负担期刊获取费用的机构工作的研究者而言,出版商「需要让订阅或购买价格更合理」。国际科学、技术和医学出版商协会(STM)拓展项目的 Richard Gedye 不同意这一点。他认为,使用了出版商拓展项目服务的发展中国家学术机构,「有着和北美或欧洲院校近乎等同的获取同行评议科学研究的机会」。

Elbakyan 表示,就算被捕,Sci-Hub 也不会下线。她已经设置了保证 Sci-Hub 继续运转的保障机制,而且现在用户捐款已能涵盖服务器成本。数据还显示 Sci-Hub 爆炸式扩张的阶段已经过去。Elbakyan 说,下载请求中,尚未收录到 Sci-Hub 数据库的文献比例目前稳定在 4.3%。

对她来说,未来更不明朗。爱思唯尔不但以侵犯知识产权的罪名起诉了她,还根据美国《计算机欺诈及滥用法》起诉她非法入侵计算机系统和数据库。「我有可能因为黑客活动突然被逮捕。」Elbakyan 承认。

但正如科研界的其他人一样,Elbakyan 正注视着学术交流的未来在她眼前快速展开。「我会看到事情最终如何发展的。」

标签:论文 世界 网站