学术出版商爱思唯尔变身“科研服务商”
在大数据和互联网技术的帮助下,爱思唯尔(Elsevier)已经不再满足于仅仅作一个学术出版商的角色,而是欲成为一家服务于科学家群体和科研全过程的服务商。
“每个科学家平均花在搜索信息、了解其他人研究上的时间,大约占到了25%,这实在太多了。”6月11日,爱思唯尔科研应用平台的总监奥利佛‧杜蒙(Oliver Dumon)在上海对财新记者表示,基于大数据与互联网技术,爱思唯尔将不再仅仅帮助科学家发表论文,而是服务于科研的整个过程,让科研更加有效,获得更大的产出。
杜蒙说,要成为一名顶尖科学家,本身是一个艰难的历程。科学家需要自己承担许多角色,包括寻找信息、申请经费、购买设备、招聘自己的团队,并且发表自己的研究,再申请专利,“这是一条很长的道路,能够成功的人也寥寥无几。”
而协助科学家提高工作效率的办法,则包括“如何更快地了解其他人的研究成果”、“
如何更高效地撰写论文“、“如何帮助他们的论文被更多的人看到”等等。现在,爱思唯尔便致力于为科学家提供这样一个平台。
目前,爱思唯尔的科研服务平台包括三个主要部分,包括Science Direct论文数据库、Scopus摘要数据库、Mendeley文献和数据库管理平台。在奥利佛‧杜蒙看来,这已经可以为科学家的研究全过程提供帮助。
在加入爱思唯尔之前,杜蒙曾是美国电话电报公司(AT&T)和EBay网站的研发负责人。在他个人从事科研的时候,也遭遇过许多其他科学家遇到过的难题,例如检索信息低效、数据可视化工具不足、缺乏论文发表途径等等。于是,当爱思唯尔找到他,希望借重他运营电子商务网站的技术来帮助科学家的时候,他便对此事非常感兴趣。
三大数据库 助力科研全过程
在Science Direct论文数据库中,包含了该公司旗下的2500多种期刊和11000多种图书。它们全部被数字化,并通过网络向全球提供服务,该数据库涉及计算机科学、工程技术、能源科学、环境科学、材料科学、数学、物理、化学、天文学、医学、生命科学、商业、经济管理、社会科学等众多学科。数据库中有约900万篇文献,共计达7500万页。
往常当科学家在搜索论文的时候,就像普通人在网上搜索商品一样,未必能一步到位。但在许多电商网站上,网站却可以根据用户的搜索习惯进行大数据分析,从而为他们提供最合适的商品推荐。而在Science Direct数据库中,这一功能也得到了体现。
在采用了新的大数据推荐算法——协同过滤(collaborative filtering)之后,科学家对于推荐论文的点击率增加了三倍,而这种算法正是大多数电商网站所使用的算法。而通过将已证实的数据处理方法和恰当的算法相结合,便可将数据转化为有价值的信息,服务于科研攻关,并提升科研成果的质量。
目前在Science Direct数据库中,自世界各地的论文下载次数每秒钟便达到了25次。而在Scopus摘要数据库中,则包括了来自全球5000多个出版社,共20000多个出版物的5000多万篇文章。
而爱思唯尔科研服务平台的另一组成部分─Scopus,可谓是全球覆盖面最广的科技和医学文献的文摘、参考文献及索引平台。除了来自爱思唯尔自身数据库的论文,Scopus还收录了许多著名出版商的期刊来源,例如Kluwer、Institution of Electrical Engineers、John Wiley、Springer、Nature、American Chemical Society等等。
而且,Scopus还广泛地收录了重要的中文期刊,如:《力学学报》、《中国物理快报》、《中华医学杂志》及其它众多高品质的期刊。这使其成为了全世界最大的摘要和引文数据库,涵盖了15000种科学、技术及医学方面的期刊。
爱思唯尔的文献数据管理平台Mendeley,过去是一款免费的跨平台文献管理平台,同时也是一个在线的学术社交网络平台。在2013年Mendeley被爱思唯尔收购后,不仅对其原有的功能进行了完善,更进一步把它变成了一个“数据库银行”。
杜蒙说,许多研究者在研究过程中都需要建立自己的数据库。但这些数据库在研究完成后,可能就失去了作用,沉睡在科学家的硬盘之中。而在Mendeley平台上,科学家可将自己不需要保密的数据库,存到这个“银行”上与其他的科学家分享。一旦得到引用,数据库的拥有者还可以获得一定的利益,不论是经济上的、或者是学术上的报酬。
杜蒙透露,他们也正在考虑将数据库的引用率纳入一位科学家的论文引用评价体系。
大数据分析 有益学术反腐
在大数据分析技术的帮助下,一方面能帮助勤奋的科学家得到更大的产出;而在另一方面,对于学术欺诈行为、论文中介、付费出版行为的纠举也更加容易。
近期,爱思唯尔旗下的工程索引数据库EI(The Engineering Index)便宣布,不再收录一本印度出版的生物工程类学术期刊Biotechnology:an Indian Journal(《生物技术:印度杂志》,简称BIJ)。
不再收录的原因,是由于该期刊自2014年起所收录的文章质量大幅下降;部分被收录文章的内容,甚至还与生物技术无关。而这些文章大部分来源于中国。
杜蒙表示,如果发现某个期刊的发表情况出现异常变化,例如来自于某个地区的文章异常增多,平台都会启动调查。在过去一年多里,EI数据库共取消了对15本期刊的收录,其中有4本被取消的原因,都与BIJ被取消的理由一样。
杜蒙说,中国科学家进步的速度是惊人的,巨大的投入让中国的科研产出如火箭一般地增长,而爱思唯尔可以帮助他们的工作更加有效。
对于中国科学家经常遭遇的访问国外学术资源的限制,杜蒙则表示,“在勤奋的科学家眼中,还没有听说有任何重要的文章是搜索不到的”。■

