过去几年,研究者若想藉由论文的引文资料判断该领域的趋势、确定新的研究方向,或是查询有问题的讯息(例如过度自我引用)时,常会遇到相当大的阻碍。首先,他们需要取得包含引文数据的大型学术数据库,例如Web of Science(WOS)、Scopus的资料使用权限。即使获得了数据库资料的使用权限,他们也无法向大众公开那些在数据库中发现的讯息。 不过这样的情况正在改变,现在大部分论文都会使用一组称为「数位物件识别号」(digital object identifiers,DOI)的数字编号进行标示。DOI系统由非营利组织Crossref进行管理,此协会成员包含约1万5000家出版商、赞助单位及其他机构。在今(2022)年8月,Crossref宣布将全面开放它们数据库中超过六千万笔的期刊相关引文数据资料。 如此大笔的引用资料能被公开使用与下载,很大一部分的原因要归功於学术出版商、研究者与其他利益相关者在2017年合作发起的「开放引用计画」(Initiative for Open Citations, I4OC),鼓励了出版商将引文数据公开。有些大型出版商较晚才加入计画,而《自然》(Nature)期刊的出版商Springer Nature在2018年加入後,也在2019年发表一篇社论,呼吁那些还在犹豫的出版商赶紧加入此计画。 引文数据开放意味着学术研究将更加透明、也更能厘清责任,并提供学者、赞助者、政府单位许多有用的讯息,决定他们该将精力与资金集中在哪些研究领域。不过并不是所有出版社的论文都有被Crossref编入索引,也不是所有被编入索引的论文都可以找到相关的引文资料。像是在今年7月的一篇研究就发现,去(2021)年被索引的论文中有1/3缺乏此数据资料,特别是一些社论(editorials)、简报型论文(letter)、修正(corrections)、书评(book reviews),可能都不会附上参考文献。而2012年旧金山的《旧金山研究评估宣言》(Declaration on Research Assessment, DORA)也警告,绝不能过分的依赖引文数据资料评估一位研究人员的表现与他的研究。 此外,Crossref也认为学术开放性不该只有引文资料,因此他们也允许出版商发布其他种类型的数据,例如作者所属机构、资金来源讯息、数据与程式码可用性声明、能识别单个研究人员的ORCID iD等。 I4OC自2020年开始一直在推动公开研究摘要,让研究人员可以更容易发现、阅读、引用该篇研究。未来,将所有相关数据存放在Crossref的模式可能是学术出版上的常态,也可能成为研究公开透明、可重复的关键。
(Photo by National Cancer Institute on Unsplash)
新闻来源 Editorial.(2022 September 13). Citation data are now open, but that's far from enough. Nature. 609, 441. doi: https://doi.org/10.1038/d41586-022-02915-1