doi
一种数字信息进行标识的工具
数字对象标识符(Digital object identifier,简称DOI)是一组由数字、字母或其他符号组成的字符串,是一种永久标识符或句柄,任何实体(数字、物理或抽象)都可以通过称为DOI号的全球唯一且持久的标识符来识别。
DOI起源于出版业内三个(国际出版商协会,国际科学、技术和医学出版商协会,美国出版商协会)的联合倡议。该系统于1997年法兰克福书展上发布。同年,DOI基金会成立,负责开发和管理DOI系统。从1998年起,基金会与INDECS项目(1998-2000)以及在此基础上开展的一系列后续和持续举措密切合作。DOI系统提供了一个技术和社会基础设施,组织可以在该基础设施上构建应用程序来为用户或用户社区提供服务。2010年DOI通过了ISO国际标准认证。截至2015年,全球已有1亿个已经分配并解析的DOI编码,9个RA(DOI注册代理机构)和上万个注册单位,使用范围跨越了美国欧洲澳大利亚以及一些非英语国家,应用领域也从数字文献出版商扩展到政府部门。爱思唯尔、Blackwell、John Wiley、Springer等大型出版商大多使用DOI对数字资源进行标识,形成了比较完整的命名、申请、注册、变更等管理机制,DOI的解析系统发展也比较成熟。
DOI具有唯一性、永久性、开放性、动态维护性、多项解析、动态追踪、版权保护等特点,DOI是实现开放式知识链接的基础,促进了资源整合与共享,有效保护了数字资源的知识产权
概述
DOI是一组由数字、字母或其他符号组成的字符串,用于标识数字化的内容资源,可以分配给任何使用网络的数字实体,广泛用于识别学术、职业和政府信息,例如期刊论文、研究报告和数据集以及官方出版物。也可以被用于识别其他类型的信息资源,例如商业视频等。可以通过将DOI绑定到元数据(如URL,即网址)来找到对象的位置。它既有一套为资源命名的机制,也有一套将识别号解析为具体地址的协议,基于Handle System的实体识别系统,用于解析标识符的全球分布式系统。DOI号可以解析为资源,例如Web或互联网资源、描述实体的元数据、可访问更多资源的登陆页面等。
发展历程
DOI的诞生可追溯到1994年美国出版商协会(The Association of American Publishers,AAP)下属“技术授权委员会”(Enabling Technologies Committee)的成立,该委员会的任务是设计一种在数字环境下保护知识产权和版权所有者商业利益的系统。DOI系统由国际出版商协会,国际科学、技术和医学出版商协会,美国出版商协会倡议并建设的。起初,DOI系统只服务于文字出版类资源,作为数字环境下进行版权管理和保护的工具,公众认为DOI系统是一个能够胜任管理和识别数字网络内容、标识整合数字资源和多媒体应用的通用框架。DOI于1997年发布于法兰克福书展,由IDF(世界银行机构发展基金)对DOI系统进行管理和功能完善。IDF认为Handle System是具有迄今为止最完善的管理数字对象架构,因此DOI选择基于Handle System来进行研发,但对于管理知识内容、促进电子商务建设的DOI系统还需要在Handles基础上增加新功能以完善其框架DOI系统建立后,IDF选择CNRI作为其技术合作伙伴,且从1998年开始参与INDECS项目INDECS框架支持DOI数据模型。IDF在CNRI的配合下,制定了DOI标准和相应的解析系统Handle System。2000年,DOI语法通过了NISO标准化,2010年DOI系统被ISO批准为国际标准。该标准规定了数字对象标识符系统的语法、描述方式和解析功能组件以及DOI名称的创建注册和管理的一般规则。于2012年5月DOI标准正式出版印刷。
多数西文出版社和全文数据库均采用了DOI作为文章的唯一标识,DOI已经在许多领域中得到实际应用,其中包括,、Blackwell、John Wiley、Springer等大型出版商大多使用DOI对数字资源进行标识,以及中国的出版社,如、中国科学出版社等;也包括小型的、非赢利性的行业协会或学会,如(ACM)、英国(CUP)、出版社(OUP)、中国的中国力学学会等;还包括新型的开放性出版社,如Biomed Central;部分二次文献出版社如CABI Publishing也是联盟成员;另外,还有国家或国际组织,如WHO Press(出版社)和以及信息服务机构,如日本科技机构()、德国科技信息所(TIB)等。根据CrossRef的统计,截至2015年4月27日,加入CrossRef的出版商和学会共计4733个,图书馆1950个,覆盖期刊38895个,其中非营利性出版商占比57%,DOI国际标准在科技期刊数字化和国际化方面的应用,已越来越成熟。截至2020年12月31日,有超过15000位成员或者组织加入了CrossRef,并且有超过1.28亿个学术内容项目的元数据存存储。
结构与规则
DOI的编码方案(即美国标准ANSI/NISO Z39.84-2000)规定,DOI的结构式为:\u003cDIR\u003e.\u003cREG\u003e/\u003cDSS\u003e,DOI分为前缀和后缀两部分,中间用一斜杠分开。对前缀与后缀的字符长度没有任何限制,因此DOI编码体系的容量是无限的。DOI的命名结构使每个数字资源在全球具有唯一的标识。DOI不同于URL,它是数字资源的名称,而与地址无关。实际上它是一种URI(Universal Resource Identifier,统一资源标识符)或URN(Universal Resource Name,统一资源名称),是信息的数字标签和身份证。DOI使信息具有了唯一性和可追踪性。下面几例为是DOI的合法编码:
10.1234/567810.23416
10.5678/978-0-7645-4889-4
10.1000/ISBN0764548891
10.1234/Norman..presentation10.2224/2003-1-29
DOI前缀由两部分组成,一个是目录代码,另一个是登记机构代码。前缀中又以小圆点分为两部分,\u003cDIR\u003e为DOI的特定代码,其值为10,用以将DOI与其他应用Handle System技术的系统区别开。\u003cREG\u003e(Registrant Code)是DOI注册代理机构的代码,由DOI的管理机构IDF(International DOI Foundation,国际DOI基金会)负责分配,由四位及以上阿拉伯数字组成。
DOI后缀是一个在特定前缀下唯一的后缀,后缀\u003cDSS\u003e(DOI Suffix String)由DOI注册代理机构,由登记机构分配并确保其唯一性。后缀可以是任何字母数字码,其编码方案完全由登记机构自己来规定。后缀可以是一个SN码,或者是一个已有的规范码。主要是学术出版商自行给出,规则不限,只要在该出版商的所有产品中具有唯一性即可,因此各出版单位期刊文献DOI后缀编码组成也就有所不同,例如国际标准书号ISBN,国际标准刊号ISSN,国际标准文本代码ISTC,出版物件标识符PII等。
根据IDF(International DOI Foundation,国际DOI基金会)出版的DOI手册中规定,DOI编码不区分大小写,并且必须能被任意DOI系统识别。例如:DOI编码“10.1234/abc”与“10.1234/ABC”实际上是完全相同的DOI编码。
根据DOI编码的语法规则,后缀可以为包含任何字母和数字的字符串。在实践中,建议只使用数字、字母(0~9,a-2,A~Z),以及某些标点符号,包括连字符(“_”或2DHex)、句点(“.”或2EHex)以及下划线(“_”或5FHx),而不要使用任何其它ASCII字符或U007F以上的字符。例如:10.XXXX/LJ Not Ref d Ginthner 0120052 中的“i”,同时,为了能够正确的注册和使用DOI编码,避免在DOI编码中使用某些字符,包括“#"、“\u0026”、“\u003c”、“\u003e、“?”、“1”、“\”、“、“+”、“space”、“;”、“%”、“@”。下面就是一个有问题的DOI编码:10.XXXX(SICD1096-8652(200004)63:4\u003c205AID-AJH8\u003e33.C0:2#。这个例子中使用了应该避免的字符“\u003c”、“\u003e“.”、“#”,在注册DOI编码时会引起错误。
表示
DOI号前面应带有小写“doi:”,除非上下文明确表明隐含DOI号。“doi:”标签不是DOI号值的一部分。例如,DOI号“10.1006/jmbi.1998.2354”显示并打印为“doi:10.1006/jmbi.1998.2354”。此表示符合IETF规范RFC 3986的语法,用于表示URI(统一资源标识符),与“ftp:”和“http:”的方式相同。DOI号是可操作的,注册机构可以选择打印DOI代理URL表格。然后,使用一些约定来显示纯DOI号和在线解析,例如:一种简写方式,“本文的DOI号是10.1002/prot.999,当前信息可以在网络上找到”、通过https://doi/10.1002/prot.999”或“...可通过https://doi.org/...获得”。
技术特点
DOI以两种技术为基础:Handle System和\u003cindecs\u003e元数据框架。Handle System是由美国研究创新联合会(Corporation for National Research Initiative,CNRI)开发的技术平台,用于因特网信息的命名、解析和管理。\u003cindecs\u003e(Interoperability of 数据 in E-corn-merce Systems)是一套用于在电子商务环境下实现数据互操作的元数据框架,选择\u003cindecs\u003e作为元数据框架为DOI的多种应用提供了基础。Handle System和\u003cindecs\u003e元数据框架为DOI提供了从单一解析到多重解析的应用,首先应用的单一地址解析机制为用户提供了对数字资源的永久性访问,为了避免资源地址的改变造成用户链接失效,DOI系统对资源地址进行了有效的管理,出版商为其每项资源注册DOI时,要同时向Handle System主机提交资源的DOI名称和网址(URL),出版商负责对DOI数据的维护,当资源地址发生改变,如网络期刊文章从现刊目录转到存档目录时,出版商应通知Handle System主机作相应的改变,以确保链接的有效性。当用户点击资源的DOI索取信息时,用户的请求被传送到Handle System服务器上,Handle System服务器将DOI解析为URL返还给用户终端,使用户实现对资源的访问。对用户来说,无需理会资源地址的任何更动,面对的始终只是同一个DOI。DOI提供的资源链接具有永久有效性。
解析机制
单一解析
单一地址解析机制提供了对数字资源的永久访问。DOI能够唯一性地标识一个单独的数字资源,并且可以保证在网络上永久链接到这个数字资源。因此,DOI系统的核心功能就是将DOI解析到登记注册的URL地址上,通过DOI代理服务器可以方便、可靠地链接到全文。
为了避免由于资源地址的改变而造成用户链接的失效,DOI系统对资源的地址进行了有效的管理。出版商为其每个资源注册DOI时,要同时向Handle System主机提交资源的DOI名称和网址(URL),它们都存放在DOI Directory中。出版商负责对DOI数据的维护,当资源地址发生改变,如网络期刊文章从现刊目录转到存档目录时,出版商应通知Handle System主机作相应的改变,以确保链接的有效性。当用户点击资源的DOI索取信息时,用户的请求被传送到Handle System服务器上,Handle System服务器将查询DOI Directory,然后将DOI解析为URL返还给用户终端,使用户实现对资源的访问。这一切都在后台进行,对用户来说,无需理会资源地址的任何更动,面对的始终只是同一个DOI,DOI提供的资源链接具有永久有效性。
多重解析
DOI提供多重解析的增值服务,更好地促进科技期刊论文等的传播。多重解析是指一个DOI编码,可以对应多个解析地址。即:一个被标识的数字对象会有很多相关资源,并且可能会有多个复本放置于不同的地方。Handle System的多重解析机制使DOI不仅能指向一个URL,而且可以指向多个相关URL,以及其他类型的元数据。下表显示了一个DOI可以解析为多种类型的数据。
优点
唯一性
DOI标识符作为数字化对象的识别符,对所标识的数字对象而言,相当于人的身份证,具有唯一性。这种特性保证了在网络环境下对数字化对象的准确提取,有效地避免重复。
持久性
一个数字化对象的DOI标识符一经产生就永久不变,不随其所标识的数字化对象的版权所有者或存储地址等属性的变更而改变。
兼容性
DOI标识符的兼容性体现在DOI号码的后缀中可以包含任何已有的标识符,例如国际标准书号ISBN,国际标准刊号ISSN,国际标准文本代码ISTC,出版物件标识符PII等。
互操作性
DOI系统提供与数字对象相关的元数据,可以使不同的应用系统了解DOI标识符代表的数字对象,从而为应用系统的互联互通提供了技术基础。
动态更新
在DOI系统中,可对DOI关联的元数据进行动态更新,保证DOI标识符提供的信息的有效性。如对数字对象的链接地址进行更新,可以有效避免“死链”的产生。
国际通用
2010年11月,DOI系统(ISO 26324 Information and documentation — Digital object identifier system)正式成为ISO标准,并于2012年5月10日正式发布。各国相关产业链的参与者可遵循统一的DOI标准对数字对象进行标识、解析链接,可大大降低产业的技术沟通成本和社会沟通成本,促进跨国别、跨语言、跨系统、跨机构的资源链接和共享利用。
DOI相比传统标识符的优势
应用场景
学术研究领域
DOI常用于学术研究领域,为学术论文、期刊文章、图书、报告等数字资源赋予全球唯一的标识符。通过DOI,研究人员可以方便地引用和链接到相关文献的全文或特定部分,提高研究效率。
学术出版领域
DOI在学术出版领域的应用也十分广泛。出版商可以使用DOI标识符来链接到已发表的论文或书籍的电子版,方便读者获取全文。此外,DOI还可以用于出版物的元数据管理,方便出版商、图书馆员和研究人员检索和管理信息。
学术评价体系
DOI在学术评价体系中也有重要作用。学术期刊和出版商通常要求作者在提交论文时提供DOI号,以便将论文与已发表的文献进行比较和引用分析。这有助于评估论文的质量和影响力,为学术期刊和作者的学术声誉评价提供参考。
图书馆和信息管理领域
图书馆和信息管理机构可以利用DOI进行数字资源的标识、管理和检索。通过DOI,图书馆可以将本馆的电子资源与全球的学术资源进行链接,方便读者获取所需信息。同时,DOI还可以帮助信息管理机构对海量数据进行分类、组织和存储,提高信息管理的效率和质量。
其他领域的应用
DOI所标识的数字对象类型越来越广泛,除上述的期刊、图书、科学数据之外,还包括会议录、学位论文、标准、科技报告等各种文献资源,并且于2010年跨越了出版行业,正式进入影视作品领域。2010年6月,成立于好莱坞的娱乐业标识注册(Entertainment ID Registry,EIDR)服务申请加入IDF,并被批准为RA,2011年11月底,其DOI注册量已超过24万。其他类型的数字对象也将逐步纳入DOI的标识范围内。西文DOI的发展充分证明了西方各数字出版商在合作中求生存的理念。通过这种理念的实施,在为图书馆和用户带来了最好的服务的同时,也拓展了整个行业的生存空间。
DOI基金会
国际数字对象识别号基金会(International DOl Foundation)是成立于1998年的非营利组织,它是DOI系统的行政主体。DOI基金会管理DOI注册并为其各自社区提供服务的机构管理数字对象标识符(DOI)系统,保障与DOI系统相关的知识产权,推广DOI的运用,并确保DOI系统的一切改进(如创造维护、注册、解析与相关决策)能为全体注册者使用。2008年通过国际标准化组织(ISO)认证。DOI标准和解析系统是1994年由美国出版协会(American Associate of Publishing,AAP)成立的非营利性组织国际DOI基金会(International POI Foundation,IDF)在美国国家创新研究组织(Corporation of National Research Initiatives,CNRI)的配合下制定的。2012年5月1日《ISO 26324 信息与文档-DOI 系统》由ISO出版,并在ISO官网发布。IDF既是DOI系统的创建者,也是《ISO 26324信息与文档DOI系统》的注册权力机构。
参考资料
数字化内容如何标识?.中国新闻网.2023-11-23
浅谈DOI:什么是数字对象唯一识别符?.四川大学学术诚信与科学探索网.2023-11-23
..2023-11-24
中文DOI.中文DOI.2023-11-23
..2023-11-23
..2023-11-24
An Introduction to Crossref. Crossref.2023-12-10
万方数据声明 ×.万方数据.2023-11-23
万方数据知识服务平台.万方数据.2023-11-23
DOI到底是什么?.AEIC学术交流中心.2023-11-23
DOI编码与印刷指南v1.4.万方数据.2023-11-24
..2023-11-23
..2023-11-24
..2023-11-24
DOI简介与功能.上海理工大学.2023-11-24
..2023-12-10
..2023-12-10
About Us.DOI官网 .2023-12-10
目录
概述
概述
发展历程
结构与规则
表示
技术特点
解析机制
单一解析
多重解析
优点
唯一性
持久性
兼容性
互操作性
动态更新
国际通用
DOI相比传统标识符的优势
应用场景
学术研究领域
学术出版领域
学术评价体系
图书馆和信息管理领域
其他领域的应用
DOI基金会
参考资料