吴洁明,王 帅
(北方工业大学计算机学院,北京100144)
互联网的迅速发展,使信息的存储和传播方式都发生了巨大的改变。这种改变在给版权相关产业带来巨大的发展机遇的同时,也使互联网版权和相关管理工作面临着历史性的挑战,主要表现为:
(1)互联网的虚拟性和自由性导致侵权的低成本与无节制。在数字网络环境下,作品的传播更加快速准确且多样化,但由于在技术上无法限制信息在网络中的传播,导致作品很容易被复制、修改或是移植。导致侵害权利人利益的低成本性,同时也制约了网络出版的发展。
(2)依靠传统的事后纠纷处理机制无法从根本上解决侵权问题。数字作品容易被修改且证据易于灭失,使得权利人难于自证,而对侵权证据的保全通常是采取公证形式,诉讼成本较高。因此,当权利人的利益受到侵害时,很难通过诉讼的方式来维护自己的合法权益。
这种情况下,引发了版权保护的第一次革命,主要是将传统的著作权法律制度及管理模式延伸到互联网领域,形成以“内容保护措施+纠纷处理机制”为基础的版权保护模式。这种模式虽在初期有效,但存在着许多自身无法解决的问题。随着互联网技术与应用的不断创新,如何从根本上解决产业链中各参与者的利益共享和创新实现快速高效的维权机制,已成为互联网版权保护的核心命题。互联网正迎来以“利益共享机制+快速维权机制”为基础的互联网版权保护的第二次革命[1]。
目前,在版权保护方面国内外使用较为广泛的是数字对象标识符DOI(Digital Object Identifier)系统,它是由1998 年成立的非赢利性组织国际DOI基金会IDF(International DOI Foundation)研究设计的,在数字环境下标识和交换知识产权对象的一种开放性系统[2]。
在DOI系统中,出版商将数字作品的DOI命名、元数据及URL信息提交至DOI注册机构进行审核,审核通过的数字作品将存入元数据库和DOI目录库,完成DOI注册[3]。个人用户在网络上检索数字作品时,点击DOI链接,通过DOI注册机构的解析服务得到数字作品的URL,登录到数字作品拥有者的服务器、版权在线购买服务器或其他版权解决机制的服务器,从而实现数字作品的版权保护[4]。
DOI系统已经发展得比较成熟,但是采用DOI标准,就要加入到它的解析系统之中,这不但要将数字作品基本数据提交给外方,每年还要交纳巨额费用,形成国内作品信息集中于外方手中的局面,影响国家文化安全。更重要的是,这种参与和加入DOI系统的方式不能有效解决我国网络环境下的数字版权权属问题,更难以达到保护的目的。因此,中国要成为文化大国,在数字出版和版权保护方面应该走中国特色之路。
中国版权保护中心在多年从事版权公共服务的经验积累和对国际国内互联网版权保护模式研究与探索的基础上,结合我国国情,提出数字版权唯一标识符DCI(Digital Copyright Identifier)体系,以有效应对互联网版权保护面临的挑战。DCI体系主要由三个基础平台构成,分别是数字作品版权登记平台、数字版权费用结算平台和数字版权检测取证平台。通过登记、结算、检测平台的实施并结合DCI相关技术,提供我国数字版权公共服务的新模式。DCI体系现在正处于研究与建设之中。
DCI体系的核心内容是DCI码,它是数字作品权属的唯一标识,可以分配给任何形式的数字作品,包括软件、音频、视频、文本等。数字作品在登记机构进行登记,登记成功后由发码中心分配DCI码。
通过DCI码对数字作品版权信息进行标识,可以逐步建立一个国家级的、统一的数字作品版权元数据库,从而使社会各相关方容易检索到数字作品的权利人和权属状态。当权利人的利益受到侵害或者发生版权纠纷时,通过对版权元数据库的查询,从而确定数字作品的权属。通过DCI码对数字作品权利人和权属状态进行标识的方式,能够有效解决我国网络环境下数字作品版权权属问题,达到数字作品版权保护的目的。
DCI码具有以下特性:
(1)唯一性。一个DCI码只能分配给一个数字作品。
(2)永久性。DCI码分配给一个数字作品后不再改变。
(3)兼容性。DCI码应与现有的数字对象标识符DOI、国际标准书号ISBN、国际标准刊号ISSN、国际标准文本代码ISTC等标识符兼容。
(4)可扩展性。随着DCI体系的逐步推广和应用,DCI码应具有扩展性,从而适应注册机构数量的增加、登记作品数量的增加等情况。
目前,DCI码的设计并没有统一标准,本文在借鉴当前使用较为普遍的几种标识符编码设计规则的基础上,综合考虑DCI码的特性,对DCI进行编码设计。DCI码由前缀和后缀两部分组成,前缀是DCI标识符,后缀是编码详细信息。具体设计如图1所示。
Figure 1 Design of the DCI code图1 DCI码编码设计
各部分说明如下:
(1)第1部分是前缀标识符,采用3位固定英文字符“DCI”表示。
(2)第2部分是编码结构的版本号,采用不定长的数字字符表示。第一次正式发放DCI码标记初始版本为“1.0”,后期每一次版本结构的变化,用新的版本号标记。
(3)第3部分是DCI码发放机构的编码,采用不定长的数字字符表示。国内DCI发码机构采用中国国别代码“142”,发码机构可分为多级。
(4)第4部分是数字作品首次分配DCI时的4位年,采用4位定长数字表示。
(5)第5部分是数字作品权利的状态标识,采用1位英文字符表示,取值范围参照表1。
Table 1 DCI status identification表1 DCI状态标识
(6)第6部分是进行登记的单位编码,采用不定长字符表示,若为个人登记者时可采用个人有效的身份证件号码。
(7)第7部分采用不定长字符表示,可由系统自动分配,也可嵌入其他标识符,如DOI、ISBN、ISRC等。
下面给出两个DCI码示例:
例1:DCI:1.0/142.1/2014/C/1101011913-0101657X/ISRC:CN-A65-12-00033;
例2:DCI:1.0/142.1/2014/S/PDY00001R/00000011。
DCI体系创新地提出了通过DCI码对数字作品版权进行标识的方式,在DCI码的基础上,如何实现数字作品的版权保护、建立利益共享和快速维权的保护体系成为接下来要解决的问题。本文下面给出数字作品版权保护的具体设计方案。
数字作品成功登记后,由发码中心分配DCI码。将DCI码以不可篡改的方式加载到数字作品中,并运用数字水印、信息加密、信息通信等信息技术手段验证数字作品中的DCI码。通过DCI码查询数字作品的版权结构化信息并进行展示,结合使用网络爬虫等技术可以确认作品版权的真伪、明确数字作品的版权归属,从而实现数字作品版权的自动监测、跟踪、取证及证据保全等管理工作,最终达到数字版权保护的最终目标[8]。通过这样的方式,对数字作品版权保护方案进行如下设计:
登记者通过登记机构提供的数字作品版权登记平台进行数字作品登记,登记成功后由发码中心发放DCI码并返回给登记机构,登记机构将DCI码通过特定的水印算法嵌入到数字作品中并返回给登记者。登记者在网站上显示该数字作品时,调用一个通用的DLL组件生成该作品的DCI标签,与数字作品同时进行显示。浏览网站的普通用户点击该标签时,通过触发DLL 组件解析数字作品中的DCI码,将DCI码发送给登记机构,登记机构查找相应的版权信息并返回给DLL 组件进行显示。
参照Handle System 将数字作品版权保护体系构建成一种分布式、可扩展的结构,主要设置全球DCI管理机构GMI(Global DCI Management Institution)、DCI 发 码 机 构DC(DCI Distribute Center)、版权登记机构CRI(Copyright Register Institution)和版权代理登记机构CPRI(Copyright Proxy Register Institution)四 级 机 构[9]。机 构 模型如图2所示。
Figure 2 DCI institution model图2 DCI机构模型
Figure 3 Watermark embedding and extraction图3 水印嵌入和提取
在整个体系中,GMI位于数字作品版权保护体系的顶层,是全球唯一的,而DC、CRI和CPRI可根据具体情况设置为一个或多个。其中,DC 需在GMI机构进行注册,GMI收到注册申请后为DC分配DCI号段并将信息存入目录库,DC获得发码号段后可分发有效的DCI码,DC 需定期向GMI推送自己的服务器组成、服务器地址和端口以及DCI号段如何分布在各服务器等信息。DC向CRI提供发码接口,当CRI对数字作品审核通过后,调用该接口获取数字作品的DCI码。一个CRI下可分布多个CPRI,而一个CPRI对应唯一的CRI。
数字作品版权保护体系是一种分层的结构,在该体系中通过各层机构的相互协作,实现数字作品的版权保护。
DCI码的嵌入和提取是整个版权保护方案的技术核心,本文主要结合数字签名、数字水印和对称密钥加密算法实现。其实现流程如图3所示。
数字作品版权保护方案使用数字认证CA(Certificate Authority)体系进行签名和加密。登记机构对已发放DCI码的数字作品M通过特定的水印算法Embedding将DCI码嵌入到数字作品中:
I=Embedding(M,DCI)
登记机构使用私钥进行签名,得到数字作品:
MW=SigR_key'(I)
为了保证通信的安全性,登记机构使用随机密钥key进行加密,并用个人用户的公钥对随机密钥加密:
Ekey(MW)EP_key(key)
个人用户用私钥解密得到随机密钥:
key=DP_key'(EP_key(key))
个人用户使用随机密钥解密得到签名内容:
MW=Dkey(Ekey(MW))
通过登记机构的公钥进行签名验证:
VerifyR_key(MW)
验证成功后通过水印提取算法获取数字作品的DCI码:
DCI=Extraction(I)
通过CA 体系的使用,保证DCI的嵌入和提取过程的安全性和有效性。每种类型的数字作品都有确定的水印生成算法和相应的水印提取算法,对同一类型的数字作品采用相同的算法加载、提取DCI码。目前,各种类型的水印加载、提取算法已经研究得较为成熟,本文不再作详细介绍。
在介绍了版权保护机构设置、DCI码嵌入和提取流程的基础上,本文给出数字作品版权方案的流程设计。通过DCI码的嵌入和提取,获得数字作品的版权信息,从而确认版权的真伪。具体如图4所示。
该流程主要分为以下几个步骤进行:
(1)数字作品版权登记。登记者对数字作品M进行登记,首先向登记机构提交登记申请,登记机构对登记者提交的数字作品登记申请的数字作品元数据、权力信息等内容进行审查,审查通过后提取出数字作品的特征信息发送至发码中心。
Figure 4 Data flow diagram图4 数据流程图
(2)DCI码发放。发码中心对数字作品的特征信息进行查重审核,审核通过后发放DCI码并将DCI码返回给登记机构。
(3)DCI码嵌入。登记机构将收到的DCI码存入数字作品元数据库,并通过数字水印算法将DCI码以不可篡改的方式加载到数字作品中,生成数字作品MW,并将MW返回给登记者。
(4)DCI码提取。数字作品在网络上显示时,网站浏览用户点击DCI标签会触发DLL 组件。DLL组件通过特定的水印提取算法解析出数字作品MW中的DCI码,并将DCI码发送至登记机构。
(5)数字作品版权信息展示。通过DCI码查询数据作品版权元库,将该作品的作品名称、申请人、权利范围、权利取得方式等权属结构化信息返回给DLL组件,DLL组件生成固定格式的版权信息发送给网站,以供显示。
上述流程为登记者通过登记机构进行的登记,登记者也可以通过代理机构进行登记,代理机构对数字作品进行初步审查,审查通过后,提取数字作品的特征信息发给相应的登记机构,进而完成版权登记业务。
在数字作品版权保护方案中,整个过程需要进行内容认证和身份认证,保证内容的真实有效、通信双方的可信性和数字作品版权的确定性。在通信过程中,如果发生了内容篡改,给予相应的提示信息或者发起第二次会话;如果没有从数字作品中解析出DCI码,提示该数字作品未进行登记;如果该登记用户没有数字作品的信息网络传播权等相应权利则提示侵权信息,并采用信息技术手段保存侵权证据。
在图3 所示的数据流程图中,需要调用DLL组件提取嵌入在数字作品中的DCI码,该组件是可针对不同类型的数字作品进行嵌入的统一接口,对于不同类型的数字作品有相应的数字水印提取算法。通过对DLL 组件的调用完成DCI码的解析并与登记机构进行通信,从而获得数字作品的权属信息进行展示,如图5所示。
Figure 5 DLL component activity diagram图5 DLL组件活动图
DLL组件主要实现以下几个功能:
(1)生成DCI标签。为每个数字作品生成一个DCI标签,与数字作品同时在网站进行显示。
(2)提取DCI码。通过特定的水印提取算法提取DCI码。
(3)与登记机构进行数据交换。与登记机构进行通信,负责通信过程中的加密、解密,将加密的信息发送给版权中心,并接收中心发送的密文。
(4)错误处理。在通信过程中发生篡改或者不能从数字作品中提取出DCI码时,DLL 组件需要做相应处理,向门户网站发送错误详情或者是进行第二次通信。
(5)版权确认。对登记机构返回的数字作品版权信息和数字作品元数据进行一致性审查,如权利人、权利范围等权利信息,不一致则提示侵权。
(6)生成数字作品的版权信息。接收登记机构传送的版权结构化信息,将数字作品的权属信息做成固定格式并加入易碎水印。当门户网站需要显示版权信息时,调用DLL 组件进行显示。在此过程中,如果发生篡改,则不能正确显示版权信息。
DLL 组件主要实现上述几个功能,每个功能做成一个通用的模块以供门户网站调用。DLL 组件是数字作品版权保护的整个流程的核心环节,门户网站通过对DLL 组件的调用,从而完成数字作品版权的自动检测,实现数字作品的版权保护。
本文在给出DCI码概念的基础上,详细描述了通过DCI码的嵌入和提取实现数字作品版权保护的方案设计和流程。以此方案为基础,结合数字签名、数字水印和网络爬虫等信息手段,可以确认作品版权的真伪、明确作品的权属状态,从而实现真正意义上的数字作品版权的检测、跟踪、取证及证据保全等管理工作,达到数字版权保护的最终目标。基于数字版权唯一标识符的数字作品版权管理公共服务体系,能够有效解决互联网版权管理与保护的一系列难题。
[1] Yang Shu-lin,Sun Li,Hu Jie-ping.Research of DCI coding scheme and digital certificates in digital copyright protection[J].Journal of Beijing Institute of Graphic Communication,2012,20(6):38-41.(in Chinese)
[2] Yang Dong-bo,Sun Xiu-ping.Brief account of digital object identifier development[J].Research on Library Science,2014(4):45-48.(in Chinese)
[3] Liu Li-bin,Ren Rui-juan,Dong Wei.The application of digital object identifier system in digital copyright[J].Information Studies:Theory &Application,2009,32(10):60-63.(in Chinese)
[4] Hong Rui.The effect of DOI in periodical publishing and spread[J].News Dissemination,2012(6):15-16.(in Chinese)
[5] DOI News[EB/OL].[2014-10-12].http:∥www.doi.org/announce.html.
[6] Tian Hai-jiang,LüJian-bin,Wang Wei-lang,et al.The question and expectation of DOI system in Chinese periodical[J].Research &Education,2014(4):105-109.(in Chinese)
[7] DOI注册统计[EB/OL].[2014-10-12].http:∥www.chinadoi.cn/portal/Doisum.htm.
[8] Liu Jing,Liu Xiao-wei,Zhang Jin,et al.Research on digital works tort tracking with text watermark[J].Acta Scientiarum Naturalium Universitatis Nankaiensis,2014,47(3):93-102.(in Chinese)
[9] Handle System Documentation[EB/OL].[2014-10-12].http:∥www.handle.net/documentation.html.
附中文参考文献:
[1] 杨树林,孙丽,胡洁萍.数字版权保护中DCI编码方案及数字证书研究[J].北京印刷学院学报,2012,20(6):38-41.
[2] 杨东波,孙秀萍.数字资源唯一标识符发展述略[J].图书馆学研究,2014(4):45-48.
[3] 刘丽斌,任瑞娟,董伟.数字对象标识符系统在数字版权保护中的应用研究[J].情报理论与实践,2009,32(10):60-63.
[4] 洪瑞.DOI对期刊出版及传播的影响[J].新闻传播,2012(6):15-16.
[6] 田海江,吕建斌,王维朗,等.DOI系统在中国期刊应用的问题及展望[J].研究与教育,2014(4):105-109.
[8] 刘静,刘晓威,张金,等.基于文本水印的数字作品侵权追踪问题研究[J].南开大学学报(自然科学报),2014,47(3):93-102.