摘 要:文章在总结区块链技术概念、特征和类型的基础上,创新性地提出了“基础层、驱动层、应用层、标准层”区块链四层架构,阐述和论证了区块链在新闻出版业的七个应用场景:新闻溯源、版权保护、选题策划、编校印发、知识服务、新闻出版大数据和新闻出版智库建设,最后指出了区块链技术应用的两面性问题。
关键词:区块链;区块链新闻;区块链出版;时间戳;非对称加密
中图分类号:G206;TN929.5 文献标识码:A
本文著录格式:张新新.区块链技术在新闻出版业的应用原理与场景展望[J].中国传媒科技,2020(5):7-13.
旨在解决“拜占庭将军问题”和“双花问题”的区块链技术是一项集成创新技术,但不是一种原始创新技术。它是综合运用了数学、密码学、计算机学等跨学科知识,进而整合成一项前瞻应用型的技术。随着比特币的迅猛发展,区块链技术甚至被认为是“继大型计算机、个人计算机、互联网、移动社交之后的第5 次颠覆式计算范式,是人类信用进化史上继血亲信用、贵金属信用、央行纸币信用之后的第4 个里程碑。”[1]
我国政府主管部门高度重视区块链技术在技术和产业变革中的重要作用,国务院《“十三五”国家信息化规划》《新一代人工智能发展规划》《关于积极推进供应链创新与应用的指导意见》等多个调控政策都提到区块链,工信部、商务部、教育部等多部委密集出台的政策中也均涉及区块链。关于单独的区块链政策,早在2016年10月,工业和信息化部信息化和软件服务业司、国家标准化管理委员会工业标准二部联合指导发布了《中国区块链技术和应用发展白皮书(2016)》,阐明政府对于区块链技术的态度:“积极探讨推动区块链技术和应用发展”。[2]2018年5月,工业和信息化部信息中心主编发布了《2018年中国区块链产业白皮书》,指出:“区块链作为一项颠覆性技术,正在引领全球新一轮技术变革和产业变革,有望成为全球技术创新和模式创新的‘策源地,推动‘信息互联网向‘价值互联网变迁。”[3]国家网信办于2019年1月发布《区块链信息服务管理规定》,2019年3月30日发布了“第一批共197个区块链信息服务名称及备案编号”,2019年10月18日发布了“第二批共309个境内区块链信息服务名称及备案编号”,规定“区块链信息服务者应当在其对外提供服务的互联网站、应用程序等显著位置标明备案编号”。[4,5]
2019年10月24日,中共中央政治局就区块链技术发展现状和趋势进行集体学习。中共中央总书记习近平在主持学习时强调,“区块链技术的集成应用在新的技术革新和产业变革中起着重要作用。我们要把区块链作为核心技术自主创新的重要突破口,明确主攻方向,加大投入力度,着力攻克一批关键核心技术,加快推动区块链技术和产业创新发展。”[6]自此,区块链技术已上升到国家战略层面,迎来了发展的最强风口。此后,区块链作为2019年度十大网络流行语,持续掀起社会热潮,并在国民经济各行业都引起了思考和关注,新闻出版业也不例外。
1.区块链技术概述
“区块链”的概念起源于2008年中本聪在密码学邮件组发表的论文:《比特币:一种点对点电子现金系统》,文章指出:时间戳服务器通过对以区块(block)形式存在的一组数据实施随机散列而加上时间戳,并将该随机散列进行广播。每个时间戳应当将前一个时间戳纳入其随机散列值中,每一个随后的时间戳都对之前的一个时间戳进行增强(reinforcing),這样就形成了一个链条(Chain),即“区块链”。2009年,中本聪创立了比特币,并开发出第一个区块,被称为“创世区块”。
1.1概念与特征
究竟什么是区块链?众说纷纭,未有定论。维基百科中文和英文版分别表述如下:“区块链是一种分布式数据库,起源自比特币。”“区块链包含一系列加盖了时间戳的有效交易的区块组成。每个区块都包含了前一个区块的哈希值,这样就把区块连接在了一起。连接在一起的区块形成区块链,并且每一个随后的区块都是对之前一个区块的增强,因此给它取了一个数据库类型的名字。”[7]
笔者采用中国知网下载和引用率最高的《区块链技术发展现状与展望》一文的定义:狭义的区块链,即分布式记账本,是一种数据,一种新型数据。狭义来讲,区块链是一种按照时间顺序将数据区块以链条的方式组合成特定数据结构,并以密码学方式保证的不可篡改和不可伪造的去中心化共享总账(Decentralized shared ledger),能够安全简单存储的、有先后关系的、能在系统内验证的数据。[8]广义的区块链是一种全新的基础架构和分布式计算范式,是完整的带有数学证明的系统框架。广义来看,“区块链技术则是利用加密链式区块结构来验证与存储数据、利用分布式节点共识算法来生成和更新数据、利用自动化脚本代码(智能合约)来编程和操作数据的一种全新的去中心化基础架构与分布式计算范式。”[9]本质来讲,区块链“是一个去中心化的分布式账本数据库,是比特币的底层技术,和比特币是相伴相生的关系。”[10]
区块链的特征主要包括:去中心化、时序数据、广泛参与性、安全可靠性、可编程等特点。
去中心化,是区块链最突出的特有属性,是指区块链的信用关系构建是基于分布式系统结构,不依赖中心化的第三方机构或设施,基于协商一致的规范和协议(如哈希算法),各节点数据自我验证、记账、存储、维护和传输。从信用机理的角度来看,区块链是以去中心化的算法信用(软件定义的信用)来取代中心化的机构信用甚至是国家信用,如比特币的信用体系和现行货币中心化信用体系的关系。
时序数据,是时间戳服务应用的结果,是指区块鏈的链式区块结构数据带有时间戳,被增加了时间维度,进而可验证和可追溯。这一点在产品和服务溯源、版权确权等方面会有较广阔的应用前景。
广泛参与性,是指基于开源技术,“数据对所有人开放,任何人都可以通过公开接口查询区块链数据和开发相关应用”,都可“通过激励机制来参与数据区块的验证过程,并通过共识算法来选择特定的节点将新区块添加到区块链”。[11,12]
安全可靠性,是指采用非对称加密技术,通过工作量证明的共识算法所形成的强大算力来确保区块链数据的不可篡改和不可伪造。除非达到全部数据节点/全部算力的51%以上,否则无法修改区块数据。但是这一点越来越受到挑战,以比特币为例,据统计,F2Pool、BTCChina Pool 、Huobi Pool等中国大型矿池可达到约60%的算力,这就意味着安全性在理论上无法得到确保。
可编程性,是指通过共享海量、灵活的脚本代码系统为用户研发高级的智能合约、货币或其他去中心化应用提供支持,如以太坊的智能合约平台所提供的图灵完备的脚本语言。可编程特点的不断彰显,也推动着区块链技术模式的不断升级:从1.0版的可编程数字加密货币体系,到2.0版的可编程金融系统(目前区块链处于2.0版早期阶段),直至最终的3.0版可编程社会。
1.2区块链的类型
为适应不同的应用场景和需求,根据准入机制和去中心化程度的不同,可将区块链分为公有链、联盟链和私有链。
1.2.1公有区块链
公有区块链,是指允许世界上任何节点都可以加入区块链网络,查询区块链上的任意信息,发送交易并得到有效确认,任何节点都可以参与共识过程。公有链是最早的区块链,也是应用最广泛的区块链,如比特币、以太坊。因没有任何个人或机构可以控制或改写其中数据的读写,故,公有链被认为是“完全去中心化”的区块链。
1.2.2联盟区块链
联盟区块链,也叫行业区块链、联合区块链,是“部分去中心化”的区块链,其达成共识受到群体指定某些预选节点的控制。所有的预选节点共同决定区块链的共识,其他节点只能接入区块链参与交易,但是不问记账过程,同时可通过开放的API(应用程序接口)进行限定查询。联盟链往往用于几个公司或机构、特定行业或特定联盟之间。
1.2.3私有区块链
私有区块链,是“高度集中”的区块链,是指区块网络的所有节点都被掌握在一家机构或个人手中,该机构或个人享有区块链的写入权限,其实质是仅仅使用区块链技术进行记账。在对外完全限制写入权限的同时,私有区块链或许会开放极为有限的读取权限。目前,传统金融的转型,都在考虑私有链的应用,既发挥区块链技术的优势,又确保数据安全。
2.区块链基础架构与技术原理
技术应用原理和应用场景, 是“ ‘出版+技术、‘出版×技术的内核所在、硬核所在,是出版与技术深度融合、科技与出版紧密结合的策略机枢”。[13]非但出版,新闻传播,亦是如此。要探索区块链应用于新闻出版业的场景,就要弄清楚区块链的基础架构和技术原理。
关于区块链的架构,袁勇提出:“数据层、网络层、共识层、激励层、合约层、应用层”的六层架构;[14]谢铉洋提出“共享数据层”“共享协议层”“应用程序编程接口(APIs)和应用程序(APPs)”的三层架构;[15]姚忠将提出“基础层(网络层、数据层)、驱动层(共识机制、激励机制、智能合约)、应用层(应用、服务平台)”的三层架构;[16]沈鑫、裴庆祺、刘雪峰提出“底层数据、分布式记账本、组网方式和核心机制、区块链节点、智能合约、上层应用”的六层架构。[17]
综合以上几种观点,可归纳出新闻出版业的区块链技术应用架构——“基础层(数据层、网络层)、驱动层(共识层、激励层、合约层)、应用层(新闻溯源、版权确权、知识服务联盟、图书发行、大数据(数据存储))”并将“标准层”贯穿始终。
2.1基础层
基础层包括数据层和网络层,数据层封装了数据区块,包括时间戳、非对称加密等关键技术。
关于“区块”:以比特币为例,数据区块包括区块头和区块体两部分,区块头装载了“该区块的版本号、前一区块地址、该区块的目标哈希值和共识过程的解散技术、Merkle根和时间戳等信息”,[18]其作用在于链接到前面区块并且为区块链提供完整性,Merkle根“保证了数据的真实性、安全性和不可抵赖”;[19]区块体则包含了一定时间内该区块的交易数量和所有交易记录,以Merkle树的形式组织起来。关于“链”——单向链式结构,“矿工”将当前区块链接到前一区块,形成最新的区块主链;各区块环环相扣,从而形成从创世区块到当前区块的主链,进而起到记录区块链数据历史、数据溯源和数据定位的作用。
时间戳:时间戳技术是区块链的重要创新点,包含在区块头中,记录数据的写入时间,为数据增加了时间维度,是数据的存在性证明,能够确保区块链数据库的不可篡改和不可伪造。从长远来看,时间戳技术应用于区块链,甚至能够对历史进行回溯和再现。
非对称加密:非对称加密技术是为解决数据安全和身份验证需求而集成到区块链的技术,其主要算法包括椭圆曲线加密算法(ECC)、RSA、Rabin、D-H等,应用场景包括信息加密、数字签名和认证等。
哈希算法:哈希算法用于生成前区块地址、记录信息摘要、交互者地址和Merkle根树数据库等。区块链一般保存数据的哈希函数值(散列函数值),将原始数据编码为字符串计入区块链,如比特币通常采用双SHA256哈希函数,将任意长度的原始数据经过两次哈希运算转换为32字节的二进制数字进行存储和识别。
Merkle树:区块链技术的重要组成,将运算为散列函数值的交易信息按照二叉树状结构组织并保存于区块体之中,其作用在于快速归纳和验证区块数据的存在和完整性。
基础层的网络层则包含对等式网络(P2P)、數据传播和验证机制等要素。
P2P网络(Peer-to-peer network):对等式网络是区块链“去中心化”特点的集中体现,用对等式网络进行组网,网络中的每个节点地位对等且以扁平式拓扑结构互联互通,不存在任何中心化的特殊结构和节点,每个节点都可进行网络路由、验证区块数据、传播区块数据和发现新节点。
数据传播机制:区块链采用广播的方式向全网公布交易信息,区块数据生成后,由生成该数据的节点面向全网其他节点进行广播并验证,节点验证通过后再进行广播直至被全网节点接收。一般并不需要全部节点都接收到,而是由足够多的节点做出响应即可认为交易通过,整合入区块账本。
数据验证机制:对称式网络中的节点接收到广播的数据和新区块后,会验证其有效性,验证通过则继续转发;如果数据无效,则废弃该数据不再广播。以比特币为例,矿工节点主要是从数据结构、语法规范、输入输出、数字签名等方面验证交易数据是否有效。
2.2驱动层
驱动层主要包含共识层、激励层和合约层。
关于共识层:共识层是为了解决拜占庭将军问题,所谓拜占庭将军问题,是指去中心化的节点之间相互缺乏信任,如何达成共识使得所有节点一致行动。在分布式系统中高效达成共识主要由PoW(Proof of Work,工作量证明)共识机制、PoS(Proof of stake,权益证明)共识机制和DPoS(Delegated proof of stake,授权股份证明)共识机制等加以实现。Pow机制是中本聪发明的、应用于比特币系统的共识机制,核心在于通过全网节点算力竞争来确保数据一致和达成共识,优点是通过算力竞争保障系统安全和去中心化,不足时容易造成大量的计算资源、电力资源浪费,且容易引起区块链设备的“军备竞赛”:设备越先进、计算能力越强的节点越容易获得财富。PoS机制,是PoW机制的替代解决方案,区块记账权由最高权益的节点获得,权益评价标准是币龄——节点对特定数量货币的所有权,其优点是提高了节点性能,降低了资源消耗,不足是不准确性导致易受攻击干扰。DPoS机制,“所有节点根据股份权益 (币龄) 投票的方式选出得票最高的 101 个记账代表负责交易的打包和挖矿,减少记账和验证者的数量。”因为大幅减少了验证和记账的节点数量,所以能够达成快速共识。除上述三种主流的共识机制以外,还有Ripple共识机制、PBFT共识机制、Casper共识、Pool验证池等多种机制,不过同样都面临着资源浪费和共识速度的问题。
关于激励层:激励层主要通过发行机制和分配机制来加以实现。区块链的本质是共识节点之间的任务众包过程,而共识节点的逐利性导致其获取最大化的收益是参与记账和验证的目标所在。为此,需要引入激励机制,以确保区块链的长久和稳定运行。发行机制,主要是用代币发行的方式,通过发行区块链定义的货币、收取手续费等来鼓励共识节点去参与记账和验证工作,如比特币、以太币等。分配机制,是指算力小的节点通过加入“矿池”、通力合作、“挖”到新区块并共享该区块“虚拟货币”和手续费奖励的机制。
关于合约层:合约层包含了各类脚本代码、算法机制和智能合约,是区块链商业逻辑的体现。比特币最初通过非图灵完备的简单脚本代码(锁定脚本和解锁脚本)来控制交易过程,即产生了智能合约的雏形。所谓智能合约,是基于不可篡改的数据而自动化执行的规则和条款,是部署在区块链上智能化、可共享、去中心化的信息传递服务程序,一旦具备相关条件、达到响应要求,则自动化执行。随着区块链的深入发展,越来越多图灵完备的智能合约开始出现,如“ 以太坊已经研发出一套图灵完备的脚本语言, 用户可基于以太坊构建任意复杂和精确定义的智能合约与去中心化应用, 从而为基于区块链构建可编程的金融与社会系统奠定了基础”[20]。
2.3应用层
关于区块链的应用层,从不同的维度可做不同的划分,有学者提出了三大应用模式:可编程货币、可编程金融、可编程社会,并设想了六大应用场景:数字货币、数据存储、数据鉴证、金融交易、资产管理和选举投票;也有学者从服务平台和具体服务的角度做出划分,前者是基础应用,由底层数据和计算工具组成,后者是具体服务,如银行记账、医疗信息管理等。以新闻出版业为视角,区块链技术同样存在着众多应用场景,如新闻溯源、版权保护、图书发行、知识服务联盟、新闻出版大数据等,将在后文重点阐述。
2.4标准层
标准和产业是区块链的两翼、双螺旋。区块链产业的快速、健康发展,离不开标准的规范和引领。区块链标准体系贯穿于基础层、驱动层和应用层,并将规范和指导区块链产业链各环节和从业共同体。为确保区块链更快速度、更高质量地发展,区块链共同体要积极参与和主导国际标准制定,加快制定国家标准,配套制定行业标准,鼓励研制企业标准和团体标准。要根据区块链的发展特点和规律,建立健全区块链标准体系,包括:基础性标准(术语和概述、参考框架等)、关键技术标准(智能合约、共识机制、时间戳、账本管理、区块格式规范等)和安全类标准(信息安全、身份认证、证书存储规范等)。要加大对标准规范的宣贯、培训和产业化应用落地,真正发挥区块链标准的引领、示范作用,通过标准的制修订,不断提升区块链领域的国际话语权和规则制定权。
值得欣慰的是,2017年5月,中国区块链技术和产业发展论坛发布了国内首个区块链标准——《区块链参考架构》,系列国家标准《信息技术 区块链和分布式账本技术 参考框架》《信息技术 区块链和分布式记账技术 智能合约实施规范》《信息技术 区块链和分布式记账技术 存证应用指南》等也纷纷获批并步入研制阶段。2020年6月,《区块链技术在版权保护中的应用技术要求—文学、图片作品》行业标准,作为第一项新闻出版领域的区块链行业标准也正式获批立项。
3.区块链在新闻出版业的应用场景分析
关于区块链技术在新闻出版业的应用场景,诸多学者都做出了积极的尝试,大致分为以下几个领域:(1)在版权管理方面,有学者在指出互联网环境下版权之痛的同时,提出区块链的破局之路:“区块链的时间戳效力”“对存证效力的加持”;[21]有学者论述了“作者与作品捆绑及其加密技术保障身份性权利、‘分布式账本-嵌入式确权模式实时保护作品、智能合约最大限度保证著作财产权、交易平台最大限度保护著作财产权”等观点[22];有学者将区块链的“去中心化、智能合约、时间戳等技术与IP版权相结合,提出‘价值去中心化的创新理念和思维”;[23]有学者在对中国、美国、欧洲区块链数字知识资产管理平台分析的基础上,厘清了基于区块链技术的“数字知识资产注册—版权认证—资产交易—侵权追踪”的全过程;[24](2)在学术出版中,有学者结合学术研究中的信任危机,提出了依托区块链数字鉴证、“公钥—私钥”的非对称加密技术等,建设学术出版信任的具体策略:“激励研究过程、遏制撰稿侵权;优化同行评议、激励审稿专家;开放学术评价、避免指标造假”;[25]有学者提出了区块链应用于学术评价的系统设计:“通过时间戳实时确权,用代币和奖励机制激励同行评议,用数据即服务开发评价延伸产品”;[26](3)在期刊出版中,有学者提出了区块链技术原理用于科技期刊的优势:“创建透明的期刊管理工作流、打造可信任的科研评价体系、规范学术评审的权利和义务、深化资源节约型的科研合作”;[27]有学者分析了区块链技术在期刊中的具体应用,如“比特币地址与身份关联、数字签名和时间戳、作者匿名”等;[28](4)在数字出版领域,有学者提出“基于区块链技术的具有舆情监控预测、信息溯源核验、广告效果量化、用户价值回馈、版权确权流转、数字资产管理等功能的数字化出版平台,是实现报纸出版全流程数字化转型的有效路径。”[29]有学者明确区块链与数字出版平台的关联性在于:“时间戳与版权登记”“数字签名机制与版权交易”“智能合约与平台建设”[30];(5)在传统出版中,有人对区块链技术在出版业应用的“完善版权保护机制、创新出版业务模式”[31]“存储图书信息、管理发行、反盗版”[32]等方面进行了展望;有人设想了未来出版的区块链商业模式:“‘免费经营、‘去渠道经营、‘去运营经营、出版物的‘众筹模式”等。[33]
上述观点的可贵之处在于将区块链的技术原理同出版業态、出版生态相结合,设想和提出了解决方案和应用场景;不足之处在于,没有对内从新闻出版产业链环节的角度,深入到编校印发各流程,对外深化到出版大数据、出版知识服务、新闻出版智库建设等具体出版场景,去深思和筹划区块链和出版业结合的应用场景。
3.1新闻溯源
且先从新闻溯源的场景入手,谈一下区块链在虚假新闻应对方面的原理和场景。
新媒体环境下,虚假新闻产生的原因主要包括:利益驱动导致的投机行为、行业媒体和从业者自律的缺失、传统主流媒体的公信力下降,以及无法确定的信息源头等。虚假新闻的泛滥除误人视听、以讹传讹以外,容易造成媒体公信力的下降,有时甚至会酿成严重的舆论事件,扰乱正常的经济社会秩序。解决虚假新闻乱象的重要途径之一便是进行新闻溯源,而区块链技术恰恰在这方面具有天然的优势。
将区块链技术应用于虚假新闻溯源,一则,给每条新闻数据加盖“时间戳”,使得多次传播的新闻具有了时间先后顺序,便可通过时间先后追溯到虚假新闻的源头,使得虚假传播的始作俑者无法遁形;二则,可通过广播方式,向全网发布广播,在区块链中发起虚假新闻源头追随的交易,发动全网的力量去追踪造谣者;三则,可通过共识机制,使得虚假新闻经受区块链大多数节点的考验,在传播的过程中被及时识别和遏制;四则,可通过激励机制,给予最先发现和锁定虚假新闻制造者的节点以经济激励,以在最短的时间内锁定信息源,发现造假者;五则,通过预先设定的条件和程序,当发现虚假新闻时,自动执行智能合约,提升虚假新闻的鉴别效率。最后,可通过联盟链的方式,建立起主流媒体的行业区块链,形成正能量新闻、客观真实新闻的时序数据库,逐步引导和规范新闻传播市场秩序。
3.2版权保护
如前所述,多数学者都围绕区块链在版权保护方面的应用进行过论述。这里仅做简洁归纳和概括:区块链的多项关键技术与版权保护都息息相关,几乎可涵盖版权登记、使用、管理和保护的各个环节。版权确权环节,时间戳技术可确认作品发表时间,进而确认权利归属。版权交易环节,共识节点的广泛共识和记录,具有不可篡改、不可伪造特点,可用于版权公证和审计;智能合约的完善和应用,不受时间和地域限制,可快速达成版权交易,提高版权交易效率。版权管理环节,可通过版权联盟链的方式,以时间为纵轴,以知识体系为横轴,分门别类地对各个时期的各类版权进行有序管理和使用。版权保护环节,基于版权联盟链或私有链,调取带有时间戳的版权数据,形成完整的版权证据链,最大限度地形成版权侵权威慑,及时高效地制止版权侵权行为。
3.3选题策划
传统的出版策划,主要由编辑发起,提出选题创意,然后组织一个或一群作者进行创作。本质上,还是“中心化”的选题组织和创作方式,这一生产方式延续了数千年。其痛点在于个人或某个群体的智慧是相对有限的,以中心化的知识、智慧、经验去创作某个主题的作品,其专业性、全面性和权威性在理论上是受限的,难以涵盖某个主题的全面知识解决方案。
如何以“去中心化”的群体智慧进行选题策划和创作?其解决方案:一是,可以依托于人工智能,“基于群体智能的‘众智众创众筹理念,优化运用智能蚁群算法、人工鱼群算法、烟花爆炸算法等群体智能的算法,可探索研发出众创撰稿、协同创作的工具系统,以起到众筹众智、集中专业领域智慧提供个性化、定制化知识解决方案的效果。”[34]二是,可运用区块链的技术原理,构建专业出版领域的联盟链,如法律出版联盟链、生态文明出版联盟链,或者构建出版企业的私有链,如某出版社私有链。在联盟链或私有链中,静态层面:在基础层建设含有时间戳的选题区块链,辅以知识标引技术,逐步建立健全某细分选题的历史顺序数据库,可追寻细分选题领域的区块链内第一个作者至最近的作者,便于进行选题的归纳和梳理;动态层面:可运用传播机制,就细分选题向全网节点发起广播,得到大多数的共识以后(采用DPoS机制),通过代币发行和分配奖励机制,高效、全面地聚集起细分选题的全链区域内的智力资源,最终以去中心化的方式全面、高效地完成选题策划和组稿工作。
3.4编校印发
于出版而言,编校印发环节所涉及的数据,大多为内部经营管理数据,可尝试构建出版机构私有链。私有链本质上和其他分布式存储数据库没有差别。出版机构可用好本单位编辑加工、审校、复制环节的过程性数据,以时间为序,建设私有链。出版机构私有链研发的意义在于:其一,确保内部经营管理数据处于隐私和安全状态,尤其是盖有时间戳的销售、印制等区块数据,任何个人均无法篡改和伪造;其二,有助于企业文化建设,通过私有链,可以完整地还原和再现出版机构的经营管理历史,构建出网络出版社,为后续入职员工进行系统、完整的企业文化、企业历史培训教育;其三,改进生产方式,提高生产效率,通过专业知识体系标引的审校区块数据,可反映相同或相似稿件在不同的历史阶段所共同出现的审校问题,总结和归纳出“易错审校问题”数据库,有利于提升编辑审稿和校对质量。其四,可将印前定稿的私链内部版权数据与外部版权联盟链进行融合,实现数据互通互融、跨链合作交易,高效快速达成版权交易。
3.5知识服务
“出版本质上是知识生产和知识传播”,从知识服务来看,未来的出版业要完成三个转型:“制造业转型为服务业、产品生产商转型为知识服务商、互联网知识生产体系融合角度对出版价值链重塑”。[35]知识服务,作为时下出版深度融合的重要抓手,作为出版未来转型的最终目标,一直是出版共同体关注焦点所在。
出版机构可根据自身专业知识资源数据构建私有链,其原理不再赘述。这里重点讲一下区块链在国家知识资源服务中心的应用场景。
国家知识资源服务中心,2015年由新闻出版研究院筹建,2016年由原国家新闻出版广电总局办公厅正式批复,共计囊括了三批次、110家新闻出版政产学研机构。目前包含中医药、建筑、农业、法律、知识产权、人文社科等十几个专业领域的知识库,同时还包含知识服务标准体系、学术出版评价、版权保护、新闻出版科研成果、知识服务与版权产业联盟等栏目。[36]
理想状态的国家级知识资源服务中心,应该包含国民经济各行业的知识资源,提供各种形态的知识服务,综合采用各种知识服务模式,代表和展示着国家级的文化形象和文化自信。要想实现这一目标,时下的通过网络接口链接到各出版机构自有网站的方式是难以胜任的。可以設想通过国家知识资源服务联盟区块链甚至是公有区块链的方式加以实现。
国家知识资源服务联盟链的建设,在基础层的构建如下:数据层方面,先要完成知识资源数据区块的研发,形成链式结构,以时间为序,加盖时间戳,以知识体系为内核,进行知识标引。采用非对称加密技术,如果由国家知识资源服务中心发起的知识资源服务交易,使用中心的公钥进行知识资源数据的加密,加密后发送给出版机构,出版机构使用自己的私钥进行解密,解密的过程,也就是知识资源交易的过程;如果由出版机构发起的知识资源服务交易,则由出版机构将私钥信息发送给国家知识资源服务中心,中心使用出版机构的公钥对信息进行解密以确保信息是出版机构发送的。网络层方面,可通过全网任一节点发起广播,发起知识资源交易数据,并经过节点认证。在驱动层,采用DPoS共识机制,选举出得票最高的101家出版机构作为记账代表,负责知识资源服务交易的打包和挖矿,在减少算力资源浪费的前提下快速达成共识。对国家知识资源服务联盟链的所有节点采取代币发行的奖励和分配机制,以调动所有知识服务成员单位的积极性和能动性。然后通过智能合约的研发和完善,启动自动响应机制,对符合条件和规则的知识资源交易快速促成。在应用层,采用可编程货币模式,研发和确定国家知识资源联盟链内部定义和认可的虚拟货币,以虚拟货币进行奖励和分配,条件成熟时可换算成法币。
3.6新闻出版大数据
国内的出版大数据案例主要有人民法院出版社的法信大数据、中国大地(地质)出版社自然资源知识服务大数据、重庆出版集团的文化教育大数据等。出版共同体经过多年实践,已经探寻出“数据采集、存储、标引、计算、建模、知识图谱、数据服务”的出版大数据建构路径。[37]从网络层设计原理来看,区块链是典型的分布式大数据技术。
区块链技术在新闻出版大数据领域的应用创新点主要有:在数据存储方面,每个节点存储一份数据,高冗余存储、去中心化、高安全性和隐私性特点确保了数据安全,防止出现中心化的存储机构遭受网络攻击或物理损毁,进而出现数据泄露或丢失;在数据标引方面,除了进行知识标引外,还可对数据进行时间标引,加盖时间戳,进而能够对数据进行溯源,为大数据建设开启了一个新的窗口;在数据鉴证方面,时间戳、共识机制可方便数据进行存在性证明和真实性证明;在数据计算方面,通过区块链全网节点发起广播,聚集全链条的计算资源,能够几何级地提高数据计算能力;在数据建模和知识图谱方面,时间标引、知识标引的“双重标引”可催生新的建模方法,产生出更加立体化、带有时间标识的知识图谱,进一步拓宽了新闻出版大数据的应用场景。
3.7新闻出版智库建设
新闻出版智库作为近年来的热门出版业态,逐步形成了相对完善的“成员管理、成果推广、资金筹募、旋转门和评价等智库运行机制”,[38]出现了如融智库、i智库、建设发展研究院等一系列新型智库,在产生出版思想、辅助政府决策、引领行业先锋方面发挥了重要作用。
以融智库(联盟型智库)为例,区块链技术赋能新闻出版智库建设,主要是围绕智库专家思想及其外化的论文、著作等数据展开。融智库作为前瞻科技型的高端智库,涵盖了政产学研各界200多名专家,智库专家每年整体产生的论文数量不低于1000篇、重大课题和科研著作数量也是相当可观。以联盟区块链的形式,推动融智库的发展和壮大,可着手以下步骤:首先,进行论文、著作、课题的区块数据建设,采用时间戳、非对称加密技术,赋予智库以公钥、赋予专家以私钥;在链内全网进行广播,发起科研成果版权交易,得到验收和达成共识后,采用代币奖励和分配机制,激励“矿工”节点;建立和完善智能合约机制,符合规定条件和程序的交易,自动化执行交易。新闻出版智库联盟链的研发和应用,将有助于共享学术成果,打破学术资源垄断,鼓励智库专家内部思想交流,以去中心化的方式,构建出一个更加开放、更加安全、更加公平的智库思想交流平台。