基于区块链的口述历史资源库建设研究

2020-08-17 09:24赵丹僖雷凤雪
现代信息科技 2020年9期
关键词:资源建设区块链

赵丹僖 雷凤雪

摘  要:以广西生态工程职业技术学院图书馆为例介绍口述历史数据库的收藏范围和途径,分析了建设过程中面临的资源存储扩容不易、资源可信度不高和知识产权明晰困难等问题,利用区块链技术的去中心化、不可篡改、安全可信等特性,提出融入区块链技术的口述历史资源库模型,由数据采集分析、数据组织整理、数据储存发布、数据共享使用四个功能模块组成,实现了保障数据安全、提高资源存储的功能。

关键词:区块链;口述历史;资源建设;数据库模式

中图分类号:TP391;G250      文献标识码:A 文章编号:2096-4706(2020)09-0169-03

Research on the Construction of Oral History Resource Base Based on Blockchain

ZHAO Danxi,LEI Fengxue

(Guangxi Eco-engineering Vocational and Technical College,Liuzhou  545004,China)

Abstract:Taking the library of Guangxi Eco-engineering Vocational and Technical College as an example,this paper introduces the collection scope and ways of oral history database,analyzes the problems faced in the process of construction,such as the difficulty in expanding the storage capacity of resources,the low credibility of resources and the difficulty in clarifying intellectual property rights,etc.,and puts forward the oral history integrated into the blockchain technology by using the characteristics of decentralization,non-tamperability,security and credibility of blockchain technology. An oral history resource base model integrated with blockchain technology is proposed,the resource base model is composed of four functional modules:data collection and analysis,data organization and arrangement,data storage and release,data sharing and use,which realizes the functions of ensuring data security and improving resource storage.

Keywords:block chain;oral history;resources construction;database schema

0  引  言

口述历史研究主要是对无文字社会研究的叙述以及对老一代历史亲历者的史料采集,因为没有这些史料的收集将无法构建社会的原貌,乃至无法倾听底层社会的声音,无法记录见证者独有的情感体验和生命感悟[1]。在我国悠久的历史长河中,口述资源十分丰富,但研究和利用却不多。目前,许多公共图书馆越来越重视口述历史的价值,投入大量人力和财力对口述资料进行保存,这对保存人类历史记忆起到重要作用。然而目前我国口述历史资源库建设中面临制度不合理、技术力量不够等诸多问题。本文以广西生态工程职业技术学院图书馆在建设口述历史数据库的过程中面临诸多问题进行分析,探索区块链技术下口述历史资源库的建设模型,为图书馆资源建设提供新的思路。

1  建设口述历史资源库的范围和途径

广西生态工程职业技术学院将口述历史资源作为图书馆资源建设的重要组成部分,近些年投入大量的人力财力对口述历史数据库进行建设,目前将口述历史资源收藏范围定位为反映抗战时期沙塘镇农林业发展的各类型资料。

1.1  明确收集资源的范围

由于广西生态工程职业技术学院所处的广西柳州市沙塘镇,在抗战时期是大后方,当时的沙塘镇汇集了各地的农业专家学者、名人教授,如马保之、冯堂、孙仲逸、汪振儒等,他们对中国农林业发展、对抗战后方的生产建设具有重要意义。目前图书馆主要收集以下三种类型资源:一是抗战时期沙塘镇生产生活情况,二是著名农业学家在沙塘镇进行的教学生产情况,三是抗战时期当地口述文学作品。

1.2  多方协作收集资源

为了广泛收集、深入挖掘口述历史资源,图书馆吸收借鉴了其他图书馆的成功经验,形成以广西生态工程职业技术学院图书馆为主、学校其他部分为辅、联合广西农科院桂中分院等相关单位通力合作的收集模式。首先,以历史学、图书馆学、农林业等相关专家的建议为基础,明確口述历史资源的收集类目。其次,从各单位抽调人员,以收集内容为导向确定访谈人员和访谈提纲,接着利用录音录像等设备记录对相关人员的访谈,然后按照文献编目规则与机读目录格式对采访内容进行组织、揭示,并存入口述历史数据库。

2  图书馆建设口述历史资源库存在的困境

2.1  资源存储的问题

口述资源采集中,首先被采访者要先填写自身信息,再对自身经历进行叙述。采访者一般采用录音或者视频等方式进行采集,采集后的资料就是原始素材,作为还原历史的元数据进行保存存档。然后加工人员对素材进行粗整理,删除掉不含有效信息的视频片段,根据主题进行分段剪辑,之后才是将口述资料整理成文字稿,然后再整理成元数据保存存档。整理工作结束后,视频资料以高清格式、图片资料以高像素形式上传,电子文档和纸质文档进行扫描分类上传服务器进行备份[2]。随着各学科领域对口述历史的青睐,口述资源数量得以成倍数增长,如何对大量口述资源的原始资料和加工整理后的资料进行保管成为采集者要面对的问题。

2.2  资源共享问题

口述历史资源库建设作为口述资源开发与利用的基础,目前已得到社会各界的重视。清华大学图书馆对周本初等知名学者进行访谈,以视频的方式构建了名人口述历史资源库;汕头大学图书馆构建了潮汕口述文献数据库;湖南图书馆构建了红色记录口述资源库;国家图书馆启动的“中国记忆”就是依托口述文献和影像文献的数据库。但调查显示,很多图书馆口述文献资源库仅提供浏览访问服务,并不能下载使用资源。在信息时代,广大用户对口述资源需求增强,实现资源共享可以提高图书馆影响力和群众的满意度。

2.3  版权保护问题

口述历史资料是图书馆特色馆藏建设的重要组成部分,可以以各种方式来进行复制,属于版权保护的作品。2010年修订的《中华人民共和国著作权法》第3条明确将口述作品列入著作权法保护范畴[3]。口述历史一般由口述者叙述,采访者进行记录,采访者为了保证叙述活动的顺利进行,需要设计采访问题、设定采访框架、运用采访技巧,巧妙地对口述者进行干预。一般来说,采访者在口述资料生成的过程中也起到创造性作用,同样具备知识产权。而区块链数据结构是一种以区块为单位的链式结构,每一个区块头都包含上一个区块信息的哈希值和时间戳,任何个人和节点都不能随意更改信息,任何节点都可追踪到有变动的节点。区块链技术特有的去中心化、不可篡改、可追溯的特点可用于知识产权保护,可以提高知识产权的可靠性和安全性,降低版权认证费用,因为区块中每一个参与者也是认证者,不需要专门认证机构和认证费用。

3  基于区块链的口述历史资源库建设

3.1  区块链相关概念

区块链技术是比特币的底层技术,2008年首次由日本学者中本聪(Satoshi Nakamoto)提出。区块链技术是利用块链式数据结构验证与存储数据、利用分布式节点共识算法生成和更新数据,利用密码学的方式保证数据传输和访问安全、利用自动化脚本代码组成的智能合约编程和操作数据的一种全新分布式基础架构与计算范式[4]。从应用角度来看,区块链是一种分布式共享账本数据库,具有去中心化、不可篡改、公开透明、安全可信、可以追溯等特点。区块链采用点对点传输模式,具有去中心化的特点,各节点之间直接进行信息处理,任何一个节点出现故障不会影响整个系统的运作。不可篡改意味着区块链中每一个节点发出的信息都能被其他区块收到,各区块共同认证新发出的信息,除非能控制一半以上的节点,否则对区块的修改都是无效的,这种点对点的传输方式决定了传递、验证和共享的信息都是公开透明的,也决定了区块链是安全可信的。区块链使用了密码学中的非对称加密,使通信双方无需事前传递密匙或进行约定就能完成保密通信,让参与者更容易达成共識,既方便溯源,又能实现透明数据后的匿名性,保护个人隐私[5]。这些特点为区块链奠定了信任基础。

3.2  区块链在口述历史中的优势

3.2.1  扩充资源存储容量

区块链技术具有去中心化的特点,利用区块链技术实现资源分布存储,点对点传输成为可能,可以利用网络中每一个节点的存储空间来存储其他节点的数字信息。每一个节点既可以作为存储空间的提供者,也可以作为数据的需求者,这种云存储真正实现了资源分布储存,点对点传输,改变了图书馆资源存储中心化的问题。在区块链技术下,云储存形态充分应用了网络闲散节点资源,整体运营成本大大降低。因此,图书馆可以扩充信息资源,在节约成本的条件下增加信息容量,可以让更多的参与者加入资源建设行列,实现资源数量成倍增长。

3.2.2  可靠的安全共享

区块链技术能够在大规模网络环境中建立安全可信的数据存储系统、通过智能合约机制,实现可信任状态的分布式共识,实现了更加安全有效的数据共享平台,保护数据共享。在现有的区块链存储系统中,文件元数据以单独用于数据存储的公钥加密后存储在链上,文件密文保存在链下各个节点中,用于解密所有数据的对应私钥掌握在用户手中。区块链上的元数据密文与链下节点持有的文件密文都被加密算法保护,只有私钥持有者可以阅读其中的内容。区块链云存储工作在所有节点不受信任的环境下,其中数据分享的安全性完全由具体的算法保证,具有可证明的安全性。另一方面,在数据分享的服务中,不仅需要其过程具有安全性,还需要考虑该服务的可靠性。区块链通过访问控制、身份认证和隐蔽通信来实现数据交换过程安全可靠。在传输过程中先对数据进行封装和签名,在使用时采用可验证计算,保证云计算结果的可信度。

3.2.3  可追溯成果,强化版权保护

口述历史从讲述到传播都经过诸多处理,用户难以判断其可靠性和有效性。数据溯源可以解决这个问题。区块链利用哈希算法和数字签名在存储数据或保存之前计算数据的哈希值,之后可以反复此过程,将验证结果与之前存储的数据进行比较来证明数据的完整性。如果两个哈希值相同,数据真实有效。数字签名是用非对称加密算法对哈希值进行加密,签名使得发送方能够证明数据是自己发出,接收方也可以验证签名。区块链的哈希算法和数字签名出让成果追溯成为可能,降低版权保护成本,实现版权保护。

3.3  基于区块链的口述历史资源库模型

基于区块链的口述历史资源库是依托区块链技术实现口述历史收集整理发布的平台,主要由数据采集分析、数据组织整理、数据存储发布和数据共享使用四个功能模块组成,如图1所示。

3.3.1  数据采集分析

数据采集模块的主要任务是采集者身份认证,判断采集格式的正确性,协助单位对采集资料的合规性、完备性、成熟性和价值型进行判断,将符合要求的资料创建索引、归档和备份。整个系统拥有友好的用户界面,支持所有经认证的用户登录系统,指引用户按照要求收集信息,并规范提交、处理数据。

3.3.2  数据组织整理

系统会根据数据的不同类型、作用以及完备程度对数据进行划分,并匹配相应的数据组织策略。对于不符合规范格式的数据格式,系统提供格式转换处理,便于保存为规范的格式类型。对于上传的数据进行标引和分类,根据不同的元数据规范生成元数据类型,最后根据数据内容的主题领域对数据进行分类存储,一般分为文字资源、图片资源、视频资源和虚拟现实资源四个部分,为了后续工作提供基础。

3.3.3  数据存储发布

根据已经组织好的资源数据类别设置不同的存储方案,设定数据的保存期限和备份计划。根据注册用户传递的数据进行分布式存储,防止数据地址篡改和丢失。在这个模块中,项目组各用户可以根据权限新增、修改和存储数据,原始资源数据经过非对称加密后存储在底层数据库中。用户在修改完成后,在区块内记录新的地址,将数据的输入时间戳、区块长度和前一个区块哈希值组成区块头,根据访问控制树将数据位置索引、明文形式的访问控制策略和数据Merkle根加密后打包成块,存储至区块体中,再上传至区块链。[6]。

3.3.4  数据共享使用

数据共享使用模块主要包含数据检索、访问和下载、数据共享三个模块。网络平台可以提供多种检索条件供用户浏览和查询信息,提供多途径的数据访问接口和访问方式,对于在使用权限中的用户提供共享和下载服务。系统依据访问者的权限对应访问者的请求并查询该数据的地址与对称加密密钥。若访问者具有权限即可得到地址与密钥,用户可到底层数据库中访问数据,完成访问过程。区块链技术在其中充当中枢作用,数据的访问、下载和权限认证等环节都在区块链中完成。

4  结  论

利用区块链技术构建口述历史资源库,构建了数据采集分析、数据组织整理、数据存储发布、數据共享使用四大功能模块,解决了资源存储扩容不便、安全共享程度不高、版权保护不利等问题,实现了口述资源管理的整个流程。但本研究只从区块链技术特征入手设计了口述历史资源库理论模型,并未对模型的应用和开发展开系统研究,在以后的研究中可以进一步开发模型进行验证和评价。

参考文献:

[1] 刘洋,张一帆,韩超.体育非物质文化遗产口述历史问题探析 [C]//中国体育科学学会.第十一届全国体育科学大会论文摘要汇编.中国体育科学学会:中国体育科学学会,2019:1521-1522.

[2] 宋蓉.人微言不轻——安徽省图书馆《抗战老兵口述历史》项目案例分析 [J].山东图书馆学刊,2019(3):71-74.

[3] 王小平.图书馆口述历史数据库建设中的版权问题研究 [J].湖北理工学院学报(人文社会科学版),2014,31(3):44-46.

[4] 中国区块链技术和产业发展论坛.中国区块链技术和应用发展白皮书(2016) [R/OL].(2016-10-18).http://www.cbdforum.cn/bcweb/index/article/rsr-6.html.

[5] 孔繁超.基于区块链的开放获取资源建设与管理 [J].情报理论与实践,2019,42(5):153-158.

[6] 王秀利,江晓舟,李洋.应用区块链的数据访问控制与共享模型 [J].软件学报,2019,30(6):1661-1669.

作者简介:赵丹僖(1984—),女,汉族,广西柳州人,就职于图书馆,采编部主任,馆员,研究生,硕士,研究方向:图书馆资源建设与服务。

猜你喜欢
资源建设区块链
科学数据共享平台的建设与服务探讨
保险企业的区块链技术应用方向选择研究
检察档案信息资源建设与开发利用
教学资源库建设和共享机制研究
区块链技术在金融领域的应用与前景研究
区块链技术的应用价值分析
“区块链”的苟且、诗和远方
基于区块链技术的数字货币与传统货币辨析
保定旅游资源建设现状及存在的问题研究
移动学习方式下实验教学资源建设的研究