刘丽华
摘 要:现阶段高校教育档案管理系统面临数据易被篡改、存储分散、难以追溯等挑战,区块链技术的出现为解决上述安全问题提供了新思路。本文基于区块链技术提出一个高校教育档案存证溯源系统。首先根据高校教育档案需求提出相应的教育档案存证溯源总体框架和角色构成;其次,从层次定位角度出发设计了系统两大模块;最后从数据存储层面将教育档案存证溯源信息和教育档案文件分离存储,并给出智能合约技术开发流程。该系统的提出为教育档案区块链的进一步发展提供了一定借鉴作用。
关键词:教育档案;区块链;存证溯源;星际文件系统
中图分类号:G270.7文献标识码:A文章编号:1673-260X(2024)06-0039-04
教育档案是指教育机关、单位和个人按照一定原则和方法保管的具有保存价值的教育文献资料。高校中记录学生在校期间产生的各类教育信息的重要文件是教育档案重要的组成部分,主要包含考核成绩、学位学历、思想道德表现、奖惩纪律、掌握技能、特长和家庭状况等。学生通过教育档案可以了解自己各阶段教育历程,总结在学习过程中存在的优点与不足,从而更好地规划未来。大量单位在招新时都会查看学生的教育档案,从中了解学生在学校的表现,关注学生的学历学位、成绩、已掌握技能、实践经验等,作为后续招聘录用的重要参考依据。因此,教育档案对于学生每一阶段的综合评定、学业规划、升学和就业等都起着重要作用。
高校教育档案管理是教育领域的一项重要任务。在我国,有专门机构负责管理教育档案,但中心化的教育档案管理方式存在档案数据易被篡改、存储分散、难以追溯等问题。随着科学技术的不断进步,大部分教育档案已由纸质转变为电子形式。教育档案的电子化管理不仅节约了大量纸张,还方便了档案信息的管理和档案内容的共享传播,但伴随而来的是教育档案信息的真实性、安全性和完整性受到了极大的威胁。如何提高教育档案的真实性、安全性和完整性成为现阶段教育档案领域必须面对的难题。
区块链(Blockchain)技术的出现为解决上述教育档案问题提供了新思路。区块链结合了分布式存储、点对点传输、共识机制、密码学等技术,具有去中心化、防篡改、可追溯、匿名性和可编程等众多优势。由于其安全可信的分布式架构,涉及的行业领域非常广泛,其中包括教育档案领域。截至2024年1月14日,在中国知网(CNKI)以“区块链+高校档案”为检索词进行篇名检索,共得到60篇文章,以“区块链+学生档案”为检索词进行篇名检索,共得到30篇文章。这足以说明区块链技术已被引入档案管理领域,并有了一定的研究进展,同时也说明“区块链+档案”是未来档案发展的必然趋势。
本文针对传统中心化高校教育档案管理方式存在的档案数据易被篡改、难以追溯等问题,提出并设计了一个基于区块链的高校教育档案存证溯源系统。具体来说,首先根据高校教育档案需求提出相应的教育档案存证溯源总体框架和角色构成;接着设计满足教育档案管理的分布式教育档案存证溯源系统;最后基于星际文件系统(InterPlanetary File System,IPFS)将教育档案存证溯源信息和教育档案文件分离存储。借助区块链的不可篡改性和IPFS的分布式存储分别保证教育档案存证溯源的可信性和档案文件的安全性,既方便学生查询和下载教育档案文件,又保障用人单位对档案的验证和溯源需求。
1 区块链技术
2008年中本聪(Satoshi Nakamoto)发表了一篇奠基性论文“Bitcoin: a peer-to-peer electronic cashsystem”并提出比特币(Bitcoin)概念[1]。从中可知,区块链技术是伴随着以比特币为首的数字货币而出现的一项新兴技术。从区块链的组织结构和运行原理来看,它是一种以密码学算法为基础的点对点分布式账本技术[2],因此区块链作为比特币的底层技术为大众熟知。工业和信息化部2016年发布的《中国区块链技术和应用发展白皮书》也明确指出区块链技术的定义,即是一种按照时间顺序将数据区块以顺序相连的方式组合成链式数据结构,并以密码学方式保证不可篡改和不可伪造的分布式账本技术。比特币区块链结构如图1所示。
随着区块链技术不断成熟,其早已从金融领域延伸向多个其他领域,其中包括档案领域。一方面,区块链系统中各全节点地位平等,具有相同权限,通过竞争参与共识,保持所有节点同步更新。另一方面,区块链系统中任意一个全节点出现故障,其余节点仍能提供完整的数据备份,保障了其存证能力。由于新技术如物联网、云计算、大数据等的出现使传统高校教育档案管理系统面临前所未有的安全威胁,而传统的教育档案管理主要侧重信息的收集、管理、查询、增删改等业务功能的实现,对档案数据的真实性、完整性、安全性等显得无能为力。因此,区块链技术的引入可以使教育档案在一个不完全可信的环境中实现一种安全可靠的去中心化的分布式数据存储。目前,区块链技术在电子档案管理领域的捕获归档、移交接收、自动处置和档案检测等场景已经开始应用[3]。
2 基于区块链的教育档案存证溯源系统架构
传统的高校教育档案中心化储存方式极易受到恶意攻击,并且缺乏数据追溯功能。一旦服务器被攻击,数据被伪造、篡改或删除的可能性极大,追踪变更来源或历史极其困难。但由于区块链是分布式存储且其链式结构具有时间戳特性,将每个区块通过特定哈希方法连接起来,可以实现教育档案在区块链中的去中心化和可溯源性。
基于区块链的高校教育档案存证溯源系统主要采用链上与链下相结合的模式。用户可以使用浏览器进行系统前端访问,各高校则可以进入管理界面,对本校学生的教育档案进行管理。管理员则对该系统进行维护和更新。
高校教育档案存证溯源系统自顶向下分别是用户层、系统业务层、智能合约层和数据存储层。用户主要由高校档案部门、学生和用人单位构成。系统业务层包括用户管理模块、业务系统模块、电子档案管理模块,其中业务系统模块包含档案文件生成、修改、审核和归档,电子档案管理模块包含档案接收、档案保管、档案利用、档案销毁等功能。数据存储层主要包含区块链(联盟链)和星际文件系统IPFS,系统架构如图2所示。
高校教育档案存证溯源系统主要涉及三类角色,分别为高校、学生和用人单位,如图3所示。高校是大学生教育档案的直接管理单位。在学生入学直至毕业期间,高校需要收集学生在校产生的所有教育数据,并及时录入档案存证溯源系统,确保学生能够在该系统中及时查看教育档案内容,明确自身优势与不足,以便进一步规划学业和未来发展方向。在学生就业时,用人单位需要通过系统对学生提交的教育档案进行溯源验证,确保学生拥有入职资格。
3 基于区块链的教育档案存证溯源系统分析设计
本节对基于区块链的教育档案存证溯源系统进行层次定位,从线下和线上两方面分析。线下需要人工对教育档案电子化加工和档案图像处理。线上则需要进行档案数据化和审核。最终结果经过处理存入区块链,实现对教育档案的隐私保护、防篡改、可追溯,如图4所示。
基于区块链的教育档案存证溯源系统主要由两大模块构成:
(1)数字教育档案上链存证。在高校教育档案管理系统中,需要为每位学生建立一个电子档案,采集学生基本信息,形成准确的学生教育档案。
①信息包含“基本信息、学习经历、教育过程信息、奖惩信息、家庭成员信息、联系方式”等。这些信息存入档案存证溯源系统。
②数字教育档案管理系统中的数据,在初步审核后,计算一致性哈希并基于共识机制上链。
③上链后的数据要基于档案号建立索引,方便后续的“信息链”查询操作。
④教育档案上链过程可配置,管理员可配置特定节点拥有查看权限,其他节点没有数据查看权限。
⑤管理员拥有所有电子化档案数据的查询权限,但不可修改。
⑥学生仅拥有查询自己档案的权限,但不可修改。
⑦仅区块链配置的管理员拥有教育档案数据的上传、修改、查询权限。对于已上链的数据,管理员可发起“修改”交易进行数据修改,不可改变已共识上链的数据,仅追加修改记录,修改记录应保存上链,形成数据操作信息链。
⑧实现数据不可篡改及不可抵赖的全流程回溯确责。
(2)教育档案溯源。
①实现数据核验溯源接口,学生可根据自己的信息和链上摘要信息,验证其档案数据的真实性。
②管理员拥有所有学生数字教育档案信息核验权限。
③第三方档案管理机构获得学生主体允许的情况下,可核验该学生档案的真实性。
4 基于区块链的教育档案存证溯源系统存储与智能合约开发
这部分主要从档案的数据存储和智能合约两个角度进行阐述。教育档案存证溯源系统中的数据存储通过区块链技术和IPFS实现,既保证了重要存证溯源数据及时上链,又保证了基本档案数据的安全可靠。智能合约可以保证系统存证溯源顺利实施。
4.1 教育档案中的数据存储
4.1.1 区块链(联盟链)
区块链相当于一个去中介化的数据库,分为公有链、联盟链和私有链。本文中基于区块链的教育档案存证溯源系统采用联盟链。联盟链是由一组相互信任的机构或组织共同管理和维护的一种特定区块链模式。与私有链的运作空间和效率相比,其价值更大。与公有链完全去中心化的不可控和隐私安全相比,其更具有可操作性。在电子档案管理中,尤其是高校教育档案管理中采用联盟链是必然选择。多个高校间构成联盟,共同建立和维护一个用于高校档案管理的区块链网络来共享档案数据,并确保数据安全可靠。
4.1.2 IPFS
IPFS是一种新型的互联网传输协议,通过使用基于内容寻址的文件系统来取代传统的基于位置寻址的文件系统。这意味着文件不再通过文件路径来定位,而是通过哈希值来标识和检索。同时,IPFS还支持文件的分块存储和去重技术,大大提高了文件的存储和传输效率。IPFS是一种去中心化的分布式文件系统,而区块链则是一种去中心化的分布式账本技术。将这两种技术结合在一起,可以实现更高效、更安全的数据存储和传输,将教育档案存证溯源信息和教育档案文件分离存储,即IPFS作为教育档案数据存储的基础,使用联盟链来保证数据的可信和安全。
4.1.3 智能合约开发
传统合约是由双方共同制定合同规则,需要可信的第三方机构对合约执行进行监督、授信或仲裁,以保证合同规则被多方同时合法执行[4,5]。与传统合约概念相比,智能合约可以理解为是满足预定条件而自动执行的程序(或协议或合同中的操作),其主要存储在区块链上。智能合约开发技术流程如图5所示。
本文中智能合约的重要三个业务操作是指档案数据上链,链上档案数据查询和溯源审计,其中重点阐述档案的追溯流程合约,如图6所示。
在高校教育档案存证追溯系统中,追溯节点一般发起追溯档案交易(Transaction),但需要进行授权来触发教育档案追溯合约。当教育档案数据上链时,追溯方法将返回当前档案交易数据的区块哈希、区块高度、区块时间戳等。这种严格的授权验证流程保证了追溯数据的真实性与安全性,同时也增强了整个追溯体系的透明度和可追溯性。追溯合约旨在实现教育档案数据的上链存储和查询,用户使用Trace( )合约输入来触发教育档案追溯数据存储上链合约。合约执行后,将交易数据上链存储并更改节点状态数据库,发送到共识节点进行排序和打包出块,最终备份到整个联盟链节点的区块上。执行Trace( )合约后,用户可以通过输入GetData( )方法从用户节点备份区块查询数据,输入应包括教育档案追溯码以索引查询。执行GetData( )方法后,用户获取存储在链上的档案追溯数据。在此期间,合约会遍历查找相匹配的业务方法,并验证用户授权有效性,触发教育档案追溯数据存储上链合约。通过上述步骤有序执行,才能完成教育档案追溯数据的上链存储和查询功能,保证教育档案追溯数据的安全性和可靠性。
5 结束语
区块链应用于高校教育档案管理是档案领域未来发展的必然趋势。通过对“区块链+教育档案”的范式进行深入研究,本文提出一种基于区块链技术的高校教育档案存证溯源系统解决方法。具体分析了教育档案存证溯源总体框架和角色构成,从层次定位角度出发设计出系统两大模块。接着从数据存储层面将教育档案存证溯源信息和教育档案文件分离存储,并给出智能合约技术开发流程。只有将区块链技术融入档案管理业务中才能真正实现档案信息服务的个性化、精准化和及时化,满足“数智”时代对电子档案的发展需求。
参考文献:
〔1〕Nakamoto S. A peer-to-peer electronic cash system[J]. Bitcoin. Available: https://bitcoin. org/bitcoin. pdf, 2008:1-24.
〔2〕林知微,张嵩川,王成吉,等.区块链技术综述:在下一代智能制造中的应用[J].智能科学与技术学报,2023,5(02):200-211.
〔3〕王艳松,王栋,王为久,等.区块链在电子档案管理中的应用分析与实施路径探究[J].北京档案,2022, 39(01):10-14.
〔4〕黎强.基于区块链的云南咖啡溯源系统研究与实现[D].昆明:云南农业大学,2023.
〔5〕青乐,朱慧君.基于区块链智能合约的大数据安全[J].计算机应用与软件,2023,40(12):332-337.