摘要:随着数字经济的不断发展,数据安全成为数字经济持续、健康发展的主要问题。为了能够合理利用公共数据资源,推动城市数字化转型,提升社会生产力,应当重视隐私计算技术的应用,对数据进行加密处理,从而提升数据的安全性。本文对基于隐私计算技术的数据安全应用展开深入研究,旨在更好地利用隐私计算技术来强化数据的安全应用,通过全面认知隐私计算技术,实现对其科学应用,从而保障和提升数据应用的可靠性与安全性,为数字经济、数字城市的健康、持续发展提供保障。
关键词:隐私计算;技术;数据安全;算法;研究
在信息科技不断发展的时代,信息技术推动着数字经济不断发展,也推动着众多行业逐渐走向信息化、智能化和现代化。在大数据信息技术广泛应用的前提下,数据安全问题逐渐暴露出来、因此,在数据共享、流通、挖掘和深入利用的过程中,如何保障数据的安全性是需要重点思考和讨论的。隐私计算技术能够实现对数据隐私和安全的保护,使得数据能够在融合、共享、流通和应用过程中实现“可用而不可见”的效果,从而防止数据出现外泄,保障用户的使用安全。因此,为了能够更好地解决数据安全应用的问题,需重视隐私计算技术科学、全面、灵活地应用,提升数据应用的安全性与可靠性,对于社会各行业以及数字经济的发展都非常有利。
一、隐私计算技术的理论概述
(一)隱私计算技术的概念
隐私计算主要是指在保障数据拥有者个人隐私和安全权益的基础上,对数据价值进行深度挖掘、流通和应用的一种重要手段或方法。隐私计算技术主要指的是一类以保护数据本身安全性、隐私性为前提,对数据进行分析和计算的信息技术。隐私计算技术涉及多个信息技术学科,如人工智能、密码学、数据科学等,是众多信息技术体系的交叉与整合[1]。
(二)隐私计算技术体系
隐私计算技术体系由底层硬件、基础层和算法应用三部分构成。底层硬件包括通用硬件和可信硬件;基础层包括混淆电路、秘密分享、不经意传输、同态加密、差分隐私和其他密码学算法;算法应用包括联合统计、联合查询、联合建模和联合预测。构建隐私计算技术体系的主流技术包括多方安全计算、可信执行环境和联邦学习等。
1.多方安全计算
多方安全计算的核心技术是加密算法与协议,它是基于密码学原理,通过第三方可信的协助,实现多个参与方进行数据加密计算的方法。在加密数据方面,每个参与方只能获得自己的计算结果,无法获得其他参与方的输入信息。
在实现多方安全计算时,关键的底层密码学协议和框架,如不经意传输、混淆电路和秘密分享等。不经意传输主要指的是一种在数据交互与传输过程中保护隐私的方法或者思路。不经意传输是多方安全计算框架主要内容之一,其是乘法三元组、混淆电路设计以及GMW协议的重要基础构件,且具备隐私信息检索、隐私集合求交等多种安全计算功能。混淆电路则是对计算任务转化成布尔电路后的真值进行打乱加密等混淆操作,以此来实现对输入隐私进行保护的一种思路。混淆电路技术能够实现多种计算,且多应用在高带宽延迟场景、通用计算场景等。秘密分享是一种将秘密拆分成多个小分片,每个小分片交由不同的参与方进行管理的一种分而治之的秘密信息管理方法。秘密分享的通信量较低、计算量较小,具备预测、建模、联合统计等多种功能[2]。
多方安全计算在不泄露任何隐私数据的基础和前提下,能够实现多方数据的共同参与计算功能,并获得较为准确的结果,可以实现“数据可用而不可见”,将数据的使用权和所有权相分离,并对数据的用量、用途进行控制,在一定程度上实现了可计量、可控的目标。多方安全计算具有高度的安全性,不会泄露与中间计算结果相关的任何信息,适用于多种场景。
2.可信任执行环境
可信任执行环境是一个独立于操作系统的、隔离的、可信的机密空间,并在这个机密空间中进行数据计算工作,安全问题需要依赖可信的硬件来实现。隔离是可信任执行环境最本质上的属性,运用芯片等硬件技术和上层软件技术来协同保护数据,并保留与系统运行环境的算力共享功能。通过在CPU中运用软硬件方法来构建安全区域,使其内部程序加载、数据的完整性与机密性得到更好地保护。
从严格意义上来讲,可信任执行环境并不具备“数据可用不可见”的功能,但是其具有较低的开发难度和较高的通用性,能够科学、灵活地满足复杂算法与通用计算的需求,在并非严苛的场景下较为适用,且发挥的空间更大、利用价值更高。可信任执行环境的实现依赖于Intel SGX技术和ARM TrustZone技术,通过隔离的执行环境提供执行空间,该空间的安全性更强,功能更为丰富,能够保护数据和代码的完整性和机密性。可信任执行环境不会限制隐私区域内的算法逻辑语言的可计算性,还能支持更多复杂的算法和算子,具有较强的上层业务表达性。运用可信任执行环境技术能够实现算法、数据、身份、度量等功能,安全性更高,能够有效防止隐私数据泄露[3]。
3.联邦学习
联邦学习是一种分布式的机器学习方法,其在保证数据隐私安全的前提下进行数据建模,并提升模型的效果。联邦学习是在不出库本地数据的前提下对加密数据进行流通和处理,以此实现多方联合机器学习训练。联邦学习的参与方包括计算方、数据方、任务发起方、算法方、协调方和结果方等。
按照数据集的类型,联邦学习可以分为横向、纵向和迁移三类联邦学习。横向联邦学习是基于样本的横向维度切分数据集,针对特征相同但样本不完全相同的数据,展开联合训练,这种方法适用于特征重合较多但样本重合较少的数据集。纵向联邦学习则是基于纵向特征切分数据集,将相同样本但特征不完全相同的数据作为对象进行训练,这种方法适用于特征重合较少但样本重合较多的数据集。联邦迁移学习是一种不切分数据集,利用迁移学习的方法来弥补不同数据集的数据和标签不足,这种方法适用于样本和特征重合都较少的场景。
二、数据安全应用中隐私计算技术的重要性分析
自十九届四中全会以来,数据被列入生产要素当中,其价值与地位得到了国家的高度肯定。而应用隐私计算技术可以有效解决数据安全领域中存在的难题,并提升数据应用的安全性。同时,隐私计算技术还能保障对公共数据机密和数据协作风险,降低数据应用的安全风险,有效落实数据安全责任,提升数据的安全防护效果。下面对数据安全应用隐私计算技术的重要性进行分析与探讨。
(一)有利于公共数据机密的保护
随着信息科技的发展,在全球范围内,大数据应用的安全问题受到广泛关注和重视。为了更好地对数据进行保护,欧盟的《通用数据保护条例》和我国的《个人信息保护法》的相关规定,保证数据机密性、完整性和最小化是个人数据处理的重要前提和原则,也是国际社会对于收集和处理公共数据的共识和要求。隐私计算技术能够全面地满足数据最小化、机密性和安全性的要求,有效地避免数据被非法篡改、处理、删减、泄露和毁损等问题。同时,在数据安全应用中运用隐私计算技术,能够更好地保障公共数据的准确性和真实性,防止未经授权的人员访问、导出和修改数据,从而提高公共数据应用的安全性。
(二)有利于规避数据协作风险
在数据安全应用过程中,利用隐私计算技术可以对数据进行建模和分析,而无需将数据物理存储服务器进行转移。这样可以有效规避和减少数据协作、共享和利用过程中存在的安全风险,有利于提升数据协作的效率和水平。同时,运用联邦学习、多方安全计算等隐私计算技术,可以保障原始数据不流通;通过对数据计算模型的传输,能够将数据价值进行安全出库,使得加密算密钥长度、加密算法强度以及密钥管理安全性的提升非常有利。在隐私计算技术的支持下,数据的多方建模分析工作更加顺畅和高效,无需共享和转移原始数据就可以实现对数据建模的分析,这从本质上降低了数据协作的安全风险,进一步提升了数据应用的可靠性和安全性。
(三)有利于数据安全责任的有效落实
运用隐私计算技术能够对企业履行数据安全义务的实际情况进行有效且全面地认知,有利于帮助企业更好地健全和完善数据安全管理制度,按照国际的标准和规范优化数据安全管理流程。通过隐私计算技术的应用,能够将企业是否履行数据安全保障的问题予以清晰的反映,对于数据泄露的相关环节予以确定,有利于泄露风险原因和主体的查明和确定,进而明确和落实了数据安全责任,这对于数据安全应用是一种有效保障[4]。
三、基于隐私计算技术的数据安全应用场景研究
在社会众多领域中,隐私计算技术涉及的场景较多。在数据的生产、计算、应用以及存储等环节中,隐私计算技术能够更好地保障原始数据的隐私和安全,其优势较为显著,在智慧城市、医疗健康、金融征信等行业中应用更加广泛。下面對基于隐私计算技术的数据安全应用场景展开具体的探讨与研究:
(一)智慧城市的建设
近几年,随着信息科技和大数据技术的迅猛发展,城市数字化转型的速度加快,智慧城市的建设工作也在逐步推进,政务平台的建设工作也愈发完善。针对大数据,我国许多省市设立了相关的行政管理机构或部门,如大数据中心、大数据管理局和发展局等,这些机构或者部门的设立旨在加强大数据智慧城市的建设工作,使其更加顺畅、有序和高效。在智慧城市的建设过程中,涉及的部门和领域众多,因此需要数据协作来提高效率。为了防止数据信息外泄、不对称和不共享等问题,可以应用隐私计算技术,将环保、规划、交通、能源、文旅、安保等多个领域的数据进行全面地感知与整合,实现政务数据的跨时空、跨行业和跨部门流通与共享。通过在政服大数据平台上运用多方安全计算、联邦学习和可信执行环境等隐私计算技术,能够有效保障税务、社保、公积金、司法等方面的数据安全性和隐私性,为智慧城市的全面建设提供更好的数据安全保障。打破信息壁垒,实现部门间数据的共享,能够有效发挥数据协作的作用,保障数据的完整性、真实性和安全性。
(二)医疗健康行业数据的保密与隐私保护
在医疗健康领域,患者的个人信息必须严格保密,不允许泄露。随着医疗健康行业的不断发展,大数据的应用愈发广泛,病例和病情数据量巨大,通过对这些数据进行机器学习、深入挖掘和模型训练,能够大幅提升病情诊断的效率和医学研究的水平,从而提升医疗健康服务的准确性。在医疗健康领域中运用隐私计算技术,通过可信执行环境、多方安全计算等核心技术的应用,能够高效地统计和分析数据,同时最大化地保障隐私数据的安全性。运用联邦学习技术对医疗数据进行安全、可信的联合分析,可以对临床数据、医学影像数据和基因组数据进行可靠地计算和分享。在多方安全计算技术的协助下,可以更好地共享电子病历数据等,实现跨部门间的数据共享和利用,避免信息不对称和信息数据孤岛等问题,提升医疗健康行业数据应用的安全性[5]。
(三)金融领域场景的有效应用
在金融领域中,数据的风险控制与渠道联合都是开展业务工作的重要内容和环节。随着互联网信息技术的发展,传统金融必须与新兴的数字化技术有效融合,加强外部数据的流通与共享,提升金融数据应用的实效性,扩大金融数据应用范围。在金融征信工作中,金融征信系统的生态圈层非常复杂,涉及数据的使用、加工和流通,运用隐私计算技术可以促进三方数据的融合和多维度计算,全面保障数据传输的真实性和安全性。
将联邦学习和多方安全计算等隐私计算技术应用到金融征信系统,可以有效地规避和解决操作授权、隐私保护、价值交换、数据流通等问题,进一步提高金融征信数据的利用效率,保护数据隐私,并提升数据应用的安全性。
四、结束语
综上所述,在不断变化的信息化时代,隐私计算技术的应用可以有效规避和解决数据应用安全性的问题,保护用户的隐私,对于智慧城市建设、金融领域和医疗健康行业的发展更为适用和有利。随着信息技术的不断提升,隐私计算技术也在不断更迭与完善,未来的隐私计算技术对于数据安全应用的保障性将会更强,有利于实现数据的安全共享和有效利用。
作者单位:芦健 杭州安恒信息技术股份有限公司
参 考 文 献
[1]王健宗,孔令炜,黄章成,等.联邦学习算法综述[J].大数据,2020,6(6):64-82.
[2]于施洋,王建冬,郭巧敏.我国构建数据新型要素市场体系面临的挑战与对策[J].电子政务,2020(3):2-12.
[3]赵学刚,马羽男.算法偏见的法律矫正研究[J].辽宁大学学报:哲学社会科学版,2020,48(5):82-90.
[4]陈财森,纪伯公,黄辰,等.基于联邦学习的作战数据共享与隐私保护[J].装甲兵学报,2022(1):98-103.
[5]曾坚朋,赵正,杜自然,等.数据流通场景下的统一隐私计算框架研究——基于深圳数据交易所的实践[J].数据分析与知识发现,2022,6(1):35-42.
芦健(1981.05-),男,汉族,山东济南,本科,高级副总裁,山东安恒智慧城市运营有限公司执行董事,研究方向:网络安全。