杜小勇,范举
中国人民大学,数据工程与知识工程教育部重点实验室,北京 100872
数据作为第五大生产要素已经成为国家重要战略资源,在社会进步、经济发展、国家安全等方面发挥的作用日益突出。2022 年12 月,中共中央、国务院印发《关于构建数据基础制度更好发挥数据要素作用的意见》,高度重视数据要素产业发展,强调要加强基础理论研究和关键技术突破,加快实施创新驱动发展战略和实现高水平科技自立自强。
数据要素在多个主体之间以开放、共享或交易等形式的流通是促进数据价值有序释放的重要基础,既承载着数据价值的产生、流动和实现,也蕴含着数据风险的积累、转移与管控。当前,对数据流通的认知不够深入,基础理论研究不够丰富,尽管出现了区块链、安全多方计算等相关技术,但仍未形成支撑数据要素流通的完整技术体系。
本期专刊以数据要素安全高效流通为主题,重点探讨相关领域具有创新性和突破性的高水平研究成果,探讨相关基础理论、关键技术,以及在系统研发过程中关于系统设计原理、范式、架构、经验等方面的实质性进展,探讨其在相关产业和领域的应用前景。
由沈林江等人撰写的《“东数西算”下的高效数据流通策略研究》一文面向东数西算场景下的数据流通,提出了基于深度强化学习的高效数据分级与流转策略,通过融合多类业务优化目标,构建系统优化的通用数学模型并采用深度强化学习实现问题求解和策略优化。通过系统仿真及与多种基线算法进行对比,验证了所提出的方法在收敛性、系统长期收益、目标均衡等方面的优势。
在《科学数据“东数西算”组织机制与传输模式研究》一文中,方肖等从组织机制的角度分析了科学数据处理的三种模式,探讨了科研联盟模式下基于联盟链理论的科学数据传输模型构建,并通过科研联盟模式下的示范案例,展示了所提出的组织机制与传输模式能够减少科学数据“东数西算”过程中的资源投入,提高数据传输效率,促进科学数据安全流通与高效利用。
由丛颖男等人撰写的《数据跨境流动规则对数字贸易出口技术复杂度影响研究》一文立足于建立高效的数据跨境流动规则以促进数字经济跨境贸易,采用ECIPE 发布的DTRI 指数衡量数据跨境流动规则的限制性程度,以出口技术复杂度衡量数字贸易的发展质量,通过构建基准回归模型检验了限制性规则对数字贸易的影响。该研究发现数据跨境流动限制对数字贸易出口技术复杂度具有显著而稳健的负向影响,该影响可以通过技术创新能力和数字基础设施建设水平这两个作用渠道实现,且在贸易部门和国家经济发展水平两个层面存在异质性。相关研究成果可以为我国数字贸易高速、高质量增长以及产业结构转型升级提供参考。
在《一种面向超大城市治理的数据高效跨域流通技术框架》一文中,贾晓丰等针对超大城市中数源海量、数据分散、场景复杂等主要挑战,提出了一种数据高效跨域流通的技术框架。该框架通过基于目录生成的分布式数据标识、基于数据路由的多主体跨域调度和基于算法切片的安全协同计算等关键技术,面向北京市,支持了数千个分散数据源、上万类异质数据结构、千亿级实时数据的数据高效跨域流通,并在智能派单、证照验证等场景下进行了验证。相关研究成果可以为面向超大城市治理的数据高效跨域流通提供一种可行的技术路径。
由钟子岳等人撰写的《基于区块链的数据要素可信流通技术综述》一文调研了基于区块链的数据要素可信流通技术,从数据可用、可信、可流通、可追溯四个方面出发,对现有区块链系统研究中的存储模型、系统性能扩展方式、数据验证、跨链技术、溯源技术等方面进行了系统的总结分析。调研表明现有研究成果能够基本实现数据要素可信流通体系,但在数据隐私、数据使用和数据表示方面仍存在诸多未解决的问题。
在《基于数据纯度的模型博弈定价方法》一文中,江东等探讨了数据定价对数据流通和共享的重要意义,并提出了一种基于数据纯度的模型博弈定价方法,该定价方法综合考虑了用户隐私需求和数据质量,在数据收购端以数据质量和噪声多少即隐私保护水平作为补偿依据,在模型出售端基于博弈论方法进行定价。实验表明,该方法能给予数据拥有者公平便利的补偿,同时可以使数据平台和模型购买者收益最大化。
在《本地化差分隐私综述》一文中,孙一帆等以数据统计分析任务类型为线索,从频率估计、均值估计、多维数据统计分析和机器学习四个方面系统地调研了本地化差分隐私研究,调研结果表明本地化差分隐私模型能够在用户数据被采集、分析时,为用户个人数据隐私提供隐私保护,但仍然面临着诸多问题和挑战,值得进一步研究和探索。
由汤世源等撰写的《基于安全多方计算的隐私保护图查询》一文提出了基于安全多方计算的图查询保护策略,将隐私保护图查询问题转化为关系表的安全连接问题,并根据图数据的特性对安全连接子协议进行改进。与现有的隐私保护图查询工作相比,本文提出的协议不仅提供了更低的计算和通讯开销,并且具有更高的安全保障性和可信度。
上述系列文章从不同的角度探讨了数据要素高效流通技术在“东数西算”、跨境流通、超大城市治理等典型场景下的技术新发展与新趋势,以及数据定价、隐私保护等关键技术。数据要素流通应用的不断深入将进一步推动相关技术的不断创新与可持续发展。