北京易华录信息技术股份有限公司 刘传
针对目前数据产权模糊、管理“散、乱、差”和收集困难等问题,“数据银行”基于银行托管资金的理念及构架,以保护数据所有权、隐私权、收益权为核心,搭建管理与运营平台,以提供数据的汇集、一级开发、确权、管理和交易等服务功能,实现数据的增值、评估、信贷等价值。
数据银行的构建包括基础环境、数据存储、业务内容三个层面,基础环境的建设主要是针对政府数据、企业数据、个人数据通过搭建城市数据湖以达到数据汇集,形成城市数据资源池;数据存储层面需包括数据工厂、托管区和储蓄区,主要开展数据清洗与加工等一级开发业务;业务内容层面,在数据一级开发的基础上,对数据资产进行盘点、评估和登记,以便于开展定价、抵押、API中介等交易类服务,同时为保证数据资产安全,还应建立信息安全体系、数据身份识别体系、用户信用体系等。
数据银行的构建由数据源、数据传输、数据资产化、存储资源池、业务服务、数据标准以及数据安全七个部分组成,其中存储资源池根据数据使用频度的不同可以分为冷数据和热数据。根据大数据“二八定律”,对于冷数据可以使用蓝光光盘、磁带等低耗能存储介质以降低长期保存成本。
数据来源主要分为政府、企业、个人、第三方机构四类,数据银行作为一个开展数据金融的商业机构,在进行商业化运转的同时也将不断衍生新的数据,结合建设全介质混合存储平台通过将数据冷热分离的低耗能存储,可有效提升数据源汇集与使用效率,补充业务所需的数据资源条目,不断扩展可服务用户的范围。
数据传输通过互联网、移动互联网、物理迁移、专线和物联网等技术手段,对不同类型的各类数据进行传输交互的通路,以便数据汇集到数据银行进行数据资产化的处理[1]。
数据资产化是数据可进行交易的必备环节。通过数据传输环节汇集到的数据源是无序、杂乱、冗余的,如果要进行资产化使用就需要对数据进行一级开发,包括了数据清洗、编目、脱敏等内容,并且还应对一级开发处理后的数据进行价值评估,也就需要建设一套可行的数据价值评估体系,只有完成这一系列操作流程后融合到的数据才能真正用于数据交易,也才是具备了资产属性的数据资源,数据资产价值评估模型的建立有利于提高数据资产价值评估工作效率、有利于提升数据增值运营水平、减少决策失误和避免经济损失。
数据存储资源池的建立可以建设“现金库”和“黄金库”。“现金库”的数据产品虽然缺乏长期使用价值,但具备流动性与场景性强的特点,其不适用于长期存储,但短期变现价值较好,能够较快的服务于日常的各类数据业务;“黄金库”的数据产品虽然个体价值较高并具备普适性应用价值,但其自身直接提供服务的可能性较低,需要深度开发成其他数据产品才能发挥更大的价值,可不断赋能不同时期的基础应用场景。
数据银行是数据金融价值属性的体现,它基于数据“海量、安全、绿色、生态”的存储、计算和挖掘服务能力,采用类银行的经营模式、商业理念和管理方法。数据银行的主要业务包括:数据收储、数据价值评估、数据资产交易、数据资产信贷等[2]。
数据收储是指对数据源进行汇集存储和一级开发,针对数据类型与来源可将数据划分为:涉密数据、敏感数据、隐私数据、开放数据等类型,并针对不同类型依照数据特点与应用场景、存储方式,进行不同程度的一级开发。例如:针对涉密和敏感数据就仅能完善数据结构,将非结构化数据整理成结构化数据并完善标注,此类数据应主要以蓝光存储为主,等数据解密或不具有敏感性时再进行资产化开发;而隐私数据和开放数据在获得数据所有权人的允许后可以主要用于数据资产化开发,在经过清洗、脱敏等处理后以提升数据价值,此类数据主要存储于热磁或固态硬盘,以满足应用端响应速度的需要。
数据价值评估主要是为机构或个人开展数据盘点、资产登记、价值评估等确权赋值业务,核心是为数据的资产化价值体现提供业务支撑。数据价值评估模型的建立将解决数据资产确权与评估问题,为企业提供数据资产金融化服务,以提升数据流动性,释放其资产价值。
数据资产交易与资产信贷是数据价值体现的主要形式,数据经过评估后就具备了抵押、担保的价值,可以为企业融资、数据资产证券化等业务的开展提供支撑。数据资产的定价是在传统资产价值评估与定价基础之上,增加数据类型、时效性、完整性等分类评估[3]。
数据银行区别于一般的数据交易中心的核心区别在于要搭建具备长期、安全、绿色低碳数据存储能力的数据中心底座,因此其应用场景存在一定的独特性和优势。数据银行核心独有数据的特性包括:时间空间维度长,非结构化数据,价值颗粒度低但易与其他数据融合聚变,应用场景不明晰,买卖双方差异化,时效性要求低,价值需要数据治理才能呈现。基于数据银行应用场景的独特性:互联网企业数据应用场景,主要是以热数据的应用为主,追求的重点是数据的即时性或短时期内效应,数据银行全场景应用除了热数据之外,其独特性在于开发基于有长期时间维度、数据量庞大的冷数据,用户对象特征需要长时期的信息积累才能暴露或表现出来的场景。基于数据银行数据融通的必要性:数据银行与传统人工智能的应用最大区别在于数据量的易得性、庞大性、多样性和时间尺度的长期性的限制,用户不能或者无法全部获得数据的全貌;数据拥有者和数据需求方较难直接对接,或达成买卖协议保障不足,因此需要通过数据银行的数据融通和交易服务,增加数据的内容完整度、时间维度完整性、结构一致性和价值凸显性等。
数据银行的商业模式主要包括存储空间租售、数据加工服务、数据产品出售、数据交易撮合、数据价值评估等。数据银行宜采用“自营”带动“集市”策略,数据交易初期以“自营”模式,通过高质量的数据“商品”组建数据银行的基本商品库,吸引数据需求方,后期逐步带动其他数据供应方进入数据银行,提高整体数据集市的交易活跃度。数据银行以全场景应用反向促进数据的汇聚融通,数据交易能否长期持续高频词进行,其核心在于交易之后的应用场景是否真实存在并且可变现,供需双方的真是需求能否得到满足。
数据的基础化服务还包括数据的一级开发,数据银行通过对数据的一级处理,使其变成标准化的可交易资源,用户可以根据需要来决定对数据是委托交易还是留存自用[4]。
数据银行的五大应用场景主要包括:
(1)医疗卫生,数据类型主要为基因数据、医疗影响数据、医疗病历数据等,其具备数据量大、应用场景多、对个人价值高等特点,数据来源主要为医疗、个人、研究所等,数据未来的需求方主要为医药公司、保险公司、科研院所、疾控中心等;
(2)司法存证数据,数据类型主要为庭审音视频和卷宗档案等,数据具有量大需长期保存的特点,数据来源主要为公检法机构所持有的数据,数据的需求方主要为法律从业机构及智能司法开发机构;
(3)教育行业,数据类型主要为录像、学习档案、课件等资源,数据具有量大、长期存储、价值大等特点,数据来源主要为学校、网课平台等教育类机构,数据的需求方主要为智慧教育开发商、网校、素材网站等;
(4)前沿科学方面,主要数据类型为天文数据、卫星遥感数据、语音和面部数据,数据具有长期海量存储、获取成本高、产学研转化可能性高等特点,数据提供方主要为天文台、航天局、数据源提供商等机构,数据需求方主要为天文爱好者、软件开发商、地图公司、旅游公司、保险公司、安防与定位识别、自动驾驶等公司;
(5)城市人车物数据,数据类型主要为车辆通行数据、城市建筑数据、城市人流数据等,数据具有数量大、存储时间长、实时更新等特点,数据主要来源于交通部门、施工单位、档案局等,数据的主要需求方为货运公司、金融机构、文旅企业、城市管理部门等。
数据银行的业务主要包括数据资产定价、数据产品交易、数据API中介、数据资产咨询等业务。数据资产定价是指基于数据一级开发处理后生成的数据资产,对其类型、时效、应用性、完整性等全方面进行综合评估定价,常用的定价模式包括平台预定价、协商定价、固定价、拍卖定价、反馈性定价等多种模式;数据产品交易主要是指搭建不同类型和行业交易平台发布金融数据、行为数据、企业数据、社会数据、交通数据、通信数据、电商数据、工业数据、投资数据、医疗数据、卫星数据等行业数据产品,以及模型算法、可视化组件、应用平台等大数据工具,数据分析结果、行业分析报告等咨询材料,数据用户根据自身业务需求,购买所需数据产品[5]。
数据API中介主要是基于开放的数据网上商城,对数据银行未存储和分析数据,提供在线交易渠道,通过API接口形式为各类用户提供出售、购买数据服务,实现交易流程中介管理,并按包月或调用次数进行收费。
数据资产咨询主要是基于数据授权下对托管数据资源进行分析处理,开展管理咨询的大数据建模、大数据分析、商业模式转型、市场营销策划等;以及基于技术服务的产业数据搜集众包服务、数据清洗、数据分析、智慧城市等定制化业务;并根据数据拥有机构或个人数据价值进行补贴。
数据银行是在对海量数据的全量存储、全面汇聚、规范确权和高效治理的基础上,对数据进行资产化、价值化,最终实现数据的交易融通和应用增值,是数据经济时代的数据要素市场化配置下的新业态、新模式。数据银行将对数字经济的发展起到导向作用,唤醒全社会对于数据资产价值的意识,引领全社会更加重视数据要素和数据资产管理;实现数据的高效汇聚、确权、治理、融通、交易和应用,最大程度开发和释放数据要素价值,提高数据要素市场化配置的能力和效率,成为赋能和推动经济良性循环的新引擎[6]。
数据银行的建立是数据存储设施与数据金融属性的重要结合。在业务开展中,一方面进行数据价值评估、数据交易、数据监管、数据安全、数据资产证券化等常规业务体系,打造数据交易基础创新平台;另一方面,可以突破贵阳大数据交易中心等传统数据交易中心的技术瓶颈,依托光电磁融合混合存储技术,针对数据进行“冷热”分类存储,在降低成本的同时,满足开展高价值数据存贷、应用业务需要,在满足数据所有者对数据安全存储、备份、归档的同时,拓宽数据应用业务渠道,完善数据价值的业务链条。
数据银行的建立有利于打破信息孤岛、加速要素流通。任何机构和个人可以将自身拥有的信息作为一种资产“存入”银行,由“银行”或第三方负责数据开发利用,再将加工处理过的数据以不同的产品、服务形态进行交易。数据银行加工标准、交易规则、交易机制等的制定均基于对于市场需求和风向的密切掌握,促使各单位、各行业、多门类的数据跳脱出原有的藩篱,相互融合,打破行业信息壁垒,削减“信息孤岛”现象。由于数据具有时效性,所以发布和购买数据的及时性是十分重要的,数据银行可以让有需求的用户及时得到所需的数据,也可以让数据供应方及时将所拥有的数据发布出去,为“借贷”双方提供了良好的途径,加速数据之间的流通,提高数据共享的效率。
数据银行的建立还将有利于优化数据供需配置、整合碎片资源、激活数据价值。数据资源供给碎片化和需求多元化是数据资源开发利用的主要难题。“数据银行”创造了一种类似共享经济的机制,消除了供需之间的信息不对称,让零散的信息资源在一个平台上呈现、匹配和交易。数据银行模式通过健全的数据交易流程和完善的数据交易体制,将分散的数据汇集起来,大大降低数据交易成本,减少数据流通过程中的信息不对称问题,帮助政府、企业更加精准、明智地进行决策。