数据垄断的演化与分类
——基于国内公共数据与商业数据

2022-03-08 11:10吕雨婷
信息资源管理学报 2022年1期
关键词:公共数据数据量企业

邓 崧 吕雨婷 杨 迪

(云南大学政府管理学院,昆明,650500)

1 引言

数字经济时代,数据作为与土地、劳动力、资本、技术并列的第五大生产要素[1],所蕴含的价值不断凸显,随之产生的数据垄断问题也引发了社会各界高度关注。垄断主体凭借数据优势破坏数字生态和市场竞争秩序,侵害用户数据权益,阻碍数据共享,损害社会公共利益,因此,数据垄断治理已成为我国当下最为重要的议题之一。2020年底,中共中央政治局会议提出“强化反垄断与防止资本无序扩张”,显示了党和国家领导层对于数据垄断问题的重视。对数据垄断进行治理,首先需要对数据垄断进行全面深刻的剖析,以此寻找数据垄断的有效对策。

我国政府是为人民服务的政府,为加快服务型政府建设进程,提高政府治理能力和为公民提供满意的公共服务的能力,需面向社会公民采集大量数据信息,因此,目前中国信息数据资源80%以上掌握在各级政府部门手中[2];中国前瞻产业研究院2020年8月发布的《2020年中国数字经济发展报告》显示,自2015年提出“国家大数据战略”以来,我国的数字经济市场规模迅速扩大,截至2019年末,数字经济的总体规模达到了35.8亿元,占GDP的36.2%[3]。鉴于此,需从公共数据与商业数据两个角度对我国数据垄断进行研究。当前我国商业数据处于大型互联网企业、平台垄断的态势,而公共数据所面临的“数据孤岛”与“数据堰塞湖”则阻碍了数据的共享与利用,数据垄断治理迫在眉睫。然而“垄断”并非是贬义词,数据反垄断的目标及难点并不在于如何彻底消除垄断,而在于如何找到垄断与反垄断之间的平衡点,以兼顾各价值目标以及各社会主体之间的利益。

2 研究现状

数据垄断研究作为一个新兴研究领域,涉及经济学、公共管理学、图书情报学、法学以及信息技术科学等多种学科[4-12],具有研究主题多样、涉及学科复杂等特点。因此,为保证文献综述的完整性,从图书情报学的文献计量视角出发,利用VOSviewer和Citespace软件,对北大中文核心期刊以及CSSCI期刊中关于数据垄断的研究进行知识图谱可视化分析,并在此基础上展开文献综述。

2.1 数据来源

文献数据来源于中国知网数据库,采取的检索限制条件为:主题=(“数字垄断”OR“数据垄断”OR“互联网垄断”),不限制时间范围(检索时间2021年5月24日),文献来源类别选择“北大核心”与“CSSCI”,得到有效文献共211篇。

2.2 时间分布

利用VOSviewer软件对关键词进行时间排列,见图1。可以发现关于数据垄断的研究主要集中在2014年以后,研究方向逐渐从对市场结构及其支配地位的分析转变到法律层面,自2018年后则转变为主要对大数据和数字经济的研究。

图1 关键词时序分布图

2.3 研究主题

关键词是一篇研究性论文的核心词汇,能够反映论文研究的主要问题。对数据垄断研究文献的关键词进行共现分析,并对其进行聚类,能够得出该领域研究的主题分布,见图2和图3。

图2 关键词共现网络知识图谱

图3 关键词聚类知识图谱

通过对文献的梳理,可以得出现有关于数据垄断问题的研究主要分为理论探讨型、规制对策研究型两种类型。

第一,理论探讨型。一方面是基于法律视角,对数据垄断行为进行定义。吴韬[13]通过对美国反垄断案件中关于互联网领域相关市场界定的梳理,得出互联网的特殊性决定了互联网反垄断案件的相关市场界定在方法和思路上要与一般行业区分开来的结论。许光耀[14]使用案例分析法对奇虎与腾讯之间的诉讼案进行分析提出, 由于互联网服务的边际成本为零,网络效果、锁定效果所造成的转换成本就成为了企业市场支配地位认证的主要因素。

另一方面是基于双边市场视角,对互联网平台企业进行针对性研究。Armstrong[15]最先对双边市场进行了定义,即买者与卖者的交易通过中间平台实现,且其中一方的收益由另一方的数量所决定。在Armstrong的理论基础上,王宏涛等[16]以中国电信业为例,构建了双边市场模型,总结出了中国双边市场的特征,并提出双边市场中价格弹性较小的一方会遭到较高的价格加成。

第二,规制对策研究型。一是基于数字经济发展的视角,研究对数据垄断在制度和技术层面的规制措施。孟小峰等[17]提出以区块链技术实现数据透明化,增加数据价值实现过程中的透明性,以此应对数据垄断以及由此带来的隐私权侵犯等问题;承上[18]则提出,由于数字经济与数据垄断行为的复杂性,对数据垄断的规制应当从消费者福利标准和社会福利标准两个角度来进行评判,不同标准应采取不同的规制措施。

二是基于博弈论视角,从价格歧视角度出发,提出抑制垄断的有效途径。李三希、武玙璠等[19]以垂直差异化双寡头模型为基础,讨论了在大数据时代对于非敏感个人信息保护的利与弊,证明了引入竞争将会使消费者总剩余和社会总福利在无个人信息保护和完全一级价格歧视时达到最大,应当在市场中引入竞争,保障竞争机制;蒋传海[20]构建两期动态博弈模型,对互联网企业依据消费者购买记录进行竞争性价格歧视的行为进行了研究,结果表明,企业可以实施价格歧视的内在原因是转移成本,并且和统一定价相比,歧视定价将会导致社会总福利损失,因此应当予以限制;胡继晔等[21]以出行市场为例,分别构建了静态博弈模型、新旧平台的动态博弈模型以及无限次重复博弈模型,提出数据经济时代的反垄断要求对多元利益的兼顾,同时数字平台的反垄断重点并不在于对平台发展的遏制,而在于引导平台回归推动创新、促进社会进步发展。

3 数据垄断的涵义与分类

通过对已有文献的梳理可以发现,以往研究主要是对企业这一市场主体的垄断行为的研究。在中国,数据的收集主体分为以盈利为目的的企业和以维持社会稳定、提供公共服务为目的的政府两部分,正如李克强总理提到“目前我国信息数据资源80%以上掌握在各级政府部门手中,‘深藏闺中’是极大浪费”[2],政府在现实层面确实占据着大量的资源,极易以数据量的堆叠形成公共数据垄断现象。同时,政府部门还存在着“数据孤岛”与“数据堰塞湖”等现象。因此,需要将政府的数据收集行为也纳入数据垄断的理论分析框架,才能获得关于数据垄断的完整认识。数据垄断也应当从政府收集的公共数据和企业收集的商业数据两个角度来进行理解。

3.1 涵义

从公共数据角度来看,政府治理数字化的转变以及服务型政府的建设本身就要求政府掌握大量数据,并依据数据进行正确的科学决策,政府对必要数据的收集天生就具有合法性与合理性。因此,公共数据角度的数据垄断主要从数据的流动性和信息收集的内容来理解,即政府、国企或事业单位在进行数据收集过程中,未履行告知义务并缺乏个人授权,同时由于各单位之间沟通交流渠道的缺乏、处理技术落后、现行行政体制阻碍等原因,导致海量公共数据只能以原始状态分散滞留于各部门,形成数据孤岛,被动形成数据垄断。

从商业数据角度来看,数字经济的飞速发展推动了各大数字平台类企业的蓬勃兴起,也使得此类企业能够进行大量的数据收集,在完成收集后,由于平台之间的竞争,数据具有了排他性,这为数据垄断提供了可能。从该角度来看,数据垄断是指寡头企业对数据资源进行独占、以海量数据支撑自身获得市场支配地位的行为。商业数据垄断多为谋求超额利润,主动进行垄断。

3.2 演化与分类

数据的收集与使用过程中,投入需求最大的是收集与使用机制的建立过程,在机制建立后,所需求的后续投入相对较小,即具有成本的弱增性,随着规模扩大,由于弱增性将产生规模效应,相对应地,数据的收集与使用将逐渐发展为垄断行为。因此,当不对数据的收集与使用进行特殊性规制时,随着时间与发展程度的推移,必然会完成从非垄断到垄断的演化,而不同时期产生的影响及需求的应对措施大不相同,需要分时期进行研究。

与传统自然垄断行业不同,数据领域的垄断具有政府与市场两个层面,同时市场中的企业具有双边市场特性、交叉网络外部性和产品服务提供的无边界性与可替代性的特点[22],因此,传统行业关于垄断类型的划分不再适用于数据垄断领域,需要新的分类方法。

数据的收集与利用以市场化程度以及汇集程度为最主要特征,以这两个变量为基础,可以对数据领域的垄断类型进行分类。

由于数据已经成为一种重要的生产要素,其市场化程度的测算借用卢现祥等的研究成果[23],市场化系数是指单位i所收集数据的市场化程度与所有单位收集数据的市场化程度平均值之间的比值。其计算公式为:

(1)

其中,Fi为市场化系数,mi为单位i数据的市场化程度,n为单位数。以0.5为判别标准,当Fi>0.5时,单位i数据的市场化程度大于平均市场化程度;Fi=0.5时,单位i数据的市场化程度等于平均市场化程度;Fi<0.5时,单位i数据的市场化程度小于平均市场化程度。

汇集度系数是指单位i所收集数据量大小与所有单位所收集数据量平均值之间的比值,反映的是单位i数据量的聚集程度。其计算公式为:

(2)

其中,Ei为汇集度系数,qi为单位i收集的数据量大小,n为单位数。同样以0.5为判别标准,当Ei>0.5时,单位i收集的数据量大于平均数据量;当Ei=0.5时,单位i收集的数据量等于平均数据量;当Ei<0.5时,单位i收集的数据量小于平均数据量。

以市场化系数为横轴,汇集度系数为纵轴,1为分界线,可以构建数据垄断演化分类矩阵来分析数据垄断程度及其类型。如图4所示,其中,第Ⅰ类为公共数据发展型,第Ⅱ类为公共数据垄断型,第Ⅲ类为商业数据发展型,第Ⅳ类为商业数据垄断型。四种类型的含义和形成机制如下。

3.2.1 公共数据发展型

该类型部门属于数据垄断演化分类矩阵的第Ⅰ类,所收集数据的市场化程度与数据量都相对较小,还处于数据收集的发展时期,垄断还未能形成。该类型的形成从数据量大小来看,主要是由于部门本身规模大小限制了数据收集量,使得数据量处于一个相对较小的阶段;而从市场化程度来看,其进行数据收集的目的往往是非盈利性的,同时,收集来的数据由于各单位之间对数据共享的抵触以及数据共享技术上的限制等原因,使得数据的价值挖掘受到阻碍,导致市场化程度处于较低的状态。从实际来说,地方政府、小型国企以及小型事业单位大多属于该类型。

3.2.2 公共数据垄断型

公共数据发展型的进一步演化往往就会形成公共数据垄断型,该类型部门属于数据垄断演化分类矩阵的第Ⅱ类,收集的数据量较大而数据市场化程度较低,已经基本完成了对较大地域或领域的数据垄断,垄断程度较高。该类型的形成从市场化程度上来看,与公共数据发展型原因一样,也是由其数据收集目的的非营利性和数据共享的困难性所决定的;而从数据量大小来看,由于该类型部门通常具有较大的体量,其进行的数据收集活动能够在较大范围内得到支持,因此收集的数据量也通常具有较大规模。从实际来说,中央政府、大型国企、大型事业单位大多属于该类型。

3.2.3 商业数据发展型

与公共数据相同,商业数据也存在着发展型,该类型部门属于数据垄断演化分类矩阵的第Ⅲ类,数据市场化程度较高但收集的数据量较小,较小的体量导致尚未形成对数据的垄断。该类型的形成从市场化程度来看,主要是由于其数据的应用本身就是以获取利润、实现营利为目的,部门对数据的应用往往还会配合前端商务,充分挖掘数据的潜在价值,使得数据市场化程度保持在较高程度;从数据量大小来看,由于该类型单位通常处于发展初期,财力人力有限,数据收集活动的规模处于一个较小范围内,因此收集的数据量规模较小。从实际来说,小微型互联网、平台类企业大多属于该类型。

3.2.4 商业数据垄断型

商业数据发展型的进一步演化就形成了商业数据垄断型,该类型部门属于数据垄断演化分类矩阵的第Ⅳ类,数据市场化程度和数据的规模都处于一个较高水平,已基本完成大规模的数据垄断,垄断程度较高,并且依靠数据垄断获得了较高的市场地位。该类型的形成从市场化程度看,与商业数据发展型相同,都是由于其数据收集目的的营利性以及数据商业价值挖掘的充分性所带来的高度市场化;而从数据量汇集度来看,由于该类型单位已经度过了自身的发展初期阶段,财力、物力、人力都有了较大提升,同时技术上的不断完善也往往会为该类型单位创造其特有的数据收集渠道,使得收集的数据量规模不断扩大。从实际来说,大型成熟期的互联网、平台类企业大多属于该类型。

图4 数据垄断演化分类矩阵

总的来说,从公共数据的层面看,当前中国的各级地方政府、小型国企等具有区域限制的单位仍属于公共数据发展型,尚未形成数据垄断,而中央政府、大型国企等具有国家性质的单位属于公共数据垄断型;从商业数据层面来看,由表1可以看出,中国当前互联网市场大型企业占据绝对主导地位,小微企业基本无法形成有效的数据收集,因此,商业数据垄断型是中国商业数据垄断的主要类型。

表1 2019—2020年中国互联网行业企业市场占比[24]

4 数据垄断的影响与应对

4.1 影响

4.1.1 有利影响

总体来看,数据垄断的有利影响都不单纯是由垄断本身带来的,更多的是由于数据的高度汇聚带来了数字红利下沉。从公共数据角度来看,政府通过对海量数据进行收集、整理、分析与利用,提升了政府公共服务精准供给的能力、对市场调节与监管的能力以及社会管理水平,社会公民因此得到精准高质的公共服务、公平有序的市场竞争和正常的社会秩序得以有效维持;从商业数据角度来看,作为企业关键性资源,商业数据汇聚度提高,企业竞争优势也随之提高。平台类企业通过对其采集的海量商业数据进行分析和深度挖掘,在成本投入最小化和资源利用最大化的基础上,不断提高其客户管理能力和产品研发能力,增强企业竞争力,刺激经济活力,带动平台经济兴起。通过平台高效整合各类资源,助推实体经济数据化转型,同时激发互联网企业创新能力,推动数字经济健康持续发展。由于数字经济本身具有极强的渗透力和创新性,使得数字产业和传统产业逐渐融合,引领传统产业数字化转型,产生新兴业态模式,推动社会总体经济水平高质量发展。然而事物具有两面性,与此同时形成的数据垄断也对经济社会发展造成了不利影响。

4.1.2 不利影响

数据垄断对经济社会最显著的不利影响是对公民隐私权造成侵害。大数据时代,虚拟性、开放性与数字化的特点加大了隐私保护的难度[25]。政府在进行公共管理活动和提供公共服务以及企业进行生产经营活动时常需要收集大量的公民数据,这些数据信息通常包括公民的姓名、性别等基础个人信息。近年来,随着信息技术不断发展,政府与企业的数据收集开始囊括公民面部识别特征、财务交易、浏览记录、交易支付记录等更加隐私化的数据,数据的搜集逐渐深化,延伸到与公民日常生活相关的各个领域。然而由于目前我国相关法律体系尚未形成且个人隐私与公共利益难以平衡,数据垄断的存在使得被收集者缺乏选择权力,以及隐私政策对自我表露的非线性影响[26]等原因,导致政府与企业在收集公民数据时逾越隐私边界,过度收集公民个人隐私数据,侵害公民隐私权。

除此之外,数据垄断根据其类型不同,会造成不同的不利影响,具体如下:

(1)公共数据垄断

①公共数据泄漏。公共环境下互联网开放程度日益提高,公共数据泄漏问题也愈发严峻。2020年初新型冠状肺炎疫情在我国爆发,为应对此次突发公共事件,政府利用大数据对公民数据信息进行大量采集,以此实时掌握疫情蔓延情况、分类管理流动人口、有效控制疫情扩散的风险。但与此同时公共数据安全也受到了挑战。对外,在全国上下抗击新冠肺炎疫情的关键时期,国家互联网应急中心网站多次发布境外黑客组织恶意攻击的预警通报,医疗行业存在高危漏洞隐患的系统占72%,暴露的数据管理系统达到709个,这部分暴露的监控或管理系统给黑客组织竖起了密集的靶子,遭到了集中网络攻击;对内,公务员利用职务之便,将公民信息提供给他人,泄漏公民隐私的案件屡见不鲜。疫情期间,以寻找密切接触者为名泄露他人隐私信息的事件频发,青岛某医院6000余人的隐私信息在互联网广泛传播。互联网的开放性以及黑客技术的发展导致数据信息窃取变得难以追查,而政府部门对数据管理、保存、匿名化等技术仍处于较低水平,且存在政府内部工作人员缺乏数据安全意识,忽视对隐私数据保护的重要性,导致海量公共数据被不法分子直接盗取或恶意攻击。

②公共数据冗余,利用率低下[27]。首先,目前我国在公共数据治理工作方面存在“重建设轻使用”的问题,数据治理机构建设有所建树,但使用率低下。公民办理业务时同一信息在不同的部门需重复登记,原因在于政府不同部门间数据信息难以公开共享,首要问题是元数据的质量问题,许多部门采集的元数据由于长时间未更新或采集时发生纰漏错误存在大量无效数据,此类数据在部门间难以共享利用,也无人处理,造成公共数据冗余。其次,由于各部门对数据的采集、储存、处理方式标准不一,面对突发疫情,一些部门选择通过线上采集公民信息,然后利用大数据进行分类处理,而某些部门采取准确率和效率较低的人工填报或电话问询方法进行记录、排查、统计、筛选等信息采集工作,导致数据统计标准不一,数据质量参差不齐,且缺乏统一整合的渠道,难以将收集的数据进行有效分析整合,从而使得疫情期间卫生防疫所涉及医疗、人口、交通、旅行、物资产生、物流、公共安全等多方面的数据资源碎片化分布,整合共享困难,公共数据利用率低下,导致疫情防控工作存在纰漏。除此之外,在实践中,政府部门内部时常发生数据多头收集的情况,即同一数据被不同部门多次重复收集,这种情况与公共数据垄断,政府部门间数据资源难以公开共享紧密相关。由于从已获得数据的部门请求公开共享的成本和困难程度大于本部门自行采集,既导致公共数据利用率低下,又造成了资源浪费。

(2)商业数据垄断

① 限制竞争,损害消费者利益。参考胡继晔等的研究成果来对该危害进行说明[21]。在理想状态下,市场中应该存在两个或两个以上的竞争主体,为便于表述,构建双企业博弈模型,两个企业向市场提供的总产品与服务为Q,两个企业分别提供的产品与服务为q1与q2,向用户收取的费用分别为p1、p2,成本为c,假设两个企业互相了解对方的策略、成本以及回报,假设常数a,则单位时间内有:

a=p+q

(3)

则企业1的收益U1为:

U1=p1q1-cq1
U1=(a-q1-q2)q1-cq1
U1=(a-c)q1-q12-q1q2

(4)

同理,企业2的收益U2为:

U2=(a-c)q2-q22-q1q2

(5)

则有:

dU/dq1=a-c-2q1-q2=0

(6)

(7)

(8)

(9)

当市场中的企业数量减少至1,形成单寡头垄断时,同样构建单寡头博弈模型,a、c、p、Q、U的含义与双企业模型相同,则有:

U=pQ-cQ

U=(a-Q)Q-cQ

U=(a-c)Q-Q2

(10)

dU/dQ=a-c-2Q=0

(11)

(12)

所以,收益U为:

(13)

②限制新企业进入,抑制创新。将上文中的双企业静态博弈模型改进为动态博弈模型,即假设企业1先进入市场,企业2后进入市场,在进入时,企业2可以看到企业1的价格与市场份额,此时,两个企业的预期收益为:

U1=(a-c)q1-q1q2-q12

(14)

U2=(a-c)q2-q1q2-q22

(15)

由于企业2后进入市场,只能根据已知的企业1的价格和市场份额确定其价格,因此:

dU2/dq2=a-c-q1-2q2=0

(16)

(17)

由于企业1能够得知企业2观察到它的价格与市场份额,直接将式(17)带入式(14),可得:

(18)

(19)

(20)

式(20)与式(12)是相同的,即在动态市场中,先入市场的企业会获得先占优势,其表现与其在单一寡头垄断市场一致。

由式(17)和式(20)可得:

(21)

可计算出两企业的收益为:

(22)

(23)

后入企业的市场份额为先入企业的一半,而收益更是只有先入企业的四分之一。结果显示,在商业数据的垄断中,由于先入市场的先占优势,会对后入企业形成挤压,提高行业的准入门槛,从而限制新企业的入场。随着新企业入场的减少,一方面该行业的单位数减少,不利于对创新角度的探索,另一方面,企业数量的减少会降低竞争程度,使得先入企业降低对创新的重视程度,从总体上来说不利于行业的创新。2021年7月24日,国家市场监督管理总局宣布依法对腾讯控股有限公司作出责令解除网络音乐独家版权等处罚。2016年腾讯和中国音乐集团在相关市场份额分别为30%和40%左右,同年7月腾讯收购中国音乐集团股权,获得较高的市场份额,与主要竞争对手合并后实体占有的独家曲库资源超过80%,可能有能力促使上游版权方与其达成更多独家版权协议,或要求给予其优于竞争对手的交易条件,也可能有能力通过支付高额预付金等版权付费模式提高市场进入壁垒,对相关市场具有或者可能具有排除、限制竞争效果。阻碍新企业进入市场,削弱行业服务创新能力,降低用户体验满意度,不利于网络音乐产业规范创新健康发展。

③大数据杀熟,形成价格歧视。在传统经济中,企业只能通过消费者自发公开的信息,通过设计不同的价格合约或提供增值服务等方式来对消费者特征进行识别,从而对消费者分类进行价格歧视,这种方式存在着信息收集困难、分类不精准、歧视执行难度大等问题。而在大数据时代,垄断型互联网企业对数据的收集可以通过信息网络技术对消费者的网上浏览、购买以及搜索记录等自动进行收集,并通过算法模型对每一个消费者精准画像,通过这些画像实现对消费者的“一人一页面、一人一价格”,进行差异化定价。在2019年北京市消费者协会发布的大数据“杀熟”问题调查结果中,有88.32%的被调查者认为大数据“杀熟”现象十分普遍,同时有被“杀熟”经历的被调查者占比达到了56.92%,显示了当前“杀熟”现象的普遍性[28]。

4.2 政策建议

不同的数据垄断类型其形成机制、数据类别以及带来的影响都大不相同,因此,应当针对不同的数据垄断类型采取不同的政策措施,以此扩大数据垄断的有利影响,尽量限制和避免数据垄断所带来的不利影响(见表2)。具体措施如下。

表2 数据垄断的不利影响

4.2.1 公共数据发展型

改革政府行政体制,建立数据信息公开共享机制。政府数据资源管理具有双重属性,不仅是技术问题也是管理问题,制度安排与技术保障缺一不可[29],以此促进政府“跨层级”“跨部门”“跨区域”数据公开共享。首先,精简政府层级设置,构建扁平化行政组织,减少数据在层层传递过程中发生误传、漏传导致数据共享无效的情况;各级政府设置专门的数据管理部门,对采集到的数据进行统一标准的规范化处理,促进政府内部公共数据共享链顺畅有序。其次,加快建立公共数据共享平台,实现公共数据双向传递,加强公共数据分析与处理、保护隐私数据安全等方面技术标准的完善,形成具体化可实施的标准统一的规范体系。再次,建立一套完善高效的数据共享利用机制,包括激励、监督、问责机制,通过绩效考核的结果评比激励各政府部门进行数据共享工作,并对数据公开共享利用过程实施监督,对于拒绝共享、提供虚假、错误数据的部门进行处罚。最后,构建政府部门间信任文化,促进各部门相互认知、相互信任,为追求共同的发展目标,消除部门间彼此防备的心理压力,主动共享数据资源,打破数据垄断。

4.2.2 公共数据垄断型

建立健全法律体系,特别是完善数据确权机制。公民隐私权的保护首先要求对数据所有权和使用权的确定,需要通过对现有的法律体系的建立健全达到此目的。现有的《网络安全法》主张数据被收集者具有对个人数据的控制权,所有权确定尚不清晰,容易导致企业或政府收集数据后将其自有化,被收集者无法对收集数据的使用、修改、删除等提出要求。当前,国家已对数据确权问题给予了重视。在《“十三五”国家信息化规划》中提出要加快推动“数据权属、数据管理”的立法。党的十九大期间,习近平总书记更是表明“制定数据资源确权、开放、流通、交易相关制度,完善数据产权保护制度”的要求。然而,目前我国数据权属思想意识不足,我国大数据发展战略聚焦于完善和发展数字产业,忽视了数据安全、数据权属等问题;其次立法层面一直未对数据确权问题作出正面回应,司法实践亦陷入困境;最后,我国数据确权配套机制不足,数据管理专职机构的集中统一建设也不足,截至2019年底,我国共有14家省级行政单位、超过70个地市级行政单位设立了大数据专职管理机构,但机构设置重叠,职能任务也不全面,比如大数据资源整合以及数据安全保护等职能并未涵盖全部机构[30]。因此,需从加强数据权属观念、完善数据确权相关法律和配套机制三个方面构建数据产权制度,从而更为准确地控制商业数据的垄断程度,激励社会各界数据公开共享,增加全社会数据资源总供给量,减少因重复收集数据而造成的资源浪费,推动创新。

4.2.3 商业数据发展型

强化市场竞争机制,加大政策扶持力度。商业数据垄断会导致市场原有的有序竞争环境遭到破坏,因此,要打破商业数据垄断,维持相互协调运行的竞争机制。需采取以下三方面措施,即政府加强宏观调控,加大对小微型互联网、平台类企业的政策扶持力度,调动数字经济市场的竞争活力;鼓励小微型互联网企业大胆创新,孵化多类型、高水准创新型企业,开辟新的数字经济服务市场,形成壮大新兴市场竞争力量,瓦解大型互联网企业在数字经济市场的垄断地位[31];鼓励各领域的互联网企业、平台之间互相监督、跨界合作创新,构筑新型竞争格局。

4.2.4 商业数据垄断型

防止算法合谋,避免数据卡特尔的出现[32]。数字经济健康发展的关键,是各市场主体利用其已有数据和前沿技术解决信息不对称问题,而非利用技术壁垒和数据垄断致使信息不对称问题恶化,扭曲市场。智能算法具有促进竞争和阻碍竞争的双重属性,既可以提高企业生产经营效率,又可能因算法合谋导致价格歧视等妨碍市场竞争的行为,因此监管部门应对数据算法进行必要解析,严格界定互联网企业、平台智能定价算法的行为规范性,防止算法合谋,导致商业数据垄断。

加大市场监管力度,由事后监管向事前事中监管转变。在《市场准入负面清单(2020年版)》中,将“金融控股公司设立相关管理措施”增至负面清单。相关部门应加强监管商业数据垄断型领域中大型互联网公司非法数据垄断行为,坚决反对垄断和不正当竞争行为,对“大数据杀熟”“二选一”等违反《反垄断法》的数据垄断行为进行严肃警告和行政处罚,夯实关键数据、关键技术、关键领域的监督与管理,同时转变监管模式,对大型互联网企业的监管,应该逐渐从传统的静态监管、事后监管转变为动态竞争的行为监管和事前或事中监管,科学设计反数据垄断监管治理框架,建设符合数据共享理念和数字经济发展特点的前瞻性市场监管体系,营造公平竞争的市场氛围。

结合图4的数据垄断演化分类矩阵,可给出政策建议如图5所示。

图5 政策建议图

5 结语

作为信息时代的“石油”,数据资源对我国社会经济发展至关重要,因此,无论是基于市场视角还是行政视角都需打破数据垄断,促进数据信息资源的合理开放共享,发挥数据最大效用。借助文献分析与模型构建,得出以下结论:

(1)从政府与市场两个角度,将数据垄断类型分为公共数据发展型、公共数据垄断型、商业数据发展型和商业数据垄断型四类。

(2)不同的垄断类型会产生不同的影响,故而应当采取不同的应对措施,即公共数据发展型着重数据共享机制建设;公共数据垄断型重点在于数据确权体系的建立;对商业数据发展型要采取适当政策扶持,维持市场有序竞争;对商业数据垄断型则要加强监管,特别是事后监管向事前事中监管转变。

(3)以数据集聚程度和市场化程度为基础,建立数据垄断演化分类矩阵,从理论模型层面构建数据垄断类型的分析框架。

猜你喜欢
公共数据数据量企业
公共数据授权运营机制探索
企业
公共数据治理中的价值实现机制
企业
企业
公共数据归属政府的合理性及法律意义
基于大数据量的初至层析成像算法优化
敢为人先的企业——超惠投不动产
高刷新率不容易显示器需求与接口标准带宽
宽带信号采集与大数据量传输系统设计与研究