李 伦,李 波
大数据时代信息价值开发的伦理问题
李 伦,李 波
大数据已成为21世纪的新石油,各国政府相继提出发展大数据战略。借助大数据收集、存储和挖掘等技术,大数据信息所蕴含的潜在价值不断得到开发,推动经济社会的发展。然而,在大数据信息价值开发的同时,也引发了一些迫切需要关注和解决的伦理问题,如隐私权问题、知识产权问题和信息安全问题。
大数据;信息价值开发;隐私权;知识产权;信息安全
随着大数据技术的发展,大数据信息蕴含的潜在价值不断得到开发。大数据信息价值开发涉及科技、商业、医疗、教育、人文以及社会生活的各个领域。在互联网、云计算和海量数据存储技术的推动下,大数据已成为全球科技界、企业界、学术界和各国政府关注的焦点,各行各业高度重视研究和开发大数据潜藏的价值。发达国家相继实施大数据发展战略,力图使大数据的信息价值得到充分开发,推动生产和信息交流方式的变革,加快信息价值的转化力度,提升经济增长质量。大数据是21世纪的“新石油”,是时代变革和经济社会发展的推动力。然而,不可忽视的是,在大数据信息价值不断得到开发的同时,由于大数据技术具有强大的收集、存储和处理数据的能力,它们容易引发诸多值得关注的伦理问题,如侵犯隐私权和知识产权,危及信息安全。
随着大数据技术的迅猛发展,数据日益呈现数量大、数据处理速度快、数据类型多、数据价值大等特征。据EMC公司预计,到2020年,全球数据使用量将达到40ZB(1ZB=10万亿亿字节)[1]。数据类型包括文本形式、图片、视频、音频、地理位置信息等。数据处理的速度越来越快,遵循1秒定律。数据的价值得到空前的开发,促进政府管理效率的提高,推动社会经济的发展。
联合国高度重视大数据的研发。2009年联合国也正式开启了“全球脉动”项目,旨在数据获取、存储和分析方式的创新,希望通过“大数据”来预测和判断某局部地区出现的经济、社会、政治和自然等因素引起的重大问题,以提前部署援助项目和支持力度。2012年联合国就大数据的研发做了进一步的规划和部署。
随着大数据时代的到来,欧美一些发达国家相继将大数据视为重要战略资源,并将大数据信息价值开发战略上升为国家意志。2010年11月,德国联邦政府发布了《信息与通讯技术战略:2015数字化德国》,大力发展信息通讯网络技术,强化德国经济竞争力,实现经济增长。2013年2月,法国总理让-马克-艾罗在“2012年欧洲数字化战略”所定目标的框架内,提出法国政府数字化路线图,旨在通过推进数字化建设,为年轻人提供更多的就业机会,利用数字化提高企业的竞争力,在社会建设和数字经济领域推动法国价值的实现[2](P22)。欧盟推出的《欧盟开放数据战略》则将重点放在大数据技术处理、数据门户网站以及科学研究数据基础设施等几大领域,使欧洲企业和社会公众能够更加便捷快速地获得以政府为主的公共组织信息,建立一个汇集不同成员国及欧洲机构数据的“泛欧门户”[3]。最值得关注的是,美国奥巴马政府在2012年就投入两亿美元支持“大数据研发计划”,旨在增强海量数据收集、存储和处理能力,这事关美国的国家安全和未来竞争力。他们主张未来对“大数据”的研发能力将成为国家竞争力的重要组成部分,是国家的重要战略资源。
我国政府也极其重视大数据发展战略。2015年9月,国务院发布了《促进大数据发展行动纲要》。这是我国关于大数据研发的顶层设计,是指导未来大数据信息价值开发的纲领性文件,旨在推进数据资源的开放、共享和开发,完善电信、网络普遍服务机制,超前布局下一代互联网和大数据的发展战略。该纲要提出,通过推进大数据的研发和应用,构建以人为本、惠及全民的民生服务新体系,开启大众创业、万众创新的创新驱动新格局,培育高端智能、新兴繁荣的产业发展新生态[4]。实施大数据发展战略是推动我国信息化进程,乃至提升国家软实力和竞争力的重大战略举措,是事关国家安全和未来综合国力的战略选择。
近年来,随着互联网的普及和大数据技术的发展,生成、收集和存储的数据呈现几何级数增长。移动通信、社交网络和监控设备的普及,以及电子商务和可穿戴智能设备的出现,个人的情感、情绪、习性、喜好、性格、行为、地理位置和社会关系,甚至身体状况的每一点变化都成为可被记录、存储和挖掘开发的数据。据EMC公司测算,2011年全球新产生的数据量已达到1.8ZB,大大超过了2011年以前人类信息量的总和[5],传统的软件工具难以处理如此巨大的数据。从个人到政府的行为都会生产海量数据,传统的数据软件工具无法记录、存储、管理和分析这些海量数据。如今数据记录日益细微和精确,数据生成平台日益多样化、规模化和海量化,这就要求存储容量和处理技术日渐强大,才能够处理传统数据工具无法存储和分析的海量数据,但值得强调的是,大数据之大不仅在于它的大容量,更在于要挖掘海量数据中的大价值[6](P14-26)。
从前,企业收集的数据的价值没有被完全开发,也很少多重开发其价值,因此,数据的现实价值相对较低。随着大数据时代的来临,数据抓取、存储和挖掘的方式发生革命性的变化,数据价值开发的意识高涨,数据价值开发的手段日新月异,吸引了企业或其他组织有意识地变革自己的营运方式和发展方式,确保数据价值开发的最大化。对企业而言,这种转变产生了良性循环,因为企业收集和存储了大量数据,企业就会召集相关人才挖掘开发这些数据之中的价值,信息价值的开发取得成功又激发企业去收集更多的数据[7](P4)。收集的数据越多,潜在的价值也就越大,这种信息价值开发的良性循环机制不断激励企业实现增长方式的变革。
各行各业正开启一个生成、获取和挖掘开发数据的新时代。以云计算为基础的大数据技术,越来越有效地、廉价地将海量的、快速的、变化的数据记录和存储起来,并可以根据需要进行分析和运算,使得大数据中潜在的价值得到充分开发和应用。借助大数据技术,数据正成为巨大的经济资源,成为新世纪的矿产和石油。
随着大数据技术的日益强大,大量的数据更容易被获取、存储、挖掘和处理。在我们看来,大数据信息价值的成功开发在很大程度上依赖于大数据的收集和存储,而数据收集和存储取决于数据的开放性、共享性和可获取性。由此,数据开放和共享是大数据时代的内在要求。大数据信息价值的成功开发也依赖于信息价值的开发和有效应用,将大数据中潜藏的价值挖掘出来,在实践中发挥效用,为当前经济和社会中存在的问题提供有效的解决方案和建议,为它们的发展提供动力和智力支持。然而,在大数据信息价值开发的实践中,由于各种技术力量的渗透和利益的驱使,使得在上述两大环节中都容易引发一些伦理问题,如侵害隐私权和知识产权,危及数据信息安全。
1.隐私权问题
信息价值的开发依赖于大规模的原始数据的收集。现在互联网、移动通信、电商、社交平台和政府部门等都在收集海量数据,然而,哪些个人数据是被允许的,哪些是不允许的,在具体的实践操作中确实很难把握。通常认为,关于个人数据信息的收集和存储应当尊重个人隐私。隐私是指私人生活安宁不受他人非法干扰,私人信息秘密不受他人非法搜集、刺探和公开等[8](P7)。在大数据时代,隐私问题是一个迫切需要关注的伦理问题,这主要是因为随着互联网和大数据技术的日益强大,以及各行各业的利益驱使,使得个人隐私权更容易被侵犯。与大数据时代之前相比,现在大量的个人隐私信息被收集,更能挖掘出其潜在的价值,且更难控制,更难追究责任。大量数据的收集是信息价值开发的首要前提,现代互联网具有开放性、共享性和全球性等特征,也正是在这样开放的网络环境下,大数据信息价值开发更容易通过强大的大数据技术获取大量的原始数据,更容易将从前属于个人隐私领域的信息视为公共信息,从而导致对隐私权的侵犯[9](P85)。
大数据价值开发的一个核心任务是预测人未来的可能行为,预测与人相关事物的未来可能状态,通过强大的数学算法对大量数据进行处理、分析,由此来预测未来事情可能发生的状态。大数据信息价值开发要实现相对较为准确的预测,需要依赖大规模的原始数据,这就意味需要从尽可能多的事物中抓取信息,甚至是一些极其平常的事物或状态中获取信息。如不同人的坐姿、不同人的声音、婴儿生命体征、搜索关键词,引擎的震动、机票销售等,通过量化方法把这些情形转化为数据,对这类数据进行挖掘,开发出更多的有创新性价值的产品或建议。如Farecast利用机票销售数据来预测未来的机票价格趋势;根据某人的坐姿和体重在汽车座椅上安装防盗系统;根据不同的声音来完善语音识别系统;麦格雷戈博士通过婴儿的生命体征来预测传染病的发生;谷歌使用搜索关键词来监测流感的传播;根据引擎的散热和震动来预测引擎是否会出现故障[10](P20)。这些情形表明,可以从日常的大数据中挖掘出未被开发的潜在价值。
然而,我们应该注意到,在数据信息价值开发和应用的过程中,很多情形可能造成侵犯个人隐私权的问题。一些组织通过数据收集,发现某客户的购买习惯和兴趣,通过数据分析和挖掘,开发这些信息的潜在价值,进行定向营销,可能导致对个人隐私权的侵犯。例如,某商场通过分析客户购物行为的数据,对某特定客户进行个性化的定向推销,导致一位父亲抗议商场给她只有十几岁的女儿推荐怀孕和婴儿用品。公司能够通过对不同类的大数据进行重组,准确定位特定客户的身体健康状况,个性化推荐治疗梅毒的相关方法和药物。公司也有可能通过多种数据的组合,挖掘出某两个人之间有婚外情或同性恋。这些情形表明,在信息价值开发的实践过程中可能不同程度地侵犯个人隐私权。
现代信息技术诞生之前,传统的专业数据公司针对相应的领域也能够记录和收集大量的个人信息,而且它们提供的关于特定个人的数据就不计其数。但是,互联网、移动通信、社交平台、视频监控和电商的出现,使得监视变得更加容易,收集个人数据的成本更低廉,数据量更大,数据类型更多,经过大数据挖掘价值更大。如亚马逊、阿里巴巴、京东等电商监视客户的购物内容和习惯;谷歌、百度等监视用户的搜索内容和浏览网页和网站的情况,Twitter、腾讯QQ和微信等记录我们的隐私、情感和情绪的状态变化;Facebook对我们的各种行为、情绪和喜好了解更多。不仅企业,政府也会对大数据感兴趣。根美国权威媒体报道,2010年美国国家安全局每天窃取的各类通信记录多达17亿条次,监视美国及他国公民的通信交流记录有20万亿次,其中涉及收集到通话人、邮件人和电汇人等的具体信息[10](P195)。由此可以看到,不管企业行为还是政府行为都在不同程度上涉及个人隐私侵权问题。
人们普遍认为,知情同意可以适当避免隐私权被侵害。然而,在大数据时代,这种原则发挥的约束作用面临诸多挑战。知情同意原则要求数据采集者在开始收集数据之前,首先需要向个人申明,他们将会收集哪些数据,收集的数据做什么用途,在征得个人的同意之后,方可以展开数据采集工作。我们知道,大量的数据在收集的时候除了首要的开发价值之外,还有很多其他潜在的可开发的价值。如通过对数据的再利用,或通过与其他数据进行重组,或数据废弃的利用等能够挖掘出其他的潜在价值。正因为如此,数据采集公司无法告知个人很多尚未挖掘出的其他的潜在价值,此外,在开始收集数据之前,就要求个人或用户同意这些数据将会产生的所有可能价值,这也是行不通的。数据规模非常大,以至于不可能实现征得每个个人的同意,比如谷歌使用检索关键词预测流感时,很难向数亿的用户征得同意。也有学者主张通过对收集的数据进行技术上的处理来保护个人隐私,但由于数据的第二次利用或多种类型的数据重组也同样会产生侵犯个人隐私权的问题[10](P197-200)。总之,在大数据时代,不管是知情同意原则,还是技术上的模糊化和匿名化都难以起到很好的保护作用。而如今大数据技术的发展日新月异,个人或用户在很多情形下都感觉到自己的隐私信息,甚至隐私空间有受到侵犯的危险,大数据技术越强大,隐私权越容易受到侵犯。因此,这是一个迫切需要进一步深入探讨的伦理问题。
2.知识产权问题
知识产权是一种无形资产,具有相对和绝对权利的双重属性。知识产权的绝对权利属性表现为知识产权的专有性和垄断性,非经其所有者允许,不得擅自使用。知识产权的相对权利属性表现为知识产权的地域性和时间性,也就是说,这种权利属性只有在特定的区域和时间内才有效。知识产权所具有的这种双重属性表明,它一方面是一种垄断权,具有排他性;另一方面又是一种相对权利,为合理使用和自由共享留下空间。因此,知识产权在理论和实践上始终存在着自由共享和限制使用之间的矛盾[11]。随着大数据时代的到来,这种矛盾将变得更加突出,知识产权已成为一个令人瞩目的问题。网络大数据技术可能导致知识产权越来越容易被侵犯,使知识产权难以得到保护,网络大数据技术也可能导致知识产权的强保护,使自由共享成为不可能,这两个方面的问题都值得我们认真对待。
第一,网络大数据技术使知识产权更容易被侵犯,更容易面临困境。在大数据信息价值开发过程中,相关利益组织倾向于强调知识产权的相对权利属性,从而更容易造成知识产权频繁被侵犯的现象发生。随着大数据抓取技术日益强大,盗版更加便利,作品被获取、复制和传播更加便捷,权利人的利益更容易遭受侵害,导致知识产权尤其是版权的保护更加困难。版权保护制度与信息载体的发展密切相关,在印刷术发明之前,作品的复制几乎是不可能的。这时的版权保护意识也非常微弱。但是,随着纸张和印刷术的发展和推广,作品的复制、传播变得容易,于是版权保护意识越来越强烈。而如今,各种复印、录音和录像设备,电视、网络和移动通信的发展和普及,以及互联网和大数据技术的日益强大,使得作品复制、传播更容易、更低廉、更高速,更多样化,使知识产权侵权行为变得更加隐蔽、更加难以控制、更加难以追究责任。
第二,值得注意的是现代网络技术对知识产权的控制能力越来越强,很可能妨碍大数据的发展。与传统的信息传播载体相比,现代互联网技术在架构上具有更强的操作和控制能力。例如,为了控制某些网站网页或文件被访问的权限,通过利用计算机代码就可以实现,如设定要求访问者必须提供ID和密码才可以登录访问它们。甚至有专家建议通过浏览器来实施监控网络和访问,设置成每次登录访问都需得到授权。人们还提出了很多监控网络的方案和建议,从技术上来实现上述方案或建议变得轻而易举。但是,这些方案和想法完全忽视了互联网本身的特征,显然,它们不仅与开放、自由和共享的网络精神相悖,而且也会造成大数据信息价值开发难以拓展和深入。这将是走向过分保护知识产权的极端,违背知识产权的内在本质[11]。
总之,大数据技术的不断发展,加剧了知识产权在自由共享和限制使用之间的矛盾,给知识产权的保护带来新的挑战。一方面,网络版权的保护难度加大,大数据技术为侵权行为在技术上提供了可能性,使侵权行为变得更加隐蔽,使版权保护难以得到保障,尤其是在互联网和大数据的大环境中很难界定侵权责任和追究侵权责任人。另一方面,互联网和大数据技术也为知识产权的滥用提供了条件,如可能导致“合理使用”的消失。
3.信息安全问题
在大数据时代,网络数据信息的收集、存储和传播过程还会面临信息安全的问题。在信息网络空间中,在匿名制、虚拟身份和多重角色的掩护下,病毒和“木马”横行,恶意攻击网络;“黑客”天马行空;“江洋大盗”防不胜防;邪教组织借助网络传播其教义;国际恐怖组织利用虚拟空间发表激进言论,发动恐怖袭击;国际间谍利用网络盗窃国家机密;网络战和信息战危及国家安全和世界和平[12](P202-203)。
所谓信息安全是指国家机构、公司和个人的信息空间、信息载体和信息资源不受来自内外各种形式的威胁和侵害。随着大数据技术日益渗透到生产、生活和观念等领域,危及信息安全的问题接踵而至,大数据信息安全问题也引起了人们的关注。云安全联盟(Cloud Security Alliance,CSA)大数据工作组发布的一份研究报告指出,大数据引发了十三大安全和隐私挑战[13]。
互联网技术和大数据技术的联姻,共同编制出一种强大的网络,网住了我们的生产领域,也网住了我们的生活和交往领域,并悄悄地对我们的生产、生活、交往方式和观念产生深刻的影响。大数据已成为当前关注和研究的热点,无论学术界或产业界都试图通过对大数据进行分析、处理,以挖掘其潜在价值。我们知道,大数据信息价值的开发很大程度上依赖网络信息、数据的开放性和共享性,然而正是这些属性给网络社会带来了诸多信息安全隐患。当数据信息成为重要的战略资源时,其具有的利益和诱惑性更大,那么侵害信息安全的可能性也就更大,侵害信息安全的方式更加隐蔽和多样化,这也就意味着保护信息安全的难度更大。
我们可以从两个层面概括大数据信息价值开发过程面临的信息安全问题。首先,大数据信息价值开发自身存在的安全问题。主要有基础设施老化或被损坏;由于数据管理不善而造成的数据泄露、乱码等风险;数据的分析和组合开发侵害个人信息安全和隐私;由于数据来源和数据失真引起的数据自身的可信度不高。由于数据呈现几何级数增长,现有的信息安全技术和设备难以确保海量数据的绝对安全,造成数据的安全风险加大。其次,大数据信息价值开发的外部环境面临的信息安全问题。大数据信息开发的外部环境造成的信息安全问题主要表现在如下四个层面:现有法律法规过于抽象化,难以具体操作实施;由于数据保护的相关法律缺失,行业间缺乏自我约束机制;用户或个人信息保护意识的薄弱导致他们的私密信息泄露的风险增加;由于大数据在数量上的庞大以及所蕴含的巨大价值,引诱网络黑客攻击,加剧了大数据环境下的信息安全风险[14](P24-27)。
综上所述,在大力推进大数据战略的进程中,我们既要充分利用大数据技术挖掘信息的价值,促进经济社会的快速发展,促进社会的信息化发展,也要关注和解决信息价值开发过程中可能产生的隐私权、知识产权和信息安全等方面的问题。信息价值开发带来的创新和利益以及隐私权、知识产权和信息安全等都是人类极为珍视的价值和利益,只有合理平衡创新、利益、价值和风险,才能促进大数据战略的实施,促进经济社会的健康发展,并保障人类的各项权利。
[1]刘松柏.大数据:未来的“新石油”[N].经济日报,2013-11-13.
[2]法国政府推出数字化路线图[EB/OL].http://intl.ce.cn/specials/zxgjzh/201303/08/t20130308_24 180690.shtml.2016-10-10.
[3]陈潭.国际大数据战略:从发展趋势中把握核心经验[N].中国社会科学报,2015-4-8(B04).
[4]国务院印发《促进大数据发展行动纲要》[EB/OL].http://www.gov.cn/xinwen/2015-09/05/content_29252 84.htm.2016-10-10.
[5]ChrisMellor.Dedupingthedigitaluniverse[EB/OL].http://www.theregister.co.uk/2011/0 6/29/idc_digital_universe/.2016-10-10.
[6]涂子沛.大数据及其成因[J].科学与社会,2014(1).
[7]Jared Dean.大数据挖掘与机器学习——工业4.0时代重塑商业价值[M].林清怡,译.北京:人民邮电出版社,2015.
[8]张新宝.隐私权的法律保护(第2版)[M].北京:群众出版社,2004.
[9]李伦,李军.隐私权:网络传播自由的道德限制[J].道德与文明,2007(5).
[10]维克托.迈克-舍恩伯格,肯尼思.库克耶.大数据时代:生活、工作与思维的大变革[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2017.
[11]李伦.“数字困境”与网络知识产权伦理[N].中国教育报,2009-1-7(03).
[12]李伦.网络传播伦理[M].长沙:湖南师范大学出版社,2007.
[13]Cloud Security Alliance. CSA Releases the Expanded Top Ten Big Data Security&Privacy Challenges[EB/OL].http://cloudsecurityalliance.or g/media/news/csa-releases-the-expanded-top-ten-b ig-data-security-privacy-challenges/.2016-10-10.
[14]黄国彬,郑琳.大数据信息安全风险框架及应对策略研究[J].图书馆研究,2015(13).
李 伦,教育部人文社科重点研究基地湖南师范大学道德文化研究中心、中国特色社会主义道德文化协同创新中心、人工智能道德决策研究所教授,博士;李 波,湖南师范大学人工智能道德决策研究所讲师,博士。
国家社会科学基金项目“开源运动的开放共享伦理研究”(17BZX022)