彭心一
武汉市建设工程设计审查和消防验收中心 湖北武汉 430015
近年来,随着计算机科学的蓬勃发展,算法(Algorithm)这一原本属于传统数学领域的概念也被投入计算机领域。国内“互联网+”概念提出后,使原本封闭的互联网突破了传统的时间、空间限制,所有信息数据可以实时进行收集和处理,催生了利用数据作为生产力引领经济发展技术创新的“数字经济”。数字经济和其他行业的融合渗透推动了产业领域的增长,提升了经济发展的上升空间,而大数据作为数字经济时代的“新能源”,大数据算法作为数字经济时代的“新生产工具”,如何对它们在法律上进行赋权和规制,是数字经济时代的重要命题。
为顺应我国“十四五”发展规划,推进数据知识产权保护工作,2021年10月9日,国务院办公厅颁布《“十四五”国家知识产权保护和运用规划》,其中“专栏2”提出数据知识产权保护工程,从开展立法研究、完善法律法规、建立行业规范、推动国际规则制定、保护数据安全几个方面,对数据知识产权的赋权和规制进行了讨论[1]。大数据算法作为新兴的前沿科学技术,在与现有的法律规范造成冲突的同时,也会不可避免地和现有伦理观念产生碰撞,这与伦理学界的普遍观点也不谋而合。[2]在考虑对其进行法律规制的同时,也需要对其伦理方面的冲突引起注意。
大数据(Big Data)泛指体量大、增长率高、信息种类繁多、来源复杂的数据集合,是国家重要的战略资源。而“大数据”并非只是在“数据”的概念上简单叠加一个“大”字。不同于互联网上没有经过数据处理的海量信息,大数据进行了信息处理,从而产生了以人工智能为代表的信息应用科技。大数据算法(Big Data Algorithms)是通过将海量的数据作为输入,并通过特定的程序分析处理这些数据集合,从而作出决策的算法。随着数字经济发展,海量数据集的产生使人类越来越难以依靠传统的人工决策进行高效数据处理具有人工智能、深度学习特性的大数据算法可通过采集、分析、运算数据集,对数据的特性、技术、结果形成自动化决策,在现代数字经济发展中的作用越来越重要,难以替代。
数字经济与大数据算法之间存在天然的相通关系。数字经济能将任何有机物和无机体都看作“算法”的一部分,从而使大数字的外延范围向外扩展;在新一轮工业革命的大潮下,我国正处在以网络为核心的新型信息技术上升期,由大数据算法为主导的新型信息技术的合理应用,势必让大数据分析中蕴藏的巨大经济价值得以全面释放,使中国数字经济发展走向新的台阶。
然而,大数据算法只有在数据来源正规、中立客观的情况下,才能在数据收集、智能分析、结果预测等方面发挥优势。如果数据本身有缺陷或不完美,仅靠通过技术手段并不能避免大数据算法被错误使用或滥用,从而导致一系列问题。
在运行大数据算法的过程中也需要遵循人类道德准则的规范。算法伦理问题是传统信息伦理问题在数字经济背景下的进一步延伸。由于大数据算法作为实现决策的技术手段具有双面性,造成的算法伦理问题不断挑战用户的正常生活,造成了负面影响。其中,最为突出的是用户知情权和个人信息的泄露,以及违反信息伦理。
大数据分析技术的应用使得信息资料收集的难易度大大降低,自动化程度上升。目前,部分算法设计师对消费者的不同软件应用的用户端数据进行采集统计分析,并利用大数据算法生成“用户画像”(Persona),以进行产品的针对性推广,平台掌握了用户的需求和偏好,便能更具针对性地向用户推送商品和服务,长此以往,可能会导致信息伦理问题的出现。
大数据算法对用户画像的精确掌握使平台对用户的偏好和消费习惯产生滥用。其本质是平台通过分析用户画像,形成的带有价格歧视性质的大数据算法。它将平台的话语权无限放大,成为绝对的规则制定者,这种算法权力的滥用行为需要被及时约束。
由于用户在网络信息平台获取的信息偏向于自己喜欢的领域,久而久之,这种信息获取的非全面性将必然导致信息认知偏差,即“信息茧房”,而在其中发挥作用的正是个人推荐算法。
同时,大数据算法更多依赖于信息收集和计算机自身的深度学习,而深度学习的后果往往难以预料,算法黑箱是数据保护的天然屏障,但同时也为算法的伦理规制带来了困难。数字经济时代,算法黑箱化倾向也会更加突出。
大数据的来源一般可分成自然科学数据和社会数据两种。然而,无论是科学技术、社会进程如何向前发展,这两方面的数据也无法被全部收集涵盖。这些数据的产生、获取从客观层面来讲依然是具有随机性、特殊性的,同时,收集的数据也不能包括边缘数据和未能电子化的纸质数据。大范围的信息共享平台也未能搭建,年代久远的信息只能以纸质形态保存,散布于不同领域,没有参与信息流通。如何盘活信息资源,共享数据,完善大数据样本,政府部门的角色不能缺位。大数据算法只有在信息来源本身完善、高效的前提下,才能切实体现其优越性。只有在保证数据资源合理利用的前提下,同时保障用户使用数据权限的私密性、合法性,才能形成良性的数据处理机制和网络监管机制。
算法黑箱的普及也催生出了借助网络、大数据技术和智能算法而形成的全新权力形态,即算法权力。算法权力能够短期内提升企业效能、社会福利、政府管理效率等,但从长远来看算法权力的渗入对合法权利体系来说必然造成权力滥用。并且,算法内嵌了设计者自身的价值取向,由此可能会产生算法歧视。如有的专家所说,算法的本质是“以数学方式或者计算机代码表达意见,包括其设计、目的、成功标准、数据使用等都是设计者、开发者的主观选择,设计者和开发者可能将自己所抱有的偏见嵌入算法系统”。[3]程序员在编写算法的时候,往往从自身角度出发,依靠自己的专业知识和价值评判标准构建逻辑框架,编写代码。久而久之便把对自身不熟悉的领域排斥在了思考范畴之外。
面对大数据算法这一新兴主体所造成的伦理问题,需要同步更新法律规制手段。注重用户隐私保护,消除数据偏见问题和歧视问题,同时提升监管措施和提升算法透明度,从而确保大数据算法的运用符合公众利益。
必须破除数据信息孤岛,并大力推动全社会的数据开放与资源共享,其中以政府数据开放更为关键。这样做的原因在于,一是真正核心的数据绝大部分掌握在政府部门,二是政府的主导可以更好地促进大数据全面、有序、规范的共享。可以说,如果没有政府介入和整合,就没有真正的大数据。所以,需要由政府牵头,就大数据公开的收集、传播、保存、使用和公开等各环节规范管理并出台立法,明确界定了政府数据公开主体、范围、程序,同时以《网络安全法》《政府信息公开条例》等法律为上位法基础,以各省、市自身的具体情况引导实施,并因地制宜出台地方性法规或规章,为大数据公开主客体各方的权利义务等规定提供了法律依据。既要促进数据资源最大化利用,又要保障公众的知情权、行政参与权和监督权。在知情权保障的基础上实现数据资源的充分开发利用。
大数据算法的伦理规范完善的首要要求就是保证客观性。在算法设计开发初期,应确保其使用不违背算法设计者和开发者的本意,不违背法律规定及道德准则要求。当算法投入商业使用时,将根据其原先设定的用途合理使用,同时人类社会的法治精神与美德内嵌于算法行业的商业伦理准则。同时加大在教育与培训方面投资,以提高社会对大数据算法的认知度。加强对从业人员的教育培训,使其了解大数据算法的运用应当遵循哪些规范和准则;各高等院校可多注重专业交叉教学,有关政府组织及公司也可邀请专业人才对成员作有关技术培训。引导公民积极参与监督,以适应未来的高速增长,提高公众的认知能力。
完善数据立法,进一步增强立法对数据主权领域的支撑保护功能。如欧盟《通用数据保护条例》(General Data Protection Regulation,GDPR)专门立足于保护个人数据隐私。《中华人民共和国数据安全法》对盗窃和用其他非法手段获取数据的行为作出了限制,同时扩大了向境外提供数据的监管适用情形;《中华人民共和国网络安全法》《中华人民共和国个人信息保护法》也明确了对数据的使用收集要克制,明确哪些数据是必须要收集的,如果不能收集,就要明确相应的制度对其进行保护。
同时,根据算法的使用目的来设定法律规制。根据商业、教学、研发、个人使用等目的,对数据安全和隐私的保护进行区别保护。如果是出于商务目的而使用大数据算法从事生产、管理活动的,就必须要保障信息使用权人的合法利益,而不能任意损害商业信息所附带的著作权、商业秘密等利益;企业个人或科学研究机关以教学、研发为目的对数据加以撷取、数据分析的,政府部门或地方司法机构以行政管理或严厉打击违法活动为目的对数据加以获取和分析的,则必须对信息使用权人加以一定的约束。当然,这些约束都是相对的,也不是指有关机构和社会个人都可任意损害数据使用权人的合法权益。
算法水平的高低影响国家综合实力,因此,从国家利益来看,国家算法权力只能增强不能削弱。针对新型的科学技术,应当采用包容审慎的态度。明确设立算法审计制度的目的在于保证大数据算法的准确性、公正性,同时兼顾数据安全和个人隐私。对于尚处于创新发展中的算法应用,可以采用事中和事后审查兼用的模式,对于事前无法准确判断其影响的大数据算法,可以在不危及公共利益和个体基本权利的前提下,考虑设置一定的“观察期”。同时建立算法审计制度,明确具体的审计标准,确保审计人员具有专业知识技能,建立明确的算法设计者、控制人监管机制和针对算法失灵、算法崩溃的应急预案机制。静态的制度设计会产生监督系统不到位的情形,所以政府必须创新制度设计,并动态地调整监督系统,才可以搭建由政府领导的大数据分析审计与监督平台,对公司进行真正的动态监督。
利用“算法问责”控制算法歧视和新技术对隐私的侵袭。传统的决策问责遵循“谁决策谁负责”“谁主管谁负责”,虽然大数据算法决策是机器做出的决策,也要从“谁设计谁负责”和“谁主管谁负责”的方式来溯责。在《算法问责法(草案)》、欧盟《通用数据保护条例》《中华人民共和国个人信息保护法(草案)》等的系统问责制度中,均有规定计算问责制度的有关条款。在法律执行方面,可以通过明确违反算法伦理的问责对象、制定包含调查违规行为、证明问责事实、决定问责措施等步骤的问责程序,将问责与处罚制度相衔接,确保算法问责能够得到合理合规的执行。在行政手段方面,[4]可通过区分职责层级,分别明确计算设计者与系统之间的职责关系,并赋予计算设计者程序解释权,使数据处理者遵循透明度原则,对处理过程和结果进行充分透明化,以确保数据使用的合法性和公正性。对算法解释有助于理清算法行为背后存在的技术问题与判断失误,除便于进行系统问责的制定以外,也可促进计算机决策流程的完善,同时也是算法透明的体现。
数字经济时代充满着新的机遇和挑战,大数据算法决策将会获得更加广阔的应用与推广,并潜移默化地改变着人们的生活,因此,我们需要对大数据算法的保护和规制进行前瞻性思考。道德准则的执行往往受人的主观性影响,技术措施的效果受技术水平和技术应用情况的限制,因此,在实际应用中,最好的做法是综合采用法律法规、道德准则和技术措施,以提高数据处理的安全性和公正性。通过完善立法,提高法律伦理水准,通过强化行政介入来达到政府间接调控监管市场的目的,从总体上提高了经济质量与社会发展效果,并达到了经济社会发展、市场与消费者维护三者间的动态均衡。在此基础上,希望我国能够积极推动社会各方的大数据管理合作,促进社会和谐发展注入活力和动能。