算法传播:从“算法可治”到“算法善治”

2022-05-30 10:48沈浩
对外传播 2022年10期
关键词:数据安全人工智能

【内容提要】算法治理是数字经济时代的重要一环。随着算法技术不断发展,算法带来的问题日益暴露在人们眼前。为了应对算法问题,国内与国外都提出了算法治理手段,面对不同类型的算法理论,算法治理需要有不同的切入点,以实现“算法可治”;“算法善治”的未来基础,需要政府、技术和企业三方的合力,共同实现科技向善。“人类时空共同体”这一概念同时覆盖了时间和空间两个维度,是算法治理的积极尝试,也为未来的元宇宙与算法治理提供思路参考。

【关键词】算法治理 人工智能 数据安全 人类时空共同体

引言

随着计算机技术、人工智能技术的飞速发展,人类已经逐步迈入信息战、舆论战和认知战的时代,算法已经遍布我们的生活。为了应对数字时代传媒变革、网络文化发展,以解决、提高我国国际传播能力和社会治理能力的需求,“算法可治”与“算法善治”显得尤为重要。

一、算法与算法发展现状

(一)什么是算法

算法本质上是由计算机编程语言编写而成的一段程序,但是在如今的社会,算法的定义已经相对泛化。在当今快速发展的大数据时代背景之下,计算机技术的飞速发展促使机器学习、深度学习、人工智能、元宇宙等概念相继出现,算法已经成为许多数字产品、具有影响力的社交媒体、电商应用程序等产品的标配。然而,算法在伴随这些互联网产品的发展过程中也渐渐出现了问题。

(二)国内算法发展现状

信息茧房问题最初在2008年由桑斯坦在《信息乌托邦》中提出。信息茧房的基本概念为:人类在信息流中会被自己感兴趣的信息所引导,这种现象导致了人类更愿意且只能够获取自己感兴趣的信息,从而将自己封闭在这类有限的回音壁般的信息流之中,就如同蝉蛹吐丝将自己包裹在茧房里。① 如今以个性化推荐为代表的算法是信息茧房问题的主要来源。在中国,以字节跳动为首的互联网科技公司,于2016年前后开始对个性化推荐应用程序(APP)进行大面积推广。这些应用程序通过采集海量的用户行为信息,对数据进行深度挖掘,对用户进行画像、打标签,来分析用户的行为,以便把用户最感兴趣的信息推送到他们手里,让每个人都沉醉在自己的“舒适圈”。

除了信息茧房问题之外,我国还面临着大数据“杀熟”问题。大数据“杀熟”是指在面对同样的服务或商品时,老用户看到的价格要比新用户贵出许多的现象。企业为了追逐自身利益,利用数据算法的不透明性,通过挖掘不同时空区域、不同画像以及不同兴趣与偏好的用户信息,对新老用户进行区别定价,并结合复杂的促销规则和算法,混淆价格和优惠,具有极大的隐蔽性,给用户取证维权带来极大的困难。

现在人们的生活离不开算法,衣食住行各方面都需要算法。软件定义一切,数据驱动未来,算法统治世界。当算法变得越来越重要,同时又带来了一系列算法问题,我们迫切需要加强算法治理。

(三)国外算法发展现状

国内的算法潮流是字节跳动等互联网平台企业带来的,而国外的算法鼻祖来自亚马逊网络电子商务公司。亚马逊公司通过收集海量的用户购物信息,来分析每个用户的购物兴趣,构建用户画像,形成千人千面。在用户浏览商品时,向他们推荐他们可能会更感兴趣的商品,用户在购买商品后产生的购物信息,会再次补充到用户的个人画像当中,以此达成循环。推荐系统得以获取到更多的用户信息,达到完全的个性化推荐。

以信息茧房为主的算法问题不仅仅出现在国内,千人千面和用户画像技术在国外做得更好更强,甚至更极致。在拥有了海量用户个人信息之后,除了信息茧房问题,还会出现以用户个人信息泄漏为主的个人隐私保护问题。对于美西方国家来讲,个人隐私保护是重中之重,这些国家和地区特别关注所谓的个人隐私,因此欧盟于2018年5月最先出台了《通用数据保护条例》(GDPR)。《通用数据保护条例》(以下简称《条例》)指出:欧盟公民,无论是在欧盟的境内还是境外,只要有公司、企业或个人想要获取公民个人信息,必须要先进行承诺声明对该公民信息进行获取,该公民可以允许,也可以不允许。即使该公民允许他的信息被获取采集,也可以随时取消允许。②《条例》的惩罚力度很大,2019年7月,英国航空公司因违反《条例》被罚款1.8339亿英镑,约合15.8亿元人民币。③面对《条例》的巨额罚单,欧美大量的企业在服务于欧盟的客户时,都会对算法进行一些限制,以防止算法對用户信息的滥用和用户信息泄露。

随着欧盟《条例》的公布,美国也于2018年6月出台了《加州消费者隐私法案》(CCPA),这是美国首部关于数据隐私方面的保护法案。《加州消费者隐私法案》(以下简称《法案》)的出现,使得美国在数据隐私方面不再是空白。该《法案》让加州消费者的隐私数据得到了安全的保护,其被认为是美国最严格的消费者数据隐私保护法。

随着这些条例和法案的颁布,美西方渐渐形成了数据的保护机制和相应的数据管控条例。因为算法的强大,在当前舆论战、信息战和元宇宙的大环境下,其在欧美被当作一种武器,用来获取利益,攻击对手。2020年,美国指责抖音国际版(TikTok)泄露用户数据,危害美国国家安全,时任美国总统特朗普意欲强行收购抖音国际版,将字节跳动的服务部署到美国本土,我国便相应采取了一种措施:数据存储服务器可以部署到美国,但算法坚决不能够出口。④这意味着我国认为算法是一个企业的核心竞争力,是一种由数据驱动的能力,维持着当今企业基本的运作模式。在中国与美西方在互联网、赛博空间和元宇宙上的竞争中,算法、数据和算力成了重要的生产资料,在这种环境之下,算法治理、算法保护就显得格外重要。

二、算法治理现状

(一)国外算法治理现状

国外在算法治理和隐私数据保护方面起步较早,相关的法律法规以及行业的标准较为完善,给全球的算法治理和隐私数据保护制度的建设提供了引领与示范。美国已呼吁互联网公司调整算法,以根除虚假信息,此外美国还成立了大数据、伦理与社会理事会(BDES)用来支撑大数据引发的社会、伦理、法律和政策问题;欧盟已起草规则,威胁称“如果大型科技公司不采取更多措施处理非法内容,将处以十分严重的罚款”。欧盟也成立了欧洲数据保护专员公署(EDPS)用来监督确保欧洲机构和团体在处理个人数据和制定新政策时尊重隐私权和数据保护权。

亚利桑那州立大学(ASU)的法律学者团队在2021年进行了一项关于2016年至2019年间制定的634个算法法律项目的调查研究。研究表明:这些有关于算法治理的项目36%由政府发起,余下的项目由非营利或私营机构发起。亚利桑那州立大学的报告发现,这些算法治理项目在透明度、可解释性、道德、权力、安全和偏见等方面达成了广泛的共识。英国的艾伦·图灵研究所(Alan Turing Institute)将这些算法治理项目共有的原则归纳为四点:公平、问责、可持续性和透明度。国外算法治理不仅强调了以上四点原则,同时也强调了算法的先进性,这些值得国内部门和企业在算法治理中学习和借鉴。⑤

(二)国内算法治理现状

随着我国算法应用飞速发展,信息茧房、大数据“杀熟”等算法问题逐渐出现,我国也开始对算法治理日益重视。2021年8月,国家互联网信息办公室发布了《互联网信息服务算法推荐管理规定(征求意见稿)》,其中建议互联网公司不应该建立引诱用户花费大量资金的算法模型,并应该允许用户可以轻易选择关闭算法推荐服务。2021年9月,相关机构明确,将在大约三年之内制定算法治理规则,同时,也正在努力加强对互联网科技公司的个性化推荐、用户画像等算法的控制,中国网络空间管理局还表示,将成立专业评估团队,深入分析算法的机制让算法变得更加公平、更加透明,这并不是否定算法,而是要继续大力推动算法创新研究并努力提升中国算法的核心竞争力。⑥

中国信息通信研究院积极参与算法治理监管政策的制定、技术认证和测试,并将专注与创建测试数据算法的工具。虽然这项工作仍处于起步阶段,但其将为我国人工智能算法治理制度奠定基础,确保我国算法体系的健壮性、可靠性和可控性。我国科学技术部也公布了算法治理手段,将制定道德标准,依靠互联网公司和算法研究人员以自监督的方式将算法治理原则应用到算法开发的工作中。为了消除算法歧视、算法偏见,国家互联网信息办公室等多个部门于2022年3月联合发布了《互联网信息服务算法推荐管理规定》。⑦在此基础上,我国应当进一步明确相应的算法保护和数据出境的政策、法律和法规,这为我国“一带一路”“人类命运共同体”等全球性倡议和理念提供了安全保障,也为我国企业服务于社会、服务于全球的商业模式保驾护航。

三、算法可治需要对症下药

人类正在大踏步地进入数字经济时代,数字经济实际上包括了数字产业化、产业数字化(即实体经济数字化发展)和社会治理三个部分。特别需要强调的是,数字经济时代的社会治理特别依赖“计算”来有效提升治理能效。麦克卢汉提出了“媒介是人体的延伸”的理论,由此可以类推得出“计算重塑媒介的延伸”,计算驱动着传媒产业与社会变革,计算的核心要素是数据、算法和算力,数据是生产要素,算法是知识产权,算力是“新基建”。

鉴于算法在传媒领域和网络数字空间的重要性,必须要找到算法可治的路径。面对不同的算法,算法治理需要采用不同的切入点。具体来说,算法有三种系统理论,分别为:白箱理论、黑箱理论和灰箱理论。⑧白箱理论是指算法研究人员不仅知道算法的输入、输出关系,并且知道算法的结构与算法的构建过程,它相当于是一个白色透明外壳的箱子,能够随时被人类观察到箱子其中的内部结构,所以,如果我们能够理解算法的原理,那就可以利用白箱理论从源头介入,对算法进行评估。

黑箱理论是指算法研究人员仅仅能够得知算法的输入、输出内容,但并不清楚算法的结构、算法内部的运行逻辑,就如同一个外壳为黑色的箱子,研究人员只能够根据输入输出的特点来推断算法的系统规律。黑箱算法是有数据驱动的,所以我们要从结果入手来评估其对社会的影响。

灰箱理论是指算法内部规律只有部分能够被人理解,在建立和改善模型方面还有许多工作要做,就如同一个外壳为灰色的箱子。面对灰箱算法,在操作层面需要从审核介入,这就需要我们懂得算法。

四、算法善治需要政府、技术、企业的合力支持

算法需要可治,更要善治,算法善治重点在“善”,科技向善,重塑算法价值观。算法善治需要政府指导、完善相关法律法规进行督促,同时也需要全民参与网络文明的發展进程,以底线思维防范化解风险。算法在大数据、云计算和人工智能的推动下,已经成为数字基础设施的操作系统,成为信息社会的软件架构,并与人的数字化生存和社会的数据化运行同步演化。习近平总书记指出:“要增强紧迫感和使命感,推动关键核心技术自主创新不断实现突破,探索将人工智能运用在新闻采集、生产、分发、接收、反馈中,用主流价值导向驾驭‘算法,全面提高舆论引导能力。”⑨算法治理的内核应该是价值观,中层是技术架构,外层是应用场景。

算法善治还需要建立“政府—技术—企业”一体化治理体系。对于政府,需要针对不同类型算法,守正创新,倡导源头和结果的科学监管,备案追责,助推网络文化安全的算法效果标准和政策指南;对于技术,需要构建时间空间模型,实现自辨真假和无假自证,打击虚假信息,增强事实核查的技术能力,实现账号分类分级管理,强化运行主体责任;对于企业,需要承担问责算法的原则,明确且声明算法的社会影响,需要报告、解释、证明算法决策以及减轻任何可能的负面社会影响或潜在危害。

在算法治理中,治理的范围不仅要针对国内,还应该涉及国际传播,不仅要保护国内算法的知识产权,也需要助力保障我们国家的安全。在当前信息战、舆论战和认知战的大环境下,我们更应格外关心算法的相应治理和对知识产权的保护。对于中外联合企业、产品应用程序涉及境外用户的企业,不仅要遵守国内的法律,还需要遵守当地相关的法律法规,有关部门也需要对上述企业进行相应的帮助、核实核查和进行必要的审查,以避免国内企业对当地法律的忽视,防止算法问题对国内企业的伤害,同时还应该保护我国企业算法技术和产品的先进性,帮助有关企业发挥算法的先进性作用。

从“算法可治”到“算法善治”,既强调了算法的科学性,也体现了算法的艺术性,这样才能达到科学和艺术的和谐统一。

五、人类时空共同体是算法治理的成功尝试

在算法治理的过程中,时间和空间是两个重要的要素。以微博为例,2022年4月之前,用户在微博平台发布博文、评论时只能够显示时间信息,而没有位置信息。隨着俄乌冲突爆发,2022年4月后,微博、抖音、小红书等社交媒体网络陆续加入“IP归属地”功能,这体现了网络空间在网信部门指导下的进化能力。这些IP属地信息的发布不由发帖人自主控制,是算法系统基于一定尺度的位置信息随博文的发出自动显示,国内的用户将显示到省份,国外的用户显示到国家。这是一种有效的算法治理方式。

如果时间和空间成为条件要素共同附着在一个通用标签上,那么人类就可以打造一个无假自证或自辨真假的境界。从这个维度来看,今天我国所使用的健康码就是一个时空标签,只要用户登录就可以被时间和空间的标记,这是数字世界的自辨真假、无假自证。

同样,基于这样的技术理念,无论在中国的领空、世界的领空、还是未来空间,抑或是元宇宙,都可以本着“人类时空共同体”的价值观念实现算法治理。为此,我们需要进一步思考、完善、实现,建立相关算法操作系统,贡献中国智慧和中国方案。举例来说,我国的北斗导航具有时间和空间定位,基于北斗导航数据的任何信息都可以获得无假自证或自辨真假的可能性。

结语

算法可治很重要,算法善治更重要。我国要在技术上掌握主动权,最典型的案例就是健康码,同时拥有时间信息和空间信息,为我国的科学精准防控作出了贡献;还有一个例子是社交媒体平台陆续开放IP归属地自动显示功能,过去难以被识别的来自境外和境内的虚假信息现在可以不攻自破。当超越了国内的网络运营商,对于国际性网络来讲,我们提出了中国主张——“人类时空共同体”,地球上的任何一个人类都已通过卫星来全球授时、全球授位,全球都可以接收卫星信息,知道你是谁,知道你在哪。

算法可以助力国家定策设计,促进国家传播能力提升,推进网络文明的建设历程。在服务国家需求、解决实际问题、服务关键应用场景的环境下,对大数据人工智能、算法能力进行建设与优化,这也是在数字经济时代“算法善治”所作的探索。

沈浩系中国传媒大学媒体融合与传播国家重点实验室媒体大数据中心首席科学家

「注释」

①[美]桑斯坦:《信息乌托邦》(毕竞悦译),北京:法律出版社,2008年,第7页。

②桑德拉·沃切特、布伦特·米特尔斯塔德、克里斯·拉塞尔、陈宇超:《无需打开“黑箱”的反事实解释:自动化决策和<通用数据保护条例>》,《国外社会科学前沿》2022年第7期,第85-99页。

③《英航因泄露用户信息被罚近两亿英镑》,新华网,http://www.xinhuanet.com/ world/2019-07/08/c_1124726167.html,2019年7月8日。

④董浩宇:《国际传播中数字媒体的发展性初探——以抖音TikTok全球发展与美国禁令为例》,《国际公关》2021年第9期,第134-136页。

⑤Leslie, D.,”Understanding artificial intelligence ethics and safety: A guide for the responsible design and implementation of AI systems in the public sector”,The Alan Turing Institute,2019,pp.2

⑥温婧:《禁止“大数据杀熟”、诱导沉迷,网信办等四部门发布算法规范》,北京青年报客户端,https://m.gmw.cn/baijia/2022-01/04/1302748490.html,2022年1月4日。

⑦国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局:《互联网信息服务算法推荐管理规定》,中国网信网,http://www.cac.gov.cn/2022-01/04/c_1642894606364259.html,2022年1月4日。

⑧张滢:《“黑箱—灰箱—白箱”策略在商务谈判中的应用》,《经济论坛》2006年第23期,第85-87页。

⑨《习近平:加快推动媒体融合发展 构建全媒体传播格局》,中国政府网,http:// www.gov.cn/xinwen/2019-03/15/content_5374027.htm,2019年3月15日。

责编:霍瑶

猜你喜欢
数据安全人工智能
我校新增“人工智能”本科专业
云计算中基于用户隐私的数据安全保护方法
2019:人工智能
人工智能与就业
建立激励相容机制保护数据安全
数读人工智能
大数据云计算环境下的数据安全
下一幕,人工智能!
下一幕,人工智能!
云环境中数据安全去重研究进展