包康赟
(北京大学法学院,北京 100871)
数字时代,算法决策显而易见地影响着个体生活和社会发展。个人层面,淘宝呈现的商品(1)青峰.淘宝搜索算法技术的演进以及未来搜索的探寻[EB/OL].(2018-10-30)[2020-10-17].http://www.taodahu.com/p/5710822018/.、抖音推送的视频(2)段视频热门研究社.深度解读抖音算法机制[EB/OL].(2019-03-27)[2020-10-17].https://zhuanlan.zhihu.com/p/60605828.、小贷核准的额度(3)邵智宝.小额信贷技术的应用发展[J].中国金融,2018,(24):49.、新冠病毒的报告(4)林志吟,李娜.用算法“攻克”新型冠状病毒肺炎[EB/OL].(2020-02-05)[2020-10-17].https://www.yicai.com/news/100491526.html.,各类算法决策影响着日常生活。国家层面,中国(5)中华人民共和国科技部等.中国新一代人工智能发展报告2019[R].北京:中华人民共和国科技部,2019.、美国(6)The White House(Office of Science and Technology Policy),American Artificial Intelligence Initiative:Year One Annual Report,February 2019.、欧洲各国(7)European Commission,White Paper on Artificial Intelligence:A European Approach to Excellence and Trust,February,2020.纷纷将包括算法决策、机器学习在内的人工智能产业上升为影响国计民生、决定竞争实力的国家发展战略。
然而,现阶段算法决策的可靠程度与其普及范围和战略高度不相匹配。“信息茧房”(8)申楠.算法时代的信息茧房与信息公平[J].西安交通大学学报(社会科学版),2020,(2):139.“算法歧视”(9)章小杉.人工智能算法歧视的法律规制:欧美经验与中国路径[J].华东理工大学学报(社会科学版),2019,(6):63.“算法杀熟”(10)朱程程.大数据杀熟的违法性分析与法律规制探究——基于消费者权益保护视角的分析[J].南方金融,2020,(4):92.“算法失误”(11)Donie O’ Sullivan,Report:Fake News Content Went Viral Using YouTube’s Algorithm San Francisco-based Company Gathered and Analyzed the Data,The Mercury News 13 December 2019,https://www.mercurynews.com/2019/12/13/report-fake-news-content-went-viral-using-youtubes-algorithm/,17 October 2020 last visited.等现象层出不穷。随着算法替代人脑的程度变高、决策涉及的领域变多、结果关涉的利害变大,受算法决策影响的主体不断地抛出疑问:算法是如何为我决策的?我被算法公平合理地对待了吗?如何让算法得出更有利于我的决策?
上述问题的答案藏在“算法黑箱”中。因此,“认识”算法成为目标(12)Bryan Casey,Ashkon Farhangi and Roland Vogl,Rethinking Explainable Machines:The GDPR’s Right to Explanation Debate and the Rise of Algorithmic Audits in Enterprise,34 Berkeley Technology Law Journal 143,143-188(2019).值得注意,“认识算法”并不一定要打开“算法黑箱”,代表性观点参见Sandra Wachter,Brent Mittelstadt,Chris Russell,Counterfactual Explanations without Opening the Black Box:Automated Decisions and the GDPR,31 Harvard Journal of Law and Technology 841,841-887(2018).。经过半个多世纪的演进,算法“透明度”(transparency)(13)1970年美国平等信贷机会法(Equal Credit Opportunity Act)和公平信用报告法(Fair Credit Reporting Act)提出了要提高算法自动决策系统的“透明度”。、算法“进入权”(right of access)(14)1995年欧盟数据保护指令(Data Protection Directive)引入了算法“进入权”。、算法“解释权”(right to explanation)(15)2016年欧盟通用数据保护条例(General Data Protection Regulation)在序言中提出了算法“解释权”(right to explanation)的概念。等概念不断涌现。其核心都是要求说明和阐释算法的决策过程和结果,以此回答:算法决策的结果为何以及如何作出(16)Finale Doshi-Velez and Mason Kortz,Accountability of AI Under the Law:The Role of Explanation,Berkman Klein Center Working Group on Explanation and the Law,Berkman Klein Center for Internet and Society working paper,2017.。然而,由于技术、法律、商业利益等因素的影响,作为一种算法治理工具,算法解释的定位、限度、要件和实施细节尚不明确。这种模糊现状亟待改变,否则受损的不仅是个人权利、商业利益,还有社会创新的动力和数字经济的发展。
其实,算法解释与法律人较为熟悉的司法公开高度相似——两者都致力于用最低的成本,展现和说明以公平合理为终极追求的复杂决策之过程和结果,进而对决策的质效进行控制(包括规范、监督和问责等)。同时,两者都关系到公众对特定决策机制的认知和信任,并进一步影响经济和社会发展。法律是调整社会关系的规范性工具,其构造受到所要实现的目标、将要作用的对象、所处的环境、可能产生的影响等多方面因素的制约(17)苏力.法律理论——社会科学的视角(书稿,尚未出版)[M].2006.20-23.。当这些制约因素相似时,法律工具之间或可彼此启发。因此,在构建算法解释方案时,司法公开的经验可供借鉴。
本文第一部分将从规制方式、规制目标、规制对象、规制成本四方面论证算法解释与司法公开的可比性。第二部分将从权属特征和决策类型两方面展现两者的特殊性。基于上述结论,第三部分将从定位、限度、要件、实施四个维度具体剖析司法公开中积累的经验对于构建算法解释治理方案的启示,最终确立算法解释的若干基本原则。
司法公开和算法解释的规制方式几乎一致。两者都要求清楚“说明”(被称为“公开”或“解释”)特定决策(“司法裁判”或“算法决策”)的结果及其产生的过程、依据和理由,进而保障相关主体的“知情权”。
司法公开的核心要义是揭开人民法院司法活动的“神秘面纱”,把司法的过程和环节同其结果一起“晒”出来,让民众看得清楚和明白(18)蒋惠岭.以改革创新精神推进司法公开[J].中国党政干部论坛,2012,(8):6.。通过这种“公之于众”的方式,普通民众能够获知司法活动的信息,司法决策的质效也能得到规范和控制(19)沈定成,孙永军.司法公开的权源、基础及形式——基于知情权的视角[J].江西社会科学,2017,(2):207.。目前,中国已经建成了四大司法公开平台(分别用于审判流程公开、庭审视频公开、裁判文书公开和执行信息公开)(20)张俊,张娅子.周强:中国司法公开的广度和深度全面拓展[EB/OL].(2018-12-27)[2020-10-17].http://k.sina.com.cn/article_1784473157_6a5ce64502000z6h6.html?from=news&subch=onews.。
虽然展示司法过程和结果的动作被称为“公开”,但其本质是“解释”或“说明”。以裁判文书的公开为例,司法的结果(“判决结果”)仅是法官形成的“判决如下”之后的几行文字,由若干判项组成(21)以行政诉讼裁判文书为例,参见最高人民法院行政审判厅.行政诉讼文书样式[M].北京:人民法院出版社,2015.7.。然而,裁判文书公开的内容却不止于此。早在2001年,我国法院就要求裁判文书至少还应公开五个方面的内容:案件的基本信息(立案受理时间、开庭时间和次数、当事人及代理人情况、合议庭情况等)、当事人双方意见、举证质证情况、法官认证意见(对证据的判断和取舍原因)、法官说理论证(对法律的解读、解决纠纷的判断依据)。部分法院还要求附上相关法律条文(22)蒋惠岭,胡夏冰.我国司法透明机制的改革和完善[J].法律适用,2006,(3):3.。目前,文书公开的内容更全面、要求更细致(23)参见最高人民法院行政审判厅.行政诉讼文书样式[M].北京:人民法院出版社,2015.1-8.。在这种“公开”模式下,法官形成决策的素材依据、所思所想一应俱全——这无疑是对裁判结果的详尽解释。
算法解释的基本思路是解决算法决策的“黑箱效应”(24)张恩典.大数据时代的算法解释权:背景、逻辑与构造[J].法学论坛,2019,(7):152.,通过要求算法提供输入素材、输出结果、影响结果的主要因素等信息,说明和阐释算法决策结果的由来(provenance)(25)David Freeman Engstrom, Daniel E.Ho, Catherine M.Sharkey, Mariano-Florentino Cuellar, Government by Algorithm: Artificial Intelligence in Federal Administrative Agencies, February 2020, 75.,最终使算法决策的结果符合预设的期待。值得注意的是,解释算法决策需要提供的信息(即算法解释的内容)目前仍存在争议(后文将展开讨论)——即便是《通用数据保护条例》(GDPR)也没有正式确立所谓的“算法解释权”,更没有明确其内涵和外延(26)See Sandra Wachter,Brent Mittelstadt,Luciano Floridi,Why a Right to Explanation of Automated Decision-Making Does Not Exist in the General Data Protection Regulation,7 International Data Privacy Law 76,76-99(2017).。然而在具体场景下仍有一些可供参考的规则,比如2018年美国《公平信用报告法》(Fair Credit Reporting Act)。该法规定,在信用评分(credit scoring)时,评级机构需要提供五类信息:评分结果、评分算法模型中的分数范围、算法模型中影响最终评分结果的关键因素(不超过四项)、评分日期、评分基础文件的提供者(个人姓名或机构名称)等(27)15 U.S.C.§1681 g(f)(1)(2018),https://www.law.cornell.edu/uscode/text/15/1681g,17 October 2020 last visited.。
司法公开和算法解释的规制目标高度相似。两者都是为了监督决策主体、追究潜在责任、教育普通民众。
1.监督
司法公开的重要目标是监督法官工作和司法裁判过程(28)Anonymity,Making Chinese Court Filings Public? Some Not-So-Foreign American Insights,133 Harvard Law Review 1728,1728-1750(2020);蒋惠岭.以改革创新精神推进司法公开[J].中国党政干部论坛,2012,(8):6.。对于庭审公开,美国联邦上诉法院的法官弗兰克·M·柯芬(Frank Coffin)曾指出:庭审过程与审判结果一样值得重视(29)Frank M.Coffin,A Lexicon of Oral Advocacy,National Institute for Trial Advocacy,1984.14.。因为当庭审鲜活地为公众所见,法官的辛勤不言自明。同时,民众也会明白判决是法官和律师“较劲”的结果,而非暗箱操作所得,司法信任也因此提升(30)弗兰克·M·柯芬,傅郁林译.美国上诉程序——法庭·代理·裁判[M].北京:中国政法大学出版社,2005.98-99.。
算法解释的目标之一也是监督算法决策过程,增加公众信任。如果算法决策过程不公开、不提供公司解释,可能引致“算法暴政”。解决方案之一就是借助作为监督机制的算法解释(31)Bruno Lepri,Jacopo Staiano,David Sangokoya,Emmanuel Letouzé,Nuria Oliver,The Tyranny of Data? The Bright and Dark Sides of Data-Driven Decision-Making for Social Good,in Transparent Data Mining for Big and Small Data,Studies in Big Data Series,Springer,2016.15.。2018年,今日头条向公众解释了其推荐算法的基本原理、算法模型设计的维度和策略。谈及面向公众解释算法的初衷,相关负责人表示,希望借助算法解释让社会共同参与监督、积极建言。这就类似于法律实施过程中要透明公开以方便公众监督一样(32)李童.让算法公开透明:今日头条首次公布算法原理[EB/OL].(2018-01-11)[2020-10-17].http://www.xinhuanet.com/fortune/2018-01/11/c_129788682.htm.。算法解释的监督功能可见一斑。
2.问责
司法公开是后续问责的基础,由于前者提供了“证据”,使追责成为可能。举例来说,司法裁判文书在网上公开曝光了诸多裁判文书中的错误,触发了针对相关法官的问责程序(33)杨玉龙.“带病”判决书何以层出不穷[EB/OL].(2019-04-15)[2020-10-17].http://www.xinhuanet.com/comments/2019-04/15/c_1124365996.htm.。庭审网络直播也让很多法官的“不当言行”得以公开(如法官呵斥、辱骂律师等),使其受到应有的追责(34)孔令晗.庭审途中法官让律师滚出去?广州律协已介入调查[EB/OL].(2019-05-08)[2020-10-17].https://new.qq.com/omn/20190508/20190508A0CXPF.html;匿名.广东女法官庭审中3次打断律师发言,并呵斥律师没水平[EB/OL].(2019-05-09)[2020-10-17].http://gd.sina.com.cn/news/2019-05-09/detail-ihvhiews0708139.shtml.。
算法解释同样也承担着提供证据、厘定责任的功能,最终确保算法决策的可责性(accountability)(35)European Parliamentary Research Service(EU),A Governance Framework for Algorithmic Accountability and Transparency,March 2019.。只有让算法决策的相对人了解与其相关的决策是如何做出的,才能在必要的情形下寻求救济(36)张凌寒.商业自动化决策的算法解释权研究[J].法律科学,2018,(3):65.。而且,如何解释算法的决策过程,会影响相关的主体的责任承担情况。比如,在信息检索的算法决策中,提供搜索结果的主体是否为“不受控制的”算法本身,可能决定了谷歌等科技公司是否要承担搜索结果导致的侵权责任(37)Seema Ghatnekar,Injury by Algorithm,33 Loyola of Los Angeles Entertainment Law Review 171,171-204(2012).。在反垄断领域,算法决策过程的解释路径直接影响了潜在算法共谋行为的类型。不同的共谋行为则会引致不同的问责可能性和责任承担方式(38)Ariel Ezrachi & Maurice E.Stucke,The Promise and Perils of Algorithm-Driven Economy,Harvard University Press,2016.218-232.。比如,被认定为“信使类共谋”的算法可以按照传统法律追究违法责任。然而,被认定为“自主类共谋”的算法则难以依法追责(39)李振利.论算法共谋的反垄断规制路径[J].学术交流,2018,(7):73.。
3.教育
司法公开是普及法治教育的手段。公开的裁判文书被认为是社会各界的法律教育材料(40)蒋惠岭.以改革创新精神推进司法公开[J].中国党政干部论坛,2012,(8):6.,而庭审网络直播则被视为最生动的法治课堂(41)支振锋.人民法院庭审公开第三方评估报告[R].北京:中国社会科学院法学研究所,2017;孙献涛.庭审直播也是法治公开课[EB/OL].(2016-07-13)[2020-10-17].http://opinion.people.com.cn/n1/2016/0713/c1003-28550357.html.。以这种方式进行法治教育,不但能够培养民众对司法活动的熟悉感和信任感,还能有助于增强公众的权利意识,促使其敢于并善于借助司法渠道维护权益。
算法解释也承载着普及算法常识,引导数字时代的公民了解算法特性、接纳算法功能、警惕算法风险的功能和期待。事实证明,缺乏“算法素养”(algorithm literacy)不但会造成个体在与算法互动过程(包括使用算法服务、防止算法侵权等)中的被动局面,还不利于民众参与算法相关的公共政策讨论(42)European Parliamentary Research Service(EU),A Governance Framework for Algorithmic Accountability and Transparency,March 2019.69.。通过解释算法运作逻辑、展示算法决策过程,可以增进大众的算法知识、提升其算法素养。目前,向社会解释算法逻辑的今日头条、淘宝、抖音等APP客观上都体现了上述功能。
司法公开的公开对象(司法裁判)和算法解释的解释对象(算法决策)在各个关键方面都存在共性。两者都在既定的规则和可及的信息下完成决策任务,都以公平正义为追求却又面临恣意、歧视等障碍。它们的决策结果都会影响个体利益、社会福利和经济发展。
1.过程与终点
在司法裁判过程中,法官“以事实为依据、以法律为准绳”作出裁决(43)吴旭阳.从演化博弈看“司法裁判”的本质和完善——行为策略实验的视角[J].自然辩证法通讯,2017,(2):117.。在算法决策过程中,算法根据收集的数据信息、按照技术人员预设的流程,最终作出决策(44)European Parliamentary Research Service(EU),Understanding Algorithmic Decision-making:Opportunities and Challenges,March 2019.5.。可以发现,法官手中的“事实”和算法掌握的“数据”、法官遵守的“法律”(包括程序和实体规则)和算法遵循的“流程”,都构成决策素材和约束,最终主导法官和算法给出的决策结果。而且不管是司法裁判,还是算法决策,两者均涉及社会生活的方方面面。
此外,司法裁判和算法决策都可能存在人类和算法“相互配合”的情形。在司法裁判的过程中,算法可能成为依据。比如,算法程序得出的科学实验模拟结果(如子弹飞行轨迹)会成为法官决策的依据之一(45)栗峥.人工智能与事实认定[J].法学研究,2020,(1):117.。在算法决策的过程中,当然也存在人类的角色。比如,证券算法交易过程中,虽然算法模型会自动发出指令完成证券买卖和资产组合管理。但是,分析师和交易员会适时监督、人为干预(46)夏中宝.算法交易对虚假申报操纵法律认定逻辑的新挑战[J].证券市场导报,2017,(10):61.,共同决定决策结果。
2.追求与障碍
司法裁判的最终目标是公平合理,其障碍在于法官的枉法裁判、恣意裁量(47)齐伟.司法裁判的“两张面孔”——以社会治理为分析背景[J].理论导刊,2016,(9):99.。司法实践中的“同案不同判”和“冤假错案”,本质上是法官违背了公平原则和合理原则。其实,法官裁判时的非理性甚至犯错误,很多时候并非故意为之,而是受制于人类认知系统的弱点(48)丹尼尔·卡尼曼,胡晓娇,等.译.思考,快与慢[M].北京:中信出版社,2012.87.。一系列关于法官行为的实验研究发现,法官受到法律无关因素影响并作出歧视性判决的现象比比皆是(49)Zhuang Liu,Does Reason Writing Reduce Decision Bias? Experimental Evidence from Judges in China, Journal of Legal Studies,2018,47(1):83-118.。因此,要求法官公开裁判文书、接受监督和问责,成为遏制司法偏见的手段之一(50)贺小荣,刘树德,杨建文.《关于人民法院在互联网公布裁判文书的规定》的理解与适用[J].人民司法,2014,(1):23.。
算法决策的终极追求也是公平合理(fairness)(51)Aziz Huq,Sam Corbett-Davies,Emma Pierson,Avi Feller and Sharad Goel,Algorithmic Decision Making and the Cost of Fairness,1 Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining 797,797-805(2017).。现实中算法暴露的诸多问题都是因为决策不公平或不合理。比如,算法对女性和黑人存在偏见(即算法歧视)、算法针对不同人群区分定价(即算法杀熟)、算法错误地匹配像素以至于人脸识别失败(即算法失误)等。算法决策无法做到完全公平合理的障碍主要来源于有偏见的价值观、偏颇的训练数据、偏误的数据输入,以及算法系统不适当的执行机制(52)European Parliamentary Research Service(EU),A Governance Framework for Algorithmic Accountability and Transparency,March 2019,p.20.。由于算法的设计、训练和运转,包括用以决策的基础数据都源自人脑,因此算法歧视和犯错本质上要追溯到人类社会(53)Mayson,Sandra Gabriel,Bias In,Bias Out,128 Yale Law Journal 2218,2218-2300(2019).。可见,算法决策不但和司法裁判的终极目标一致,而且阻碍目标实现的障碍也是同源的。
3.利害与意义
司法裁判的作用是定分止争、分配利益。裁判结果因此会影响当事人的权利和义务,还会影响相同情况下公众的行为和后案法官的判断(尤其在普通法的语境下)(54)吴旭阳.从演化博弈看“司法裁判”的本质和完善——行为策略实验的视角[J].自然辩证法通讯,2017,(2):117.。与此同时,大量理论和实证研究证明,司法裁判对经济发展意义深远。司法裁判作用机制有很多。比如,司法地方保护主义引发的审判不公会导致企业减少创新研发的投入,进而抑制企业长期发展(55)潘越,潘健平,戴亦一.公司诉讼风险、司法地方保护主义与企业创新[J].经济研究,2015,(3):131.;带有保护主义色彩的司法裁判人为地设置壁垒、分割市场,最终导致投资环境和市场经济恶化等(56)陈刚,李树.司法独立与市场分割——以法官异地交流为实验的研究[J].经济研究,2013,(9):30.。
算法决策的结果同样会影响个人权益和社会福利。比如,很多国家已经运用算法决策预测罪犯的人身危险和再犯风险,以此决定他们是否可以获得保释、缓刑等(57)Aziz Huq,Sam Corbett-Davies,Emma Pierson,Avi Feller and Sharad Goel,Algorithmic Decision Making and the Cost of Fairness,1 Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining 797,797-805(2017).。可以想见,这些算法决策结果直接关系到个体的自由和社会的安定(58)The Law Society,Algorithms in the Criminal Justice System,June 2019.46.。此外,算法决策对于数字经济的影响不言而喻。数据和算法是数字经济的驱动器(59)Bruno Lepri,Jacopo Staiano,David Sangokoya,Emmanuel Letouzé,Nuria Oliver,The Tyranny of Data? The Bright and Dark Sides of Data-Driven Decision-Making for Social Good,in Transparent Data Mining for Big and Small Data,Studies in Big Data Series,Springer,2016.2.,算法决策的发达程度直接关系到社会运转的效率、行业创新的规模以及数字经济的活力(60)McKinsey Global Institute,The Age of Analytics:Competing in A Data-Driven World,December 2016.8.。
司法公开和算法解释作为治理手段,都会带来一定的规制成本,而且都体现为减损决策过程的效率和牺牲决策结果的质量两个方面。
1.决策效率
司法公开必不可避免地为司法系统带来额外的工作负担(61)Anonymity,Making Chinese Court Filings Public? Some Not-So-Foreign American Insights,133 Harvard Law Review 1728,1728-1750(2020).。比如,为了完成裁判文书的公开任务,就需要安排法官或书记员统一格式、审查校对、编号排序、按时上传、匿名处理等。法院还需要设置专门的部门、安排专职人员负责司法公开工作(62)Anonymity,Making Chinese Court Filings Public? Some Not-So-Foreign American Insights,133 Harvard Law Review 1728,1728-1750(2020).。这些工作负担的增加最终会牺牲法官个体以及整个司法系统的裁判效率。在美国,司法公开是一项收费服务(63)Electronic Court Records Reform Act of 2019,H.R.1164,116th Cong.§3(2019).,其背后人、财、物的成本投入不言而喻。目前,我国法院正在积极借助科技手段以减少法官在司法公开方面的负担,提升司法效率(64)刘艳红.大数据时代审判体系和审判能力现代化的理论基础与实践展开[J].安徽大学学报(哲学社会科学版),2019,(3):96.。显然,这是最小化司法公开成本的努力。
同样,要求算法提供解释会为算法决策带来额外负担。从计算科学的视角看,算法并不会自动存储决策的过程信息(与人类不同,算法天生没有记忆)。而且这一点被认为是算法决策相比于人类决策的优势——及时删除存储的冗余数据以确保高效运行,同时,还能保护隐私信息、减少无关因素干扰决策。于是,若要算法给出事后决策解释(ex post explanation),必须明确地提前部署(65)Finale Doshi-Velez and Mason Kortz,Accountability of AI Under the Law:The Role of Explanation,Berkman Klein Center Working Group on Explanation and the Law,Berkman Klein Center for Internet and Society working paper,2017.10.。这就需要在算法设计时额外付出更多的人力和财力。而且,在算法决策过程中同时运行提供事后解释的程序会侵占大量算力,最终减损算法决策效率。
2.决策质量
司法公开可能会阻碍优秀判决的产生(66)Frederick Schauer,The Mixed Blessings of Financial Transparency,31 Yale Journal on Regulation 809,809,821-822(2014).。由于受到公开的压力,法官倾向于在作出判断时“随大流”或者采纳更容易为公众接受的安全立场(67)Anonymity,Making Chinese Court Filings Public? Some Not-So-Foreign American Insights,133 Harvard Law Review 1728,1728-1750(2020).。长此以往,法官在潜在的舆论影响下,无法自由并忠于内心确信地发表意见,最终影响裁判质量。
相比之下,算法是没有感情的决策机器,其自然不会受到舆论的影响。但是在算法解释的要求下,算法决策的质量会通过其他路径受到减损。如果法律对算法决策提出了更高的解释标准,为了使算法决策可解释,相关公司和机构可能会简化算法模型设计、减少机器学习的数据标签等,最终导致算法的分析能力下降,得出不当(undue)甚至错误的算法决策结果(68)Jason L.Anastasopoulos and Andrew B.Whitford,Machine Learning for Public Administration Research,with Application to Organizational Reputation,29 Journal of Public Administration Research and Theory 491,491-506(2019).。
综上所述,算法解释与司法公开在规制方式、规制目标、规制对象和规制成本这四个关键方面都高度相似(见图1)。这为司法公开向算法解释借鉴经验奠定了基础。
图1 算法解释与司法公开的共性汇总
司法公开与算法解释的内容在所有权归属方面大相径庭。前者被普遍认为是“公共资源”,而后者则很可能属于“私人财产”。因此,司法公开往往力度更大、要求更高。
司法公开的内容很早就被认为属于公共资源。美国法院向社会公开司法记录(judicial records)的历史可以追溯到建国初期(69)Nixon v.Warner Commc’ns,Inc.,435 U.S.589,597(1978); Arthur R.Miller,Confidentiality,Protective Orders,and Public Access to the Courts,105 Harvard Law Review 427,427-429(1991).。司法公开的正当性来自“信息披露理论(information-revealing argument)”(70)Anonymity,Making Chinese Court Filings Public? Some Not-So-Foreign American Insights,133 Harvard Law Review 1728,1728-1750(2020).。简单来说,司法活动信息为公众所关切。即便诉讼涉及私人主体,但由于触发了公权力机构的干预、动用了公共资源(public resources)(71)Cf.Doe v.Vill.of Deerfield,819 F.3d 372,376-77(7th Cir.2016).,这些信息也就具备了公共属性,成为了公众之事(public matter)(72)Cf.BP Expl.& Prod.,Inc.v.Claimant,920 F.3d 209,212(5th Cir.2019).。我国开始在网上公开裁判文书时,最高人民法院也表示“当事人之间的纠纷一旦进入诉讼程序就动用了国家司法资源,私人诉讼就转变为公权力运行的组成部分,纠纷的处理情况也成为一种司法产品和公共资源。”(73)张先明.积极回应社会关切 主动接受社会监督——最高人民法院审判管理办公室负责人就裁判文书上网答记者问[EB/OL].(2013-07-03)[2020-10-17].https://www.chinacourt.org/article/detail/2013/07/id/1020571.shtml.因此,司法公开是由司法过程信息的社会特性决定的,而这也意味着要求更大的公开力度。
与之相对,算法解释的内容(如算法程序的源代码、训练数据等)在很大程度上属于私人财产甚至商业秘密(74)Jack M.Balkin,Free Speech in the Algorithmic Society:Big Data,Private Governance,and New School Speech Regulation,51 U.C.Davis Law Review 1149,1149-1210(2018).。在商业领域,算法是科技公司、互联网企业投入大量成本研制而出的智慧成果,也是其获得市场优势、赚取商业利益的工具(75)林洹民.自动决策算法的法律规制:以数据活动顾问为核心的二元监管路径[J].法律科学(西北政法大学学报),2019,(3):43.。这就使得这些算法决策信息与“公共资源”相去甚远,也无法直接借用“信息披露理论”作为公开的正当性基础。上述观点得到了法院的认可。比如,在2008年的Viacom v.You Tube案中,当原告要求披露You Tube网站搜索工具的计算机源代码时,法官以保护商业秘密为由驳回了请求(76)Viacom Int’l,Inc.v.YouTube,Inc.,No.1:07-cv-02103-LLS,2008 U.S.Dist.LEXIS50614(S.D.N.Y.Jul.2,2008).。
值得注意,即便应用于公共领域,算法决策的过程信息也并非当然可以公开的“公共资源”。斯坦福大学在2019年的一项调查显示,在联邦政府各部门的算法决策工具中,只有53%是内部科技部门研发的,还有一半来自外包资源(与外部科技公司签订合同,委托研发或使用其核心技术)(external source)(77)David Freeman Engstrom,Daniel E.Ho,Catherine M.Sharkey,Mariano-Florentino Cuellar,Government by Algorithm:Artificial Intelligence in Federal Administrative Agencies,February 2020.18.。事实上,在2016年的State v.Loomis案中,法官就将国家司法部门用以辅助量刑的算法决策程序视为商业秘密进行保护(78)State v.Loomis,881 N.W.2d 749(Wis.2016).。
其实,相比于公共部门,科技公司在算法研发的过程中不受雇佣和预算限制,而且在商业利益的驱动下更倾向于优化技术、追求创新。因此,在现有的算法决策工具中,越是精细度和技术水平高的算法,越是为私人公司所有(尤其是“巨型私人公司”)(79)David Freeman Engstrom,Daniel E.Ho,Catherine M.Sharkey,Mariano-Florentino Cuellar,Government by Algorithm:Artificial Intelligence in Federal Administrative Agencies,February 2020.89.。而这些“高精尖”的算法往往在决策过程更复杂、对社会福利影响更大,因而更需要被解释。但是有了“私产”的标签,上述算法作出决策的过程信息存在解释的正当性和利益冲突问题,在公开力度上可能会大打折扣。
虽然司法公开和算法解释涉及的领域都包罗万象,但两者需要说明和阐释的决策过程具有不同的类型。所谓“决策类型”,即决策的任务种类、正式程度和自主程度。
司法裁判主要包括司法判决和司法裁定,两者都属于法官主导的正式决策。即便是诸如确认调解协议等司法裁定行为,也是需要法官全程参与、实质审查。而且作出的裁决具有法律效力,会对当事人的权利义务作出分配(80)胡军辉,赵毅宇.论司法确认裁定的既判力范围与程序保障[J].湘潭大学学报(哲学社会科学版),2018,(4):36.。相比之下,不同算法决策的类型差异很大,这又进一步决定了决策结果对个体和社会福利的影响。举例而言,“抖音算法”对于用户即将看到的下一个视频的决策与“量刑算法”对罪犯应被判处服刑年限的决策相比,两者的正式程度不同、影响迥异。
在公共服务领域,以算法决策最为活跃的美国为例,其联邦政府部署的算法决策工具非常多元。截至2019年,142个最主要的美国联邦政府部门(超过400个正式雇员)中有64个机构常态化地使用算法决策,共包括157种应用。其中,司法项目办公室(Office of Justice Programs)、证券交易委员会(Securities and Exchange Commission)、食药监局(Food and Drug Administration)等机构最多运用算法。涉及的政策领域包括法律执行、健康、金融监管、商业、环境等。执行的具体任务包括收集、筛选、分析政策以服务于政策制定;搜集和追踪违法违规行为;以工商监管为目的与公众互动交流(如聊天机器人);雇佣管理和采购决策;在特定领域作出行政裁决等。
就算法决策的任务种类而言,包括分类(classification)、回归(regression)、结构化预测(structured prediction)、聚类(clustering)和机器人感知与控制(robotics)。不同的任务种类意味着不同的算法决策难度。就正式程度而言,包括正式(formal)决策、非正式(informal)决策以及其他决策(81)美国行政执法部门的行政裁决(adjudication)包括正式裁决和非正式裁决。正式裁决受到联邦行政程序法监管,一般由行政法法官来主持;非正式裁决在联邦行政程序法中没有具体程序规定,并主要由非行政法法官来操作。后者的比重更大。See 5 U.S.C.§ 554(2018).在本文中,如果算法代替行政法法官作出正式裁决,则称为“正式决策”;如果算法作出非正式裁决,则为“非正式决策”。如果算法作出不涉及行政裁决的一般决策,则为“其他决策”。文章以此分类,主要为了体现算法决策的正式程度。。不同的正式程度决定了决策的潜在影响。就算法自主程度而言,包括监督式学习(supervised learning)及决策和无监督学习及决策(82)David Freeman Engstrom,Daniel E.Ho,Catherine M.Sharkey,Mariano-Florentino Cuellar,Government by Algorithm:Artificial Intelligence in Federal Administrative Agencies,February 2020.15-20.。不同的自主程度,决定了人工干预的程度和算法出错的几率。由此可见,不同于司法决策的正式严肃和高度自主,算法决策的具体类型丰富多元。
综上所述,算法解释及司法公开在权属特征和决策类型两个方面存在差异(见图2)。这是算法解释在汲取司法公开经验时需有所变通的指引和方向。
图2 算法解释及司法公开的特性汇总
作为规制手段,司法公开与算法解释在方式、目标、对象、成本等关键维度相互对应,在内容权属和决策类型上略有差异。两者的共性奠定了借鉴的基础,彼此的特性指引着变通的方向。从两者的共性来看,作为法律工具的司法公开和算法解释在机理、功能、关注、约束等方面都非常类似。这是前者为后者提供启发的重要前提。从两者的特性来看,司法裁判作为“公产”,面临着更高的信息公开要求。同时,司法决策通常有着比算法决策更正式和自主的决策场景,这也意味着更强的规制必要。这些特点都决定了司法公开的标准、要求和难度一般应大于等于算法解释。即便面对这些挑战,中国的司法公开仍走在世界前列(公开力度远超美欧)(83)Anonymity,Making Chinese Court Filings Public? Some Not-So-Foreign American Insights,133 Harvard Law Review 1728,1728-1750(2020).,其宝贵经验可供算法解释借鉴。基于“类比出真知”和“举重以明轻”的理念,下文将结合司法公开与算法解释的共性和特性,从定位、限度、要件、实施四个层面,为算法解释确立“谦抑原则”“保留原则”“细分原则”和“比例原则”。
随着我国算法治理相关的立法活动逐步开展,算法解释的定位亟待澄清,因为它决定了这一算法治理工具的预期功能和具体构造。然而,国内法学界对于这个问题意见不一,分为“激进派”和“保守派”。前者认为算法解释“神通广大”,绝大部分算法决策导致的问题都可以通过它解决。于是,呼吁算法解释、强制算法解释的声音层出不穷(84)此派观点如解正山.算法决策规制——以算法“解释权”为中心[J].现代法学,2020,(1):179; 张恩典.大数据时代的算法解释权:背景、逻辑与构造[J].法学论坛,2019,(4):152.。后者则认为算法解释并不重要,应处于“非普适性”和“辅助性”的位置(85)此派观点如沈伟伟.算法透明原则的迷思——算法规制理论的批判[J].环球法律评论,2019,(6):20; 陈景辉.算法的法律性质:言论、商业秘密还是正当程序?[J].比较法研究,2020,(2):120.。参照司法公开的现实地位,算法解释应遵循“谦抑原则”,即承认其具有相当的重要性,但不宜过分夸大其功能。
若为司法公开的地位和作用“画像”(见表1)(86)这一理论框架参见罗伯特·C.埃里克森,苏力译.无需法律的秩序[M].北京:中国政法大学出版社,2003.9.,它在规制层级上属于“国家立法”(与“组织规则、社会规范、合同规范、自我规范”相对),在规制类型上主要属于“规则”(与“原则”相对),在规制阶段上包括“事中(庭审网络直播)”和“事后(裁判文书公开)”(与“事前”相对),在规制目标上包括监督、问责、教育(不包括实现司法裁判公平合理的其他目标,如培训法官)。
表1 司法公开的定位“画像”
从“画像”的“留白”部分可知,司法公开有诸多力所不逮之处,在定位上保持着“谦抑”特性。具体来说,对于司法公开意图实现的目标,其他规制工具也在发挥作用。比如,通过司法公开监督法官以外,法官的自我监督(“自我规范”的规制层级)、法院领导及上级法院的监督(“组织规则”的规制层级)也作用巨大(87)崔永东.关于司法机关内部监督问题的探索与思考[J].北京联合大学学报(人文社会科学版),2015,(3):61.。对于司法公开无法涵盖的部分,其他工具则各司其职。比如,员额制法官的遴选从事前确保了决策主体的素质,最终将促进司法裁判质效的提升(88)包献荣.我国员额法官退出机制的构建与完善[J].法律适用,2019,(9):120.。由此可见,司法公开与其他规制工具相互依存、相辅相成,体现着作为规制工具的“谦抑性”。
考虑到算法解释与司法公开的共性,以及两者在权属特征上的“公私之分”、决策类型上的“高下之分”,为算法解释定位时,更应当遵循“谦抑原则”——以算法决策公平合理为追求,算法解释应和其他治理工具相互依存,共同发挥作用。一方面,算法解释可以实现的规制目标(监督、问责、教育)决定了它的价值和意义不容忽视。另一方面,对于上述规制目标,算法解释不应成为唯一手段;对于算法决策的终极追求(算法决策公平合理),算法解释也仅是其中一环。总之,应对其存有合理期待,积极发展相互依存或可以替代的更优治理方案。
以算法解释的“问责”目标为例,算法问责是否必须以算法解释为前提?答案是否定的。在严格责任的语境下,只要证明算法侵权的结果即可启动问责,无须考虑算法决策的过程。有学者指出,基于算法的实施效果,对算法进行事后问责可能是可行性更高、成本更低的做法(89)沈伟伟.算法透明原则的迷思——算法规制理论的批判[J].环球法律评论,2019,(6):20.。再看确保算法决策公平合理这一终极愿景,仅有算法解释是否足够?答案也是否定的。比如,算法解释是解释既有的算法决策过程,为了确保算法决策的质量,“赢在起点”的做法是在算法设计和训练时就进行“前期检查”,降低其未来犯错的风险。据此,德国设立了数据保护顾问(90)林洹民.自动决策算法的法律规制:以数据活动顾问为核心的二元监管路径[J].法律科学(西北政法大学学报),2019,(3):43.。可见,算法决策的治理还应重视和发展事前规制手段。“法律不是目的,而是手段。秩序才是目的”(91)罗伯特·C.埃里克森,苏力译.无需法律的秩序[M].北京:中国政法大学出版社,2003.3.。对于算法治理这样技术性强、专业化高的领域,法律人应保持谦抑——对技术心存敬畏,不但要避免被特定规制手段“一叶障目”,也要警惕滥用“法律工具”(92)Lilian Edwards and Michael Veale,Slave to the Algorithm:Why a Right to an Explanation Is Probably Not the Remedy You Are Looking for,16 Duke Law and Technology Review 18,18-84(2017).,防止造就一个“法律更多,但秩序更少”的世界。
总之,算法解释虽然重要,但其并非算法决策终极追求的充分条件(算法解释并不足以确保追求能够达成),也不能当作算法解释规制目标的必要条件(规制目标的实现并不一定需要算法解释)。因此,比照司法公开的地位,算法解释的定位应符合“谦抑原则”——仅仅作为可相互替代的算法治理工具之一。在这种定位下,各学科应积极发展其他可供选择的算法治理手段,共同促成算法决策公平合理的终极目标。
国内学者对于算法解释的限度也存在争议。有学者基于算法的专业性和复杂性,提出应当降低算法解释的限度(93)徐凤.人工智能算法黑箱的法律规制——以智能投顾为例展开[J].东方法学,2019,(6):78.。另有学者认为算法解释会侵犯知识产权和商业秘密,不利于算法创新和科技发展,因此也要求降低解释限度(94)孙庆春,贾焕银.算法治理与治理算法[J].重庆大学学报(社会科学版),2019,(12):1.。然而,站在算法决策受众的角度,部分学者以“算法透明”为标准,要求提高算法解释限度(95)程莹.元规制模式下的数据保护与算法规制——以欧盟《通用数据保护条例》为研究样本[J].法律科学(西北政法大学学报),2019,(4):48.。其实,参照司法公开的尺度,算法解释的限度应当有所保留,而且保留的原因和程度至少应与司法公开保持一致。
中国的司法公开水平世界领先,然而远没有做到完全公开,而是遵循了“保留原则”(96)Benjamin L.Liebman et al.,Mass Digitization of Chinese Court Decisions:How to Use Text as Data in the Field of Chinese Law(21st Century China Ctr.,Research Paper No.2017-01; Columbia Pub.Law,Research Paper No.14-551,2017).。总体来看,中国法院一般基于三类原因在一系列与司法裁决紧密相关的事项上有所保留。第一,因缺乏可能性而不公开。主要针对司法裁判中的“混沌过程”。比如,法官的自由心证被认为是一种“生物算法”的黑箱。公开阐释此类心智活动困难重重(97)周慕涵.证明力评判方式新论——基于算法的视角[J].法律科学(西北政法大学学报),2020,(1):46; 杜文静.证据证明力评价的似然率模型[J].华东政法大学学报,2017,(1):149.。第二,因缺乏合理性而不公开。主要针对司法公开中的“利益冲突”。常见的比如司法公开与商业秘密、个人隐私的冲突。还比如,为了防止司法公开与社会稳定等利益相冲突,法院一般不公开合议庭中的少数人意见(98)冯文生.论公开合议庭少数人意见[J].法律适用,2002,(12):29.和审委会的讨论过程(99)邵六益.审委会与合议庭:司法判决中的隐匿对话[J].中外法学,2019,(3):713.。第三,因缺乏必要性而不公开。主要针对司法公开中的“冗余投入”。比如,法官一般不会在裁判说理中详细解释诸如“不当得利”和“无因管理”等法学专业术语的内涵和外延。
作为与司法公开高度类似的决策规制工具,算法解释的限度应遵循司法公开的“保留原则”,将缺乏可能性、合理性、必要性确定为豁免算法解释的三项基本理由。而且,由于算法决策往往比司法裁判的正式程度更低、自主性更弱、权属上的公共色彩也没那么浓厚,算法解释的限度原则上不应超过司法公开的限度。下面具体从三项理由梳理原则上应予保留的算法解释事项。可以发现,这些事项与司法公开的保留事项一一对应(见表2)。
表2 司法公开和算法解释的保留事项对比
第一,缺乏解释可能性的“混沌过程”。类似于无法阐明的法官自由心证,被称为“算法黑箱”的算法决策过程(包括机器学习阶段)也是典型的“混沌过程”。考察计算科学领域的现状可知,提高算法可解释性仍是技术人员面临的重大难题——现在问题并不是算法设计者“愿不愿意解释”,而是他们“有没有能力解释”(100)张永锋.个性化推荐的可解释性研究[D].清华大学计算机科学与技术专业博士论文,2016.16; 全文君.数据挖掘过程中的可解释性问题研究[D].重庆大学计算机科学与技术专业博士论文,2018.12-13.。以算法决策的“人工神经网络”算法为例(见图3)。它是一种模仿动物神经网络行为的算法模型。在结构上,圆圈类似于人类的神经元,直线类似于神经元之间的连结。层与层之间的节点相互连接,每层之间的节点则互不相通。这种算法模型在“隐藏层”通过调整内部大量节点之间的关系,达到处理信息的目的。即便是算法设计者,也难以解释决策过程的来龙去脉。因此,如果“算法黑箱”本就无法打开,算法解释自然就没有可能性。
图3 “人工神经网络算法”模拟图
第二,缺乏解释合理性的“利益冲突”。法院为了社会稳定等因素通常不会公开审委会的讨论过程,于是“难办案件”的司法决策过程在价值权衡后,成为了合议庭和审委会间的“隐匿对话”(101)邵六益.审委会与合议庭:司法判决中的隐匿对话[J].中外法学,2019,(3):713.。与此类似,在算法决策过程中,很多内容本是可以解释的,但因为在价值冲突和权衡时处于“下风”而不应予以解释。常见的比如算法解释与商业秘密、个人隐私之间的冲突。此外,与算法解释冲突的利益还包括最广泛的社会福利。具体来说,高标准的算法解释可能带来“反向机器学习和博弈”(adversarial machine learning and gaming)的隐患(102)Daniel Lowd and Christopher Meek,Adversarial Learning.In Proceedings of the Eleventh ACM SIGKDD International Conference on Knowledge Discovery in Data Mining(KDD’ 05),Association for Computing Machinery,New York,NY,USA,641-647(2005).。受到算法决策影响的群体可以通过算法解释,剖析算法决策的特点,进而投其所好地输入信息,最终使算法得出有利于自己的决策结果。在极端的情况下,他们还可能侵入算法决策过程,提供新的训练数据影响决策模型(103)See Jane R.Bambauer & Tal Zarsky,The Algorithm Game,94 Notre Dame Law Review 1,1-48(2018).。在这种情况下,算法决策过程的解释限度应该降低。其原理与法院不应公开庭审直播可能传授和传播犯罪方法案件的原理相似(104)如北京市高级人民法院.关于进一步推进和规范庭审直播工作的通知,2018.。可见,如果与算法解释相冲突的价值或利益占据上风,算法解释便不再有合理性。
第三,缺乏解释必要性的“冗余投入”。在有限司法资源的约束下,司法系统会以降低公开限度的方式避免冗余工作,以提升司法效率。比如,法官并不会在裁判文书中详细阐释基本的法律术语。类似的,算法解释也不必将专业术语、编程语言甚至数学原理事无巨细地讲解给算法解释的对象(105)解正山.算法决策规制——以算法“解释权”为中心[J].现代法学,2020,(1):179.。在多数情况下,也应尽量避免算法的使用者因无法满足高标准的算法解释要求而被迫弃用算法决策工具。因为弃用算法决策意味着更多人力资源的冗余投入(106)Finale Doshi-Velez and Mason Kortz,Accountability of AI Under the Law:The Role of Explanation,Berkman Klein Center Working Group on Explanation and the Law,Berkman Klein Center for Internet and Society working paper,2017.。总之,算法解释不应以过度牺牲算法效率为代价——在成本收益分析下,算法解释的投入过大,就失去了其必要性。
司法公开要在秉持“保留原则”的前提下完成公开任务,就必须辅以“细分原则”。司法活动及司法决策的内容并非“铁板一块”,而是可供分割的有机整体。具体来说,司法公开本身就包括公开的内容、公开的时机和公开的对象等若干方面,每一个方面又可以细分为多个要素。比如,在庭审网络直播的场景下,可以以庭审的阶段为标准,分解为核对当事人身份信息、当事人陈述、举证质证、法庭辩论、法庭调解、法庭宣判等。又比如,公开的时机包括事中公开(如庭审网络直播)、事后公开(如裁判文书的公开)等。再比如,公开的对象包括案件的当事人、法庭的旁听人员、全体公众等。
进行细分的目的是为了在司法公开时做到“区别对待”和“有所取舍”。很多时候,为了遵循司法公开的“保留原则”,在具体的公开场景下,应选择性地公开或隐去特定部分(107)如最高人民法院.最高人民法院关于人民法院在互联网公布裁判文书的规定,2016,第8条.。于是,不同类型和程度的分割为“部分公开”和“部分剔除”提供了可能。换言之,在利益冲突时,细分原则确保了司法公开的合理性。比如,在庭审网络直播中,为了保护当事人的隐私权益,举证质证的阶段需要单独切割和抽离出来,不予直播(108)如江苏省南京市江宁区.南京市江宁区人民法院关于全面开展庭审网络直播的通知,2018.。
效仿上述逻辑和目的,算法解释也应纳入“细分原则”。首先,算法解释的概念本身应拆解出若干要件。其中,最为关键的就是算法解释的内容、时机和对象(109)European Parliamentary Research Service(EU),A Governance Framework for Algorithmic Accountability and Transparency,March 2019.4-8.。其后,上述三个构成要素还应当被进一步细分(见图4)。具体来说,算法解释的内容至少应包括数据(包括原始数据和训练数据等)、代码(算法的运算法则)、决策目标(算法决策的功能或作用,比如通过人脸识别验证身份)、决策结果(在特定的场景下得到的结果,比如身份验证是否通过)、合规情况(算法设计和使用符合哪些规定)、利益冲突情况(算法的关联方及潜在的利害关系)、数据使用方法(算法收集的数据如何形成决策,包括每种数据的影响权重)等。算法解释的时机应包括决策前解释、决策中解释、决策后解释。算法解释的对象至少应包括所有公众、当事人、监管部门、第三方机构、独立研究者等(110)European Parliamentary Research Service(EU),A Governance Framework for Algorithmic Accountability and Transparency,March 2019.6.。
图4 算法解释的细分要素
可以想见,由于算法决策程序的权属特征,潜在的利益冲突会更激烈,算法解释活动也并非理所当然。于是,将算法解释的内容、时机和对象进行细分后,在要求算法解释的特定场景下,就可以按照实际需要,把“合适的解释内容”在“合适的时机”提供给“合适的对象”。以此,便可尽量均衡各方权益、各类价值,实现算法解释的合理性。
明确算法解释的定位、限度、要件的基本原则,最终是为了服务于算法解释的具体实施。回顾上文的结论,“谦抑原则”为其他算法治理工具保留了空间;“保留原则”提示算法解释必须满足合理性和必要性;“细分原则”为利益权衡下的精准取舍做好了准备。那么,应该如何综合运用上述原则,把“合适的解释内容”在“合适的时机”提供给“合适的对象”呢?此时,可以借用行政法领域“比例原则”。主要原因有三:
第一,“比例原则”是司法公开过程中遵循的原则之一,常被用以确定司法公开的范围和限度(111)冀放,冀祥德.司法公开的审查和限制——以法官和媒体在审判公开中的角色为视角[J].求是学刊,2014,(4):88.。基于司法公开与算法解释的可比性,这一原则同样可以借用。第二,算法解释作为一种国家机关作出的规制手段,是国家权力行使的范畴,属于比例原则的作用范围(112)梅杨.比例原则的适用范围与限度[J].法学研究,2020,(2):57.。第三,“比例原则”及其三个子原则,与本文借鉴司法公开所确立的“保留原则”中的“必要性”和“合理性”不谋而合,重在权衡成本收益、平衡价值冲突。因此,“比例原则”的理论资源可供借鉴。总之,在确定不同情形下“合适的”算法解释内容、时机和对象时,可以借助“比例原则”的框架进行分析。
“比例原则”包含三项子原则。“适当性原则”要求国家机关采取的手段应当有助于规制目的的实现;“必要性原则”要求国家机关选取对当事人利益侵害最小的手段;“均衡性原则”要求国家机关采取的手段给当事人利益造成的损失必须与手段所追求的目的合乎比例。由此,“比例原则”适用的关键是明确特定场景下的规制目的,并考虑特定规制手段的成本(潜在的损害和冲突的权益)。这本质上是一个在目标和手段之间权衡冲突价值、计算成本收益的过程(113)于凤瑞.“成片开发”征收决定公益目的的司法审查:比例原则的应用[J].中国政法大学学报,2019,(5):153.。在算法解释的语境下,为了找出天平两端的对立价值,计算潜在的成本和收益,应综合考虑的因素至少包括:算法解释的目的(问责/监督/教育/...)、算法权属(公共/私人)、应用领域(军事国防/社会保障/社交媒体/...)、潜在影响(国家安全/社会秩序/个体利益)、正式程度(正式/非正式/其他)和自主程度(有监督/无监督)、潜在的替代方案等因素(见图5)(114)Mateski,Mark,Cassandra M.Trevino,Cynthia K.Veitch,John Michalski,J.Mark Harris,Scott Maruoka,and Jason Frye,Cyber Threat Metrics,Sandia National Laboratories,2012; European Parliamentary Research Service(EU),Understanding Algorithmic Decision-making:Opportunities and Challenges,March 2019,p.19.。
图5 算法解释适用“比例原则”的考虑因素
考虑到前文论述的“细分原则”,算法解释的具体实施应分为三步(见表3)。第一,选择待考虑的算法解释的构成要件(内容/时机/对象);第二,逐一对算法解释的构成要件适用“比例原则”,确定应该考虑的因素(解释目的/应用领域/潜在影响/...)并加以权衡和计算;第三,根据权衡和计算的结果决定算法解释的细分要素。下面结合具体场景对算法解释的三个构成要件进行说明。
表3 算法解释的具体实施示意图
第一,确定算法解释的内容——以只需提供“算法决策结果”的情形为例。假设我们要判断一个商业(私人)贷款额度的监督算法决策程序是否存在性别歧视,进而对其追究责任。在这个案例中,算法解释的目的是“问责”,类别属于私人算法,自主程度较低。根据“必要性原则”的指引,国家机关应选取对当事人利益侵害最小的手段。考虑到“统计证明法”和“反事实解释法”能够辅助我们单纯基于算法决策结果对算法问责,我们就无需打开算法黑箱了解其决策过程,只需提供“算法决策的结果”这一细分要素即可实现目标。
具体来说,采用“统计证明法”(Statistical Evidence Approach)(115)Finale Doshi-Velez and Mason Kortz,Accountability of AI Under the Law:The Role of Explanation,Berkman Klein Center Working Group on Explanation and the Law,Berkman Klein Center for Internet and Society working paper,2017.国内学者提出了类似的方法,被称为“正当程序法”,参见陈景辉.算法的法律性质:言论、商业秘密还是正当程序?[J].比较法研究,2020,(2):120.,在控制除性别外其他因素不变的情况下,让算法对一定数量的样本情形作出决策。从算法决策的结果来看,如果某种性别总是得到更有利的结果,而另一种性别总是处于不利地位,则算法决策必然存在性别歧视,可以追责。我们还可以采用“反事实解释法”(Counterfactual Explanations)实现相同目标(116)Sandra Wachter,Brent Mittelstadt and C Russell,Counterfactual Explanations without Opening the Black Box:Automated Decisions and the GDPR,31 Harvard Journal of Law & Technology 841,841-887(2018).。假设某人怀疑自己因性别而被算法差别对待。只需保持其他因素不变,单纯改变性别这一因素后让算法再次决策,如果得出的结论并不相同,则说明算法确实存在性别歧视,应当承担责任。
第二,确定算法解释的时机——以需要在“决策前”和“决策中”解释的情形为例。如果某正式决策的公共算法将被应用在军事领域,潜在地影响到国家安全。而且,这一算法包括无监督的机器学习环节,自主性较高。那么,该算法在投入使用(决策)之前甚至进行设计之时就应进行算法解释。并且,在算法决策的过程中,要全程保持透明、留存可追踪复盘的算法决策过程信息。显然,这么做符合“均衡性原则”,因为国家机关采取的手段的成本必须与手段所追求的目的成比例。也就是说,在综合考虑了算法解释的目的、应用领域、潜在影响、正式程度和自主程度后,我们认为这类算法必须在事前、事中提供清晰、完整的解释,否则,就应当弃用(117)Congressional Research Service,Artificial Intelligence and National Security,November 2019.。
第三,确定算法解释的对象——以只需向“监管部门”解释的情形为例。如果某一算法是商业领域的私人算法,主要的功能是呈现用户搜索结果的决策,而且该算法的决策过程如果公之于众,可能导致算法博弈和反向机器学习等损害公共利益的严重后果。假设这一算法侵害了公民的健康权、财产权,我们就需要获取算法解释以对其进行监督和整改。那么,在考虑了算法解释的目的、算法权属、应用领域和潜在影响之后,该算法可不必向所有社会公众提供解释,而可仅向政府监管部门解释。此举符合“必要性原则”和“均衡性原则”。其实,我国就有这样的实例。2016年,针对“魏则西事件”,国家网信办会同国家工商总局对百度的竞价排名算法进行内部调查和整改。基于百度方面提供的算法解释,调查组认为这一算法存在付费竞价权重过高、信誉度权重过低、搜索结果每页显示的商业推广信息过多等问题(118)雷丽娜.国家网信办联合调查组公布进驻百度调查结果[EB/OL].(2016-05-09)[2020-10-17].http://www.gov.cn/xinwen/2016-05/09/content_5071628.htm.。此时,百度算法解释的对象仅是政府监管部门,以这种对私人利益侵害较小的方式实现了监管目的。
通过上述三个案例可以发现,在决定算法解释的内容、时机和对象时,需在“比例原则”的指导下,结合“谦抑原则”和“保留原则”,在特定的应用场景下,基于多种考虑因素,灵活确定算法解释的各个构成要件和呈现要素。最后,通过“细分原则”让算法解释趋于精细化、合理化、均衡化。
算法解释的标准决定了算法决策的兴衰,也影响着数字经济的发展。然而,算法解释的治理方案在中国方兴未艾,诸如定位、限度、要件、实施等具体问题亟待澄清。基于司法公开与算法解释在规制方法、规制目标、规制对象、规制成本等关键方面的相似性,算法解释可以从司法公开处借鉴经验。又由于两者在权属特征和决策类型方面的差异性,算法解释在借鉴的过程中应有所变通。总的来看,在司法公开的启示下,算法解释应确立四项原则。“谦抑原则”要求算法解释作为法律工具,在其他算法治理工具面前保持谦和与自抑,做好相互配合甚至被更优秀的治理手段替代的准备。“保留原则”提供了豁免算法解释的若干正当性基础,确保算法解释具备可能性、合理性和必要性。“细分原则”明确了算法解释的各个要件可以且应当进行拆分,以备精准地满足特定场景下的监管要求。“比例原则”在算法实施层面提供了权衡价值冲突、计算成本收益的框架,为确定算法解释的内容、时机、对象等具体要素提供了指引。