人工智能应用于地方立法的现实困境与应然路径

2022-04-13 00:47李弸
人大研究 2022年3期
关键词:词库备案图谱

李弸

随着互联网、大数据、人工智能的飞速发展,数据正以前所未有的速度爆炸性生成和增长,由此形成的海量数据资源逐步成为国家层面最为重要的基础性战略资源之一。习近平总书记指出:“要运用大数据提升國家治理现代化水平,建立健全大数据辅助科学决策和社会治理的机制,推进政府管理和社会治理模式创新,实现政府决策科学化、社会治理精准化、公共服务高效化。”党的十九大报告明确,立法应遵循科学立法、民主立法、依法立法的原则。大数据及人工智能在立法领域的应用,为立法提供了全新的思路,对于更好实现以良法促进发展、保障善治意义重大而深远。

一、人工智能应用于地方立法的实践探索

早在2014年,天津市人大常委会就依托北大法宝法律数据库,投入使用了全国首个运用人工智能辅助地方立法的法律应用系统——规范性文件审查系统[1]。此后,河北、海南、黑龙江、北京、上海、江苏、广西、西藏、甘肃、青海、珠海、云浮、哈尔滨等地人大常委会陆续与北大英华科技公司合作,引进“北大法宝”智能立法平台,将人工智能运用于当地立法。总体而言,当前人工智能在地方立法中的实践应用主要包括以下三个领域。

(一)规范性文件备案审查

众所周知,掣肘于地方法规、规范性文件数量众多,传统备案审查工作需要备审工作者大量查阅相关法律法规,十分耗时耗力,人工智能的引入使这一问题得以解决。当前,大数据、人工智能辅助地方立法较为成熟的地方已将人工智能运用于规范性文件备案审查。以天津市人大常委会与“北大法宝”合作的规范性文件备案审查平台为例,智能平台依托“北大法宝”法律数据库,预先设计了“敏感词词库”,备案审查时,系统将待审查文件、敏感词词库、法律法规数据库三相比对,自动匹配筛查,当待审查文件出现敏感词汇时,提示备案审查工作者待审查对象有违背上位法的可能。比如依照《行政许可法》第十五条的规定,规章及以下位阶的法律无权设定行政许可。当待审查文件含有“审批”“许可”“责令停产”“罚款”“关停”等词汇时,智能平台将会把此类敏感词汇与敏感词库进行自动比对,标注出可能违法的表述,同时罗列与此类词汇相关的法律规定,供备案审查工作者人工识别。如此一来,能够最大限度防止备案审查工作出现疏漏,节约备审工作者查阅法律的时间,极大地提升了备案审查工作效率。此后,该系统陆续应用于河北、海南、黑龙江、广西、青海、甘肃等省(自治区)人大常委会。

(二)法规清理

地方性法规不应朝令夕改,更不能停滞不前,应根据社会发展不断与时俱进,以维护其科学性和适应性,故开展法规清理工作意义重大。传统的法规清理工作量大,清理标准繁杂,需要耗费较多人力物力资本。人工智能的引入,使法规清理工作得以“轻装上阵”。比如2014年起,天津市人大常委会运用敏感词词库,主动对其往年制定的所有规范性文件开展了追溯式审查,在人工智能的辅助下完成了自我清理。据统计,在智能立法平台的协助下,2016年天津市人大常委会对其制定的172部法律全部开展了清理;2017年又自查出17件地方性法规、政府规章等存在问题。2018年依循全国人大常委会的要求,全面清理了生态环保领域的地方性法规,打包修改了7部法律[2],有力地维护了法制统一,确保了立法的科学性与实用性。

(三)法规文件制定

法规文件制定无疑是人工智能辅助地方立法的高阶阶段,目前尚未能实现这一目的,但现有探索亦有可圈可点之处。2018年,智能立法平台的功能进一步拓展,在原来备案审查平台基础上,功能拓展延伸至立法项目管理、立法草案意见征集、法规文件公开、法规文件报备、立法资料管理、立法评估、立法大数据分析等领域。在立法项目管理系统中,从启动、征集、论证、起草、批转到计划实施的全过程,文件及音视频资料均存储于对应系统中,可实现立法计划流程和立法流程全过程的留痕和回溯。目前的草案意见征集系统可收集公众对法规草案的意见,但意见来源的广泛性尚不能保证。法规文件公开系统及时更新需要信息公开的法规文件。法规文件清理系统主要收集立法技术规范及立法机关内部业务文件,而立法资料管理系统则可以收集立法舆情、新闻报道、国际国内相关法规等立法资料。立法(后)评估系统主要负责自动采集相应数据进行分析处理,分析立法的舆论导向,建立格式化模型并生成立法评估报告,不过目前该功能尚在起步探索阶段。

二、人工智能应用于地方立法的现实困境

尽管各地人大常委会渐次开展了上述有益探索,但总体而言,大数据在我国立法领域远未得到应有重视,尚处于起步阶段,应用范围较窄,功能开发较少,整体推进速度较慢。

(一)立法大数据原始资源不足

全样本是大数据最本质的特征,数据只有具备充足的体量与规模,有无限广阔的时空跨度,才能实现数据的包容性、代表性和完整性[3]。运用大数据技术进行分析预测的前提在于数据的完备,而我国目前的立法基础数据库存在以下问题:一是数据共享不足。地方立法并非孤立行为,人工智能在地方立法中的深度应用,建立在海量占有信息资源的基础之上。而当下我国的信息资源共享开放工作尚不如人意,数据开放的范围和数量还远远不够,数据实际可用性不强,国家层面亦未实施公共数据资源开放战略。目前,不同政府部门控制的数据并未实现开放共享,海量政府数据亟需“苏醒”;尚未形成统一的数据开放格式,不利于数据的有效利用。二是数据价值密度偏低,很多地区可下载数据集存在高缺失、碎片化、低容量等问题。不同部门之间信息端口不能相互调用,可调取到的数据容量小、更新周期长,无法形成可直接供分析利用的高价值大数据集[4]。三是大数据开放市场处于无序状态,重复建设、信息孤岛、信息盲点、数据打架等现象大量存在。比如有的地方人大的信息网站与“一府一委两院”、同级人大、上下级人大并未实现互联互通,即使是同级人大,代表履职平台、备案审查平台、预算联网监督平台也存在重复建设、各自为政的问题。

(二)立法领域法律知识图谱尚未构建

即使立法法律数据库数据资源充足,大数据的简单堆积亦无法直接产生立法人工智能。“人工智能的本质在于算法和数据处理,机器通过学习,对海量数据进行自动挖掘与预测,以形成统一的智能化算法或参考指引。”[5]而算法形成的关键在于机器的深度学习,其中最主要的方法即为知识图谱的构建[6]。所谓知识图谱,是指知识间结构关系的可视化呈现,简单说,就是将人类的知识整合到机器中去,使其有效管理知识、规则和结论,从而形成类似人脑推理的知识图谱[7]。一方面,立法方面的法律知识图谱尚处于萌芽阶段,与司法过程不同,司法法律图谱的构建更多是法律适用,可通过提炼要素审判规则实现,而立法更多是一种创设行为,是一个从无到有的过程,如何构建立法领域的知识图谱是一个有待深入思考的命题。另一方面,立法数据结构化不足。大数据形成人工智能的前提是数据具备结构化特征,而法律语言的丰富多彩使得“投喂”给人工智能的数据并不具备结构化特征。以目前发展较为成熟的备案审查人工智能举例,对限制人身自由的表述包括“拘留”“强制关押”“扣留审查”“限制出境”“不得离开”等,在不同法律法规中就达50多种表述方式。如果仅仅以“拘留”为敏感词,则其他提法显然回避了敏感词词库,却表达了相近意思,成为备案审查的漏网之鱼。而此项工作仅靠机器显然无法学习,需要经由人工对立法数据进行清洗、标注和筛选分类[8],以形成机器能够识别的结构化数据——分词词库,在此基础上再让机器深度学习,从而形成人工智能[9]。而对浩如烟海的法律规范进行筛选、归类、标签设置,其工作量可想而知,立法法律知识图谱的构建道路,实则任重而道远。

(三)复合型人才匮乏

立法人才对立法质量具有决定性作用。一方面,地方立法人才结构分布极不均衡,2015年《立法法》将地方立法权下放到所有设区的市,但部分设区的市人大立法力量、立法工作人员法律素养尚不能匹配地方立法权扩容后的庞大立法需求。另一方面,人工智能在立法领域的深度应用,急需一大批精通法律和大数据分析知识的双重复合型人才。即使拥有丰富立法经验的立法者,在人工智能应用于立法工作中时,也往往掣肘于欠缺计算机知识及数据应用理念,无法实现立法需求与人工智能的深度融合。当前,大部分互联网机构多采用“法律人才+大数据人才”的方式来研发产品,然而此种简单叠加方式作为权宜之计存在诸多困境,计算机人才对于法言法语的精准理解、法律人才对于机器语言的深度识别都存在鸿沟,知识背景的巨大差异使得沟通成本增加,易使项目偏离预设目标。目前,虽然部分高校已经开设了培养法律+人工智能复合型人才的专业课程,但复合型人才的培养周期远远赶不上日新月异的数字经济发展速度,人才空窗期在所难免。

三、人工智能应用于地方立法的前景展望

尽管存在上述种种困境,但人工智能在立法领域的应用前景仍然十分广阔,在立法意见收集智能整理、立法决策量化论证、立法资料收集等方面大有用武之地。

(一)立法意见智能整理

习近平总书记指出:“我们走的是一条中国特色社会主义政治发展道路,人民民主是一种全过程的民主,所有的重大立法决策都是依照程序、经过民主酝酿,通过科学决策、民主决策产生的。”开门立法、民主立法是对全过程民主最生动的诠释,而人工智能在立法意见征集中的应用,能够最大限度倾听民声、汇聚民智,降低公众参与立法的成本。

一是拓宽公众参与立法的广度。过去,仅仅依靠立法调研、立法座谈会、实地走访等传统形式征集意见,掣肘于场地、安全、人员身份筛选等种种因素,立法意见收集渠道较为单一,群众参与立法的广度和深度都十分有限。而互联网、大数据的引入,使得公众参与立法不再受制于时空和身份,形式变得灵活多样,公众参与立法的广度得以极大提升。

二是高效智能分析筛选立法意见。立法意见汇集后,更重要的是对其进行分类筛选,依靠传统人力进行整理汇总,工作量可想而知。以《民法典》为例,其编纂过程中共收到42.5万人提出的102万余条意见,对如此海量的意见进行收集整理,需要过滤无效意见、去除重复意见,十分耗时耗力。而处理海量信息恰恰是大数据的优势,依托语义理解、文本自动处理和深度学习,人工智能能够对收集到的数据进行过滤,区分整体意见和分类意见,去除无效意见和重复意见,在短时间内整理出对法规草案有益的立法信息。

(二)立法决策量化分析

提高立法质量是立法工作永恒的追求。为解决地方立法针对性和操作性不强、立法初衷与最终效果相悖的弊病,必须努力强化立法决策量化论证,全面衡量各方利益诉求[10]。大数据连接一切、去中心化、计算一切、可预测性等重要特征能够有力弥合地方立法工作的痛点,为立法决策提供有力支撑,实现“让数据说话,用数据决策”。

一是助力科学编制立法规划。全样本是大数据的第一基础特征,大数据时代公众参与立法广度深度的极大拓展,能够真正为立法规划编制提供全样本数据而不再是抽样样本数据,这种前所未有的无差别完整数据,能够全面、客观、真实地反映各方主体的利益诉求,是传统的问卷调查、座谈走访等方式收集数据无法逾越的鸿沟,使立法者得以准确掌握社会治理现状和人民真实意愿,真正实现民有所呼、我有所应。

二是助力科学作出立法决策。在获取全样本数据的基础上,对数据进行分析论证才能实现数据善用。人工智能能够利用大数据进行人工神经网络分析,继而通过深度学习发现数据相关性。比如在立法项目论证中,人工智能能够实现对某一法规草案可能带来的社会影响、相关效应作出科学预测,輔助立法者筛选出立法成本最小、社会效益最高的立法方案。

三是助力完善立法(后)评估。传统立法(后)评估参与主体不够广泛,评估方式限于抽样调查、座谈走访、专家评议。人工智能的引入,一方面使参与主体不再受限于参与技术,极大拓展了参与主体广度;另一方面评估数据来源变成全样本,同时依托大数据深入挖掘海量数据资源、评估结构化数据的优势,能够使立法后评估的数据来源更加真实可靠,真实反映民意。此外,传统抽样采集模式下,立法后数据评估指标体系呈现静态,时效性局限明显。而大数据挖掘技术能够获取动态的、长期的、持续的评估数据[11],从中发现隐藏因素,显示未知趋势和演化模式、发展规律,从而去除传统抽样和民意调查带来的不确定性,使得立法评估的精准度大幅提升。

(三)立法资料智能收集

高质量的地方立法离不开对国内外相关法律法规、期刊的海量检索。以设区的市人大立法为例,一部地方性法规的生成,不仅需要立法者从法律、行政法规、省级地方性法规中查找依据,同时还需参考兄弟省市法规、相关部门规章、政府规章、司法案例及司法解释,有些甚至还需查阅相关行业标准、团体规定等。这对于立法工作者的法律信息检索能力要求很高,工作过程中极易出现疏漏,同时对庞大立法资料进行收集整理也是一项重大工程。此时大数据处理海量数据资源的优势得以凸显,立法工作者只需输入关键词,人工智能平台就能运用相关性分析技术,在已建成的国家法律法规数据库、中国裁判文书网、期刊数据库、规范性文件备案审查平台、时政新闻、地方省市人大信息资源平台等数据库中自动搜索匹配相关资料。未来高阶版的人工智能搜索引擎能利用分词词库最大限度减少无关信息源,精准匹配目标数据,大力提升立法资料收集质量和效率。

四、人工智能应用于地方立法的路径探析

当前,人工智能已经上升到国家战略层面,立法人工智能的相对滞后无法匹配国家治理能力和治理水平现代化的现实需求。地方人大应积极搭载科技快车,运用大数据和人工智能,推动地方立法更加科学、民主、精细化。

(一)充实立法数据库

大数据与人工智能的关系如同燃料与火箭,有数据方有人工智能,否则立法人工智能只能成为无本之木、无源之水。当前我国立法大数据资源严重匮乏,与大数据全样本的要求相去甚远,故当务之急是从体量和规模上充实立法大数据库,以解立法人工智能“巧妇难为无米之炊”之痛。

立法与大数据的深度结合至少应该经历三个阶段:第一阶段为智能信息管理,第二阶段为智能互动,第三阶段为智能决策。目前我国立法与人工智能的结合尚停留在信息录入智能化阶段,且法律法规、代表意见等数据库本身建设并不成熟,故当务之急是完成第一阶段的信息汇集。

第一,完善人大系统内部数据资源的原始积累。以重庆市人大常委会为例,横向层面应整合现有的门户网站、公文办理系统、规范性文件备案审查平台、代表履职平台、预算联网监督系统数据资源,实现不同平台数据信息互联互通;纵向层面应对接区县、乡镇人大已有数字资源,努力实现市与区县信息化建设、规划、使用一盘棋,避免平台重复建设、资源浪费。更进一步,尝试与全国人大、兄弟省市人大的立法资源实现深度关联,最大限度整合现有立法资源。

第二,打破数据孤岛,整合政务数据资源,安全有序开放数据共享。“大数据的真正意义在于大价值,价值主要是通过数据的整合、分析和开放而获得的。”[12]地方立法从来就不是地方人大常委会的独角戏,政府部门本来就是地方立法起草的主要参与者。而立法活动中政务数据开放不足,必将制约立法大数据的长足发展,我们应打破部门间的数据壁垒,实现立法机关与政府部门、司法部门的数据共享。可喜的是,2020年公布的《中华人民共和国数据安全法(草案)》第五章专章规定了“政务数据安全与开放”,2021年政府工作报告更是明确指出:“十四五”时期,要加强数字政府建设水平,建立健全政务数据共享协调机制。可借鉴上海和贵州的先进经验[13],制定政府数据开放条例,安全、有序开放政务数据,链接立法大数据资源库,补齐立法大数据资源不足短板,让大数据成为地方立法工作的“千里眼”和“顺风耳”。

(二)构建立法领域法律知识图谱

人工智能在立法领域的深度应用,离不开法律知识图谱的搭建,否则立法人工智能只能简单停留在1.0信息化录入阶段,无法实现真正意义上的大数据分析,更遑论数据评估、预测与数据创新。

如前所述,尽管将立法领域法律知识图谱的构建直接运用于立法条文编撰还不太现实,但在规范性文件备案审查、立法意见征集汇总、立法决策量化分析中,法律知识图谱却大有用武之地。人工智能知识图谱的搭建包括以下要素:一是人工神经网络方法,机器基于知识图谱进行深度学习,从而挖掘数据本质,并在未来输出与原规则相近的结果;二是分词及词库建设,其为知识图谱构建的基本单位,其中语境化的分词词库建设离不开人工标注,由专家对规则进行标注后加入分词词库,从而不断“喂养”机器,由其深度学习后通过整合数据习得数据的本质特征,得出最接近人类判断的结论。由此可知,知识图谱构建的关键在于人工标注分词词库,无论是备案审查系统中的“敏感词词库”,还是有效立法意见收集、立法决策量化分析,都离不开分词词库的构建和人工标注。

相较司法领域而言,立法领域的法律知识图谱构建尚在启蒙阶段,但已有的实践探索已经为我们开启立法人工智能时代奠定了基石。天津市人大常委会规范性文件备案审查系统“敏感词词库”的不断更新迭代[14],就使得规范性文件备案审查法律知识图谱的颗粒度不断变细,而如若能全国一盘棋,打通各省市人大常委会的规范性文件备案审查平台,“敏感词词库”的后台信息就能够实现互联互通,随着各地立法机关对人工智能的重视,将会有更多的立法专家加入到对该“敏感词词库”的标注工作中,各地立法工作者都贡献一些数据,由机器将其综合、归纳、存储,使机器习得的自然语言越来越丰富完善,机器经过深度学习后必将越来越聪明,从而“喂养”出真正的立法人工智能。

(三)完善人才融合与培养战略

当今世界正经历百年未有之大变局,科技和人才日益成为国际战略博弈的主战场。将人工智能应用到地方立法乃至各個领域中离不开既精通法律又知晓技术的人才支撑。目前的人才储备难以满足立法人工智能的实际需求,为寻解困之道,可采取人才培养分步走战略。

第一步,依托现有人才资源,努力实现法律人才和技术人才的融合。地方立法机关和政府职能部门的立法人才不仅具有丰富的立法实践经验、精湛的立法技艺,同时还是法律知识图谱清洗、标注、分类的主力军。一方面,应加强立法人才与技术人才的合作沟通,精准提出立法人工智能的法律产品需求,由技术人才转化成AI语言,强化技术人才对立法人才的技术指导。另一方面,加强对立法人才的培训,将大数据、人工智能、法律知识图谱构建、神经网络、深度学习等课程作为立法人才必修课程,补齐知识短板,使其在立法人工智能应用中储备基础知识。

第二步,培养法律+人工智能复合型人才。长远来看,培养大批精通法律和计算机、信息技术的复合型人才才是化解立法人工智能人才瓶颈的良方。国务院2017年出台的《新一代人工智能发展规划》中,已经明确了“人工智能+法律”复合型人才培养规划,教育部、国家发展改革委和财政部2020年出台的《关于“双一流”建设高校促进学科融合 加快人工智能领域研究生培养的若干意见》进一步提出了高校应深化人工智能与法学等哲学社会科学等相关学科的交叉融合要求。在此背景下,相关高校应将计算机科学、人工智能、信息法学互联为一体,以提供一套立体的法律技能培养和人工智能学习方案,为立法人工智能提供生力军[15]。

注释:

[1][2]高绍林、张宜云:《人工智能在立法领域的应用与展望》,載《地方立法研究》2019年第1期,第47页。

[3]【英】维克托·迈尔-舍恩伯格、肯尼思·库克耶:《大数据时代》,盛杨燕、周涛译,浙江人民出版社2013年版,第27页。

[4]任文岱:《多地推进政务数据资源开放共享 专家学者建议国家立法保障政府数据开放》,载《民主与法制时报》2021年3月10日。

[5]高翔:《人工智能民事司法应用的法律知识图谱构建——以要件事实型民事裁判论为基础》,载《法制与社会发展》2018年第6期,第70页。

[6]蔡自兴、刘丽珏、蔡竞峰、陈白帆:《人工智能及其应用(第5版)》清华大学出版社2017年版,第125页。

[7]秦长江、侯汉清:《知识图谱——信息管理与知识管理的新领域》,载《大学图书馆学报》2009年第1期,第30页。

[8]左卫民:《关于法律人工智能在中国运用前景的若干思考》,载《清华法学》2018年第2期,第117页。

[9]吴岸城:《神经网络与深度学习》,电子工业出版社2016年版,第83页。

[10]李飞:《加强立法决策量化论证 不断提高立法质量》,载《中国人大》2018年第19期,第12页。

[11]曹瀚予:《大数据在立法后评估中的应用析论》,载《自然辩证法通讯》2018年第11期,第15页。

[12]徐子沛:《数据之巅——大数据革命、历史、现实与未来》,中信出版社2014年版,第258页。

[13]上海制定了国内首部针对公共数据开放的地方政府规章《上海市公共数据开放暂行办法》,明确相关部门应结合公共数据安全、个人信息保护和应用要求等诸因素,制定公共数据分级分类规则,确定开放类型、开放条件和监管措施。贵州制定了《贵州省政府数据共享开放条例》,强调统一建设政务信息系统和共享平台、开放平台,并明确数据调度溯源功能,强化平台数据安全。

[14]天津市人大常委会规范性文件备案审查系统“敏感词词库”不断丰富迭代,从最初的几十个积累到上百个。比如早期只将“许可”一词设为敏感词汇,后来发现有的待审查文件中“批准”“准许”等类似表述也是相同意思,于是将此类词语亦充实进敏感词词库。

[15]张建文、潘林青:《人工智能时代法律人才培养的新起点、新理念与新方案》,载《法学教育研究》2021年第1期,第54页。

(作者单位:重庆市人大常委会研究室综合处。本文系重庆市地方立法研究协同创新中心2019年地方立法研究项目“重庆市弘德立法质量实证研究”〔DFLF202019〕的阶段性成果)

猜你喜欢
词库备案图谱
关于备案建材事中事后监管的实践与思考
绘一张成长图谱
一“吃”多用
我省高校新增备案和审批本科专业名单
补肾强身片UPLC指纹图谱
输入法词库乾坤大挪移
词库音系学的几个理论问题刍议
解读保健食品注册备案“双轨制”
保健食品或可探索“审批+备案”模式
杂草图谱