人工智能应用于地方立法的 现实困境与应然路径

2022-04-15 16:23李弸
公民导刊 2022年4期
关键词:词库海量图谱

李弸

随着大数据、人工智能的飞速发展,海量数据资源逐步成为国家层面最为重要的基础性战略资源之一。习近平总书记指出:“要运用大数据提升国家治理现代化水平,建立健全大数据辅助科学决策和社会治理的机制,推进政府管理和社会治理模式创新,实现政府决策科学化、社会治理精准化、公共服务高效化。”

党的十九大报告明确,立法应遵循科学立法、民主立法、依法立法的原则。大数据及人工智能在立法领域的应用,为立法提供了全新的思路,对于更好实现以良法促进发展、保障善治,意义重大而深远。

现实困境

早在2014年,天津市人大常委会就依托北大法宝法律数据库,投入使用了全国首个运用人工智能辅助地方立法的法律应用系统——规范性文件审查系统。此后,多个地方人大常委会陆续引进北大法宝智能立法平台,将人工智能运用于地方立法。当前,人工智能在地方立法中的实践应用主要包括以下几个领域:规范性文件备案审查、法规清理、法规文件制定。

尽管各地人大常委会渐次开展了有益探索,但总体而言,大数据在我国立法领域远未得到应有重视,尚处于起步阶段,应用范围较窄,功能开发较少,整体推进速度较慢。

运用大数据技术进行分析预测的前提在于数据的完备,而我国目前的立法基础数据库存在以下问题:一是数据共享不足。当下,不同政府部门控制的数据并未实现开放共享,海量政府数据亟须“苏醒”,尚未形成统一的数据开放格式,不利于数据的有效利用。二是数据价值密度偏低,很多地区可下载的数据存在碎片化、低容量等问题。三是大数据开放市场处于无序状态,重复建设、信息孤岛、信息盲点、数据打架等现象大量存在。比如地方人大的信息网站与“一府一委两院”、同级人大、上下级人大并未实现互联互通。即使是同级人大,代表履职平台、备案审查平台、预算联网监督平台也存在重复建设、各自为政的问题。

人工智能的本质在于算法和数据处理,机器通过学习,对海量数据进行自动挖掘与预测,以形成统一的智能化算法或参考指引。而算法形成的关键在于深度学习,其中最主要的方法即为知识图谱的构建。所谓知识图谱,是指知识间结构关系的可视化呈现,简单来说,就是将人类的知识整合到机器中去,使其有效管理知识、规则和结论,从而形成类似人脑推理的知识图谱。而法律语言的丰富多彩,使得“投喂”给人工智能的数据并不具备结构化特征。以目前发展较为成熟的规范性文件备案审查人工智能举例,对限制人身自由的表述包括“拘留”“强制关押”“扣留审查”“限制出境”“不得离开”等50多种。如果仅仅以“拘留”为敏感词,则其他提法显然回避了敏感词词库。而此项工作,需要人工对立法数据进行清洗、标注和筛选分类,以形成机器能够识别的结构化数据——分词词库,在此基础上再让机器深度学习,从而形成人工智能。而对浩如烟海的法律规范进行筛选、归类、标签设置,其工作量可想而知。

人工智能在立法领域的深度应用,急需一大批精通法律和大数据分析知识的复合型人才。即使拥有丰富立法经验的立法者,在人工智能应用于立法工作中时,也往往掣肘于欠缺计算机知识及数据应用理念,无法实现立法需求与人工智能的深度融合。当前,大部分机构多采用“法律人才+大数据人才”的方式开展工作,然而计算机人才对于法言法语的精准理解、法律人才对于机器语言的深度识别都存在鸿沟,知识背景的巨大差异使得沟通成本增加,易使项目偏离预设目标。

前景展望

尽管存在上述种种困境,但人工智能在立法领域的应用前景仍然十分广阔,在立法意见收集智能整理、立法决策量化论证、立法资料收集等方面大有用武之地。

一是立法意见智能整理。

开门立法、民主立法是对全过程人民民主最生动的诠释,而人工智能在立法意见征集中的应用,能够最大限度倾听民声、汇聚民智,降低公众参与立法的成本。

可拓宽公众参与立法的广度。过去,仅仅依靠立法调研、立法座谈会、实地走访等传统形式征集意见,立法意见收集渠道较为单一,群众参与立法的广度和深度都十分有限。而互联网、大数据的引入,使得公众参与立法的广度得以极大提升。

可高效智能分析筛选立法意见。立法意见汇集后,更重要的是对其进行分类筛选,依靠传统人力进行整理汇总,工作量可想而知。以《民法典》为例,其编纂过程中共收到42.5万人提出的102万余条意见,对如此海量的意见进行收集整理,需要过滤无效意见、去除重复意见,十分耗时耗力。而处理海量信息恰恰是大数据的优势,依托语义理解、文本自动处理和深度学习,人工智能能够对收集到的数据进行过滤,区分整体意见和分类意见,去除无效意见和重復意见,在短时间内整理出对法规草案有益的立法信息。

二是立法决策量化分析。

为解决地方立法针对性和可操作性不强、立法初衷与最终效果相悖的弊病,必须努力强化立法决策量化论证,全面衡量各方利益诉求。大数据连接一切、去中心化、计算一切、可预测性等重要特征能够有力弥合地方立法工作的痛点,为立法决策提供有力支撑,实现“让数据说话,用数据决策”。

可助力科学编制立法规划。全样本是大数据的第一基础特征,能够全面、客观、真实地反映各方主体的利益诉求,使立法者得以准确掌握社会治理现状和人民真实意愿,真正实现民有所呼,我有所应。

可助力科学作出立法决策。在获取全样本数据的基础上,人工智能能够利用大数据进行分析,继而通过深度学习发现数据相关性。比如在立法项目论证中,人工智能能够实现对某一法规草案可能带来的社会影响、相关效应作出科学预测,辅助立法者筛选出立法成本最小、社会效益最高的立法方案。

可助力完善立法(后)评估。传统立法(后)评估参与主体不够广泛,评估方式限于抽样调查、座谈走访、专家评议。人工智能的引入,可极大拓展参与主体广度,同时依托大数据深入挖掘海量数据资源、评估结构化数据的优势,能够使立法后评估的数据来源更加真实可靠,真实反映民意。

三是立法资料智能收集。

高质量的地方立法离不开对国内外相关法律法规、学术研究成果的海量检索。在这方面,大数据处理海量数据资源的优势得以凸显,立法工作者只需输入关键词,人工智能平台就能在数据库中自动搜索匹配相关资料。未来高阶版的人工智能搜索引擎能利用分词词库最大限度减少无关信息源,精准匹配目标数据,大力提升立法资料收集质量和效率。

路径探析

当前,人工智能已经上升到国家战略层面,地方人大应积极搭乘科技快车,运用大数据和人工智能,推动地方立法更加科学、民主、精细化。

一是充实立法数据库。

当前,我国立法大数据资源严重匮乏,与大数据全样本的要求相去甚远,当务之急是从体量和规模上充实立法大数据库。

首先,完善人大系统内部数据资源的原始积累。以重庆市人大常委会为例,横向层面,应整合现有的门户网站、公文办理系统、规范性文件备案审查平台、代表履职平台、预算联网监督系统数据资源,实现不同平台数据信息互联互通;纵向层面,应对接区县、乡镇人大已有数字资源,努力实现市与区县信息化建设、规划、使用一盘棋,避免平台重复建设、资源浪费。更进一步,尝试与全国人大、兄弟省市人大的立法资源实现深度关联,最大限度整合现有立法资源。

其次,要打破数据孤岛,整合政务数据资源,安全有序开放数据共享。地方立法从来就不是地方人大常委会的独角戏,政府部门本来就是地方立法起草的主要参与者。而立法活动中政务数据开放不足,必将制约立法大数据长足发展,应打破部门间的数据壁垒,实现立法机关与政府部门、司法部门的数据共享。

二是构建立法领域法律知识图谱。

人工智能在立法领域的深度应用,离不开法律知识图谱的搭建。如前所述,尽管将立法领域法律知识图谱的构建直接运用于立法条文编撰还不太现实,但在规范性文件备案审查、立法意见征集汇总、立法决策量化分析中,法律知识图谱却大有用武之地。知识图谱构建的关键在于人工标注分词词库,无论是备案审查系统中的“敏感词词库”,还是立法意见收集、立法决策量化分析,都离不开分词词库的构建和人工标注。

立法领域的法律知识图谱构建尚在启蒙阶段。随着各地立法机关对人工智能的重视,将会有更多的立法专家加入到“敏感词词库”的标注工作中,各地立法工作者都来贡献一些数据,就能“喂养”出真正的“立法人工智能”。

三是完善人才融合与培养战略。

将人工智能技术应用到地方立法中,离不开既精通法律又知晓技术的人才。一要依托现有人才资源,努力实现法律人才和技术人才的融合。地方立法機关和政府职能部门的立法人才不仅具有丰富的立法实践经验、精湛的立法技艺,同时还是法律知识图谱清洗、标注、分类的主力军。应加强立法人才与技术人才的合作沟通,精准提出人工智能立法的法律产品需求,由技术人才转化成AI语言,强化技术人才对立法人才的技术指导。加强对立法人才的培训,将大数据、人工智能、法律知识图谱构建、神经网络、深度学习等课程作为立法人才必修课程。

二是培养“人工智能+法律”复合型人才。国务院2017年出台的《新一代人工智能发展规划》已经明确了“人工智能+法律”复合型人才培养规划。在此背景下,相关高校应提供一套立体的人才培养方案,为人工智能立法提供生力军。

(作者单位:重庆市人大常委会研究室)

猜你喜欢
词库海量图谱
国内乡村公共艺术研究进展——基于CiteSpace的知识图谱分析
“植物界大熊猫”完整基因组图谱首次发布
一“吃”多用
图表
输入法词库乾坤大挪移
一个图形所蕴含的“海量”巧题
从教材中突围,走课内海量阅读之路
Hadoop构建的银行海量数据存储系统研究
初探《计算机专业英语》教学
吃饭谁买单