王敏 汪依帆 黄维
摘要
立法智能分析平台为法律咨询者提供法律案件的智能分析和成果展现。用户通过系统提交需要咨询的法律案件,分析系统提取提交案件的文字信息,通过筛选、清洗、智能识别和自然语言处理等操作挖掘出案件关键点内容,找出与已发生案件的相识点和冲突点,建立相关案件的关系模型,最后由可视化系统实现分析成果展示,为广大用户提供智能化的法律咨询服务。
【关键词】立法平台 大数据 智能分析 法律咨询
1 引言
1.1 平台现状
大数据时代有关法律信息化、法律智能化的产业服务层出不穷,人们的法律意识所有提升,对法律信息的获取率显著增长,人们可以容易的从现存法律数据数据库中检索到所需的法律法规和案件信息。现有法律数据管理系统,可以对存入法律数据库的法律法规和案件信息进行全文检索,包括标题、日期、分类、效力级别等信息,在获得检索结果后,如果进一步地查找相关法条,需要花费大量的时间和精力才能找到案情相关信息。当查到相关法律法规条款后,直接进行相应条款的案件类型和要素识别的智能化程度还不高,难以自动判定法律法规中的冲突点、相似点,对法律法规的立改废和用户的法律咨询不足实现智能化参考与服务。
1.2 需求分析
立法智能分析平台为法律咨询者提供法律案件的智能分析和成果展现。用户通过系统提交需要咨询的法律案件,分析系统提取提交案件的文字信息,通过筛选、清洗、智能识别和自然语言处理等操作挖掘出案件关键点内容,找出与己发生案件的相识点和冲突点,建立相关案件的关系模型,最后由可视化系统实现分析成果展示,为广大用户提供智能化的法律咨询服务。
2 立法大数据平台的构建
2.1 平台数据来源
立法大数据数据来源主要有以下几个途径:
(1)立法机构提供的官方数据,该数据也是最具有权威的数据。
(2)各立法系统平台数据,该数据可以通过网络爬取方式获得,具有一定的法律基础,有参考价值,数据更新快,但是各地域可能存在立法数据差异问题。
(3)通过第三方平台购买的数据,该数据的可靠性由第三方决定,但会存在数据版权等问题。
(4)用户自己上传的案例数据,该数据不作为法律依据,但是可以作为案例分析和平台验证数据,具有应用实践作用和案例参考价值。
2.2 平台架构设计
大数据立法智能分析系统分别为:数据采集系统、智能分析系统、数据管理系统和服务与应用系统四个子系统组成。如图1所示。
数据采集系统用于采集原始数据,原始数据的基本信息包括来源网址、采集时间、标题、全文、发布单位、发布时间、类别、效力级别、时效性等。可通过网络爬虫、文件导入、数据库迁移合并、网络提交等方式获取立法相关数据,采集系统将对数据进行清洗和质检。数据管理系统对采集符合要求的数据进行统一入口管理,数据存储有分布式数据库和本地数据库两种方式。智能分析系统获取到原始数据基本信息,检测数据相似性、冲突性和建立关系模型,分析的成果数据存储到数据库中。系统采用基于hadoop的分布式计算、基于spark的迭代式计算、基于 storm的流式计算、基于tensorflow的深度神经网络计算实现数据来智能分析功能。服务与应用系统从数据库中获取分析后数据进行可视化显示。实现系统的对外服务接口,为用户提供友好的分析展现界面。
3 立法平台关键技术
智能化的立法大数据平台包含了较多的新技术领域,从立法数据定义、采集技术方案、数据质检标准、清洗规则、存储模式、大数据计算架构、智能分析模型、法律文本提取、文本规则分析、信息推送、数据可视化呈现等技术都是一个及其复杂的系统工程,平台技术主要集中在以下几点:
3.1 数据融合技术
立法基础数据是整个平台的数据支撑,数据收集难度依取决于数据采集来源,立法平台数据收集是多源异构数据整合,需对不同格式的数据格式进行归一化处理,对不同数据字段进行统一标准合并,对重复数据进行去重处理,对立法冲突数据进行标记分类等。
3.2 智能分析技术
数据智能分析是平台的核心支撑,数据分析体现两个层面:
(1)海量立法原始数据批量处理,通过hadoop平台进行处理可以满足效率和性能需求;
(2)基于tensorfiow的深度神经网络计算平台,由多台GPU服务器集群组成,实现多GPU并行计算,对现有立法文本数据进行自然语言处理,对现有案例文件库进行学习和训练,建立立法数据分析特征库,系统对用户体提交的立法案例进行分析识别。智能分析技术核心目标是建立立法数据与法律案件的多维度关系模型,设计出基于分布式、多GPU的高性能、高可靠的并行算法。
3.3 大数据存储
立法大数据的存储系统分为两个级别:
(1)原始数据库,存储海量原始数据,采用HDFS分布式文件存储系统,由数据管理系统统一访问接口与权限控制,优化并行访问策略,提升系统应用效率。
(2)成果运行数据库,存取数据较小的成果数据,采用关系型数据库mysql,由数据管理系统提供统一服务接口,完成业务数据的交互。
3.4 數据可视化
数据展示部分为了适应不同终端的显示效果,界面布局采用响应式布局。按立法主题的不同设计对应的呈现风格,数据呈现应体现良好的设计效果和行业专业性,将数据的基本信息、相似性、冲突性等分析成果通过图形化和交互式动画效果等手段进行显示。
4 结束语
随着云计算、大数据、人工智能的高速发展,利用大数据和人工智能解决法律纠纷问题的越来受到人们的重视,针对传统的结构化系统的运行,系统数据处理速度慢、计算效率低下、准确度不高,提出一种基于大数据的立法智能分析平台具有较强的使用价值。为了满足人们对法律的咨询需求,还需立足法律行业、促进国家立法建设,服务人类社会,实现立法大数据的平台建设与长期服务社会。
参考文献
[1]张茜.论大数据时代我国网络服务提供者的法律责任[J].合肥工业大学学报(社会科学版),2018(08).
[2]张敏.我国大数据交易的立法思考[J].学习与实践,2018(07).
[3]张伟.医疗大数据平台数据高并发方案设计与关键技术分析[J].信息技术与网络安全,2018(04).