论新型网络技术对电子数据证据的影响
——以“快播案”为例

2016-10-18 08:48杜翰洋
广西青年干部学院学报 2016年1期
关键词:视频文件数据挖掘证据

杜翰洋

(北京师范大学,北京100875)

论新型网络技术对电子数据证据的影响
——以“快播案”为例

杜翰洋

(北京师范大学,北京100875)

“快播”传播淫秽物品牟利案的庭审质证过程暴露了新型网络技术对电子数据证据的影响。这表现为:大数据时代使电子数据证据的收集效率低下,且电子数据易被篡改或删除;云计算技术使电子数据的存储分布碎片化,取证涉及数据管辖权问题。因此,在司法实践中不仅应提高取证的技术方式,而且应完善电子数据取证的相关法律制度。

电子数据证据;快播案;网络技术;大数据;云计算

前言

2016年1月8日,“快播”传播淫秽物品牟利案在北京市海淀法院开庭审理,由于庭审过程是网络直播,所以吸引了大批网民的关注。其中关于对作为证据的电子数据的提取鉴定问题,公诉方与被告方展开了激烈的质证。在质证的过程中暴露出了新型网络技术对电子数据证据的影响。

在最近10年网络技术爆炸式发展中,电子数据呈现出新的态势,而我国法律也对此作出了改变。《民事诉讼法》第63条规定“证据包括:(一)当事人陈述;(二)书证;(三)物证;(四)视听资料;(五)电子数据;(六)证人证言;(七)鉴定意见;(八)勘验笔录”。其中把电子数据作为一种证据类型单独列出来。《刑事诉讼法》第48条规定“可以用于证明案件事实的材料,都是证据。证据包括:(一)物证;(二)书证;(三)证人证言;(四)被害人陈述;(五)犯罪嫌疑人、被告人供述和辩解;(六)鉴定意见;(七)勘验、检查、辨认、侦查实验等笔录;(八)视听资料、电子数据”。其中电子数据加入了第八项。

新型技术的产生必然带来新的挑战与机遇,电子数据是现代信息技术的产物,随着越来越多的案件涉及网络社会,电子数据作为证据的地位在不断提升[1],面对电子数据证据对我们现存证据制度所造成的极大冲击,我们对电子数据证据的认知必须提高到一个新的水平。

一、大数据时代的“快播案”

大数据指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产[2]。大数据时代有以下四个特点:

第一,数据量大,随着人们日益丰富的网络生活和网络工作需要,数据规模越来越大,处理难度也是越来越大。如今,数据量已经从TB(1024GB=1TB)级别跃升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)级别。现在只要几天就可以创造出21世纪之前所产生的数据总量。

第二,类型繁多,数据内容包括网络日志文档、音频文件、视频文件、图片文件、地理位置定位信息等等。

第三,价值密度低,随着互联网在各个领域的广泛应用,随之有海量信息的产生,但是所产生数据的价值密度普遍较低。

第四,速度快时效高,这是大数据区分于传统数据挖掘最显著的特征。

在“快播案”中,虽然公诉方只获取到了快播公司托管的四台服务器,但是从上述服务器中的三台服务器里竟然提取了29 841个视频文件需要进行鉴定,而认定其中属于淫秽视频的文件为21 251个。如此大的数据规模,处理的难度是非常大的。传统证据一般需要相当准确地收集与案件相关联的证据,可能收集与案件相关联的或有助于证明诉讼程序的事实、法律和其他情形的。而在“大数据”时代,很多案件收集与之相关联的电子数据需要动辄几个T甚至几百个T的数据,这需要消耗极大的人力物力来收集全部与之相关的证据。因为电子数据的价值密度降低,真正对案件有重大价值的可能只是几个数据流。

在“快播案”中,鉴定人为了鉴定这29 841个视频文件,花费了大量的时间对每一个视频进行观看,而鉴定人一天最多才观看了800个视频文件,无法有效地提高鉴定的效率。为了能更高效获取质量更高的证据,就要通过技术手段创造出更高速的机器算法以便于对电子数据的价值“提纯”——数据挖掘。但这可能造成新问题,这就是通过大数据挖掘获得的电子数据证据,有一定机率会脱离其所在的语境,而电子数据证据很有可能被错误地理解。

在“快播案”中,公诉方只查获快播公司托管的服务器4台,且只有3台服务器里提取出了能作为证据的视频文件29 841个,而实际上快播用作存储的服务器远不止四台,视频文件也不止3万。这反映了一个问题,如果当事人掌握和控制了电子数据证据本身,并且获得保存或者修改的权限,那么就很容易收集到相应的证据。另一方面,假如对方当事人或者有关或者无利害关系的第三人控制了相关的电子数据证据,或电子数据证据无法有效保存甚至被销毁删除,则收集电子数据证据会更为不易。在大数据时代的背景下,电子数据的控制者通常同时享有电子数据的所有权和管理权限,因而其他当事人就很难获得相应的电子数据证据。

在该案中,因为公安机关并不完全具备处理这类电子数据证据的能力,所以由文创动力公司负责对电子数据证据进行采集并转码。这涉及到电子数据证据采集的问题,假如要收集与案件相关联且有价值的电子数据证据,这就需要当事人具有获取和挖掘数据的能力,而这也对当事人提出了更高的技术能力的要求,同时还要求能顺利地进入服务器的数据库,这使得大部分人无法完成如此的任务。而掌控电子数据证据的当事人可能为了利益出发而对证据销毁或篡改,防止自己被追究责任,而基于电子数据的特点,它相对于其他传统证据更易销毁和篡改。在科技迅猛发展的今天,必须建立完善的安全体系,不然相关电子数据证据极易受到修改和删除,这样会使电子数据证据的真实性大大下降,案件事实可能会很难查清,甚至可能会造成是错误判罚的风险。如果真的如此,当事人则有可能因欠缺相应的电子数据证据而败诉。在该案中,公诉方只查获快播公司托管的服务器四台,而且有一台服务器因为损坏而无法提取电子数据证据的情况更加证明了电子数据容易销毁和篡改。

大数据的预测功能在“快播案”类型案件对电子数据证据的收集可以起到一定的作用。大数据的解读需要通过数据挖掘来获得,这有可能会大大降低人类脑力劳动的负担。大数据分析不仅具有让电商向用户推荐商品的功能,而且还具有识别犯罪、获取证据的作用。而大数据挖掘为电子数据证据收集提供了技术方案。通过对大数据的数据挖掘来找到电子数据证据“连接信息点”可以作用在防治类似“快播案”这类传播淫秽物品案件。通过查看用户的观看记录,公安机关分析这些观看记录和上传淫秽视频的网站之间的关系,找出这类淫秽视频观看者的一个固有搜索模式,当这类淫秽视频被观看时,或淫秽视频网站意图上传淫秽视频时,公安机关会通过中介服务器搜集到处于这个模式的信息,进而标记淫秽视频网站甚至找出上传者。

二、云计算技术对“快播”类案件获取证据的影响

云计算是基于互联网相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源[3]。大数据需要依托于云计算的分布式计算架构,因为大数据理论上是无法只用一台计算机来进行处理的。云计算的分布式处理、分布式数据库、云存储和虚拟化技术对大数据的海量数据的挖掘有决定性作用[4]。

云计算的发展一定程度上加速了对电子数据证据挖掘的效率,同时云计算正在广泛作用于云存储服务,使大量的电子数据从个人计算机同步到了云存储,为电子数据证据的保全留下新的途径,越来越多的证据将保存在云存储之中。

“快播”视频播放自动加速服务的技术原理所采用的就是云计算技术。

第一,快播公司根据视频的点击播放频度设定指标,当某视频达到该指标时,快播视频播放系统自动将该视频资源上传至加速服务器内储存。

第二,加速服务器存储视频的目的和用途,是为了提高在线播放服务的质量,而不是直接用于传播视频资源,因为它们是经过加密处理的,不能使用任何普通播放器(包括快播播放器软件)直接播放。

第三,加速服务器存储的视频资源只能为其所在的运营商的用户提供加速服务,而不是为整个互联网的所有用户提供加速服务。

第四,加速服务器上的视频资源并不是在任何情况下都发挥加速服务的作用,只有在互联网上的视频资源不能保证流畅播放的情况下,才会自动调度加速服务器上的视频资源,一旦互联网上的视频资源能够保障流畅播放了,将不再调度加速服务器上的视频资源。

而基于云计算的工作原理,电子数据一般都被分成很多碎片化文件分别存储在云存储当中,电子数据一般不保存在一个特定的服务器上,有时候甚至用户端也没有完整的数据文件,这也使得采集完整的电子数据证据变得十分困难。如果电子数据证据不完整,可能会直接影响到它的证明能力的有无和证明力的大小。如果该电子数据证据不具有完整的证明力,为了能证明案件的真实情况,那就需要其他证据用以帮助证明[5]。

快播公司视频播放自动加速服务会让视频文件被分成很多缓存碎片化文件,存储在不同的服务器中,而这些缓存文件在云计算环境下会与其他用户的数据混在一起,这也使得可能成为电子数据证据的文件在储存或传输过程中易被污染,而且使得在某个特定服务器中的数据呈现复杂性[6]。这有可能会让数据的安全性大大下降,并会导致当事人所取电子数据证据的原始性、完整性和有效性受到冲击。所以就必须通过云计算获取分布在服务器当中的数据,使之恢复完整的文件形态,如果不通过文创动力开发的特定程序,就无法读取服务器当中的数据,那就更加不可能进行鉴定工作了。

其实,这次公安机关获取4台服务器并对其中的数据具体分析和数据恢复还是属于比较传统的电子数据鉴定方法。而快播公司的大量数据已与传统的存储方式不同,其主要通过云计算使得数据在网络中进行存储,而快播公司是不能控制甚至不知道这些数据的具体存储位置,其也可能存储在国外的服务器当中。在“快播案”中,虽然公安机关获取了快播公司的4台服务器中3台服务器的数据,但实际上有大量的缓存碎片化文件分布在国内很多台服务器甚至国外的服务器中,而这种跨区甚至跨国储存的情况,就是在云计算环境下分布式系统处理数据的常态。这有可能会涉及极其复杂的管辖权问题,数据传输存储在不同国家,而每个国家又有不同的法律规定,如何有效合法地跨国取证将是一个难题。

三、“快播案”对电子数据证据收集的启示

无论技术如何更新换代,还是必须坚持全面客观地收集电子数据证据的原则[7]。大数据时代的到来,导致需要收集的电子数据证据的量在不断增加,这使得全面收集电子数据证据的难度加大。再加上云计算致使电子数据碎片化,数据的来源越来越复杂,而且它极其容易被污染和删除,这大大增加了收集完整证据的难度。在“快播案”中,控方所提供的证据大部分来源于那4台查封的服务器,而这4台服务器只是提供了部分淫秽视频文件来作为证据,控方并没有提供关于这些视频与快播公司有所关联的证据,大部分证据只是停留在表明,而并没有深入其中。我们必须通过数据挖掘,找出更加深层的电子数据证据,用以证明快播公司与淫秽视频之间的关系。所以还是必须坚持全面客观地收集电子数据证据这一原则,保证案件可以形成完整的证据链。

将传统收集证据的技术与新型技术相结合,增强收集电子数据证据的技术能力。从“快播案”来看,公诉方收集证据还停留在传统地扣押存储源,再提取电子数据证据的阶段,并没有通过网络技术挖掘云端服务器的方式获取电子数据证据。这样不但耗费人力物力,而且很可能无法获取更为深层次的证据。现阶段公安机关需要提升收集电子数据证据的技术能力,不但需要与新型网络技术的公司合作,还需要培养和招入该技术相关的人才。在还未形成有效处理该类型案件的技术团队前,可以积极寻求掌握该类技术的相关专家帮助,甚至可以在案件庭审时申请专家证人。

在新型网络技术快速发展的趋势下,应尽快制定关于电子数据证据收集的相关程序法律,以及公安机关通过对大数据挖掘推测犯罪行为的相关程序法律。新型技术在不断的发展,虽然法律具有滞后性,但是我们还是需要对这类收集证据的行为进行程序上的规制,不能出现无法可依的尴尬境地。

结语

对这起“快播案”不论判决结果如何,至少说明在大数据时代,电子数据证据面临了极大的挑战。现阶段不仅要继续坚持运用传统的证据收集方式,还需要运用新型技术来加强获取电子数据证据的能力。我国应掌握大数据时代电子数据证据的技术特点,不单单在技术层面上提高取证的方式,还要制定和修改关于对电子数据证据提取的法律法规,建立和完善电子数据证据的制度,使得在新型网络技术之下也能有效地获取相应的电子数据证据。

[1]迈尔-舍恩伯格.大数据时代[M].盛扬燕,周涛,译.杭州:浙江人民出版社,2O12.

[2]李学军.电子数据与证据[J].证据学论坛,2OO1,2(1):433.

[3]尹丹.电子数据司法鉴定技术的发展与挑战[J].计算机科学,2O11,11(6):S4.

[4]何晓行,王剑虹.云计算环境下的取证问题研究[J].计算机科学,2O12,39(9):1O5.

[5]王敏远,祁建建.电子数据的收集、固定和运用的程序规范问题研究[J].法律适用,2O13,25(12):23.

[6]秦小梅.电子数据研究[D].杭州:浙江大学,2O13.

[7]张雷.电子数据及其适用规则研究[D].南京:南京大学,2O13.

(责任编辑:陈梓馨)

D915.13

A

1008-5254(2016)01-083-04

2O16-O1-O2

杜翰洋(1937-),男,壮族,广西南宁人,北京师范大学法学院诉讼法学专业2O13级硕士研究生,研究方向为诉讼法学。

猜你喜欢
视频文件数据挖掘证据
流媒体视频文件相似性识别的方法
随心定制视频文件的缩略图
探讨人工智能与数据挖掘发展趋势
快速检索,抓取电影中的精彩篇章
基于并行计算的大数据挖掘在电网中的应用
对于家庭暴力应当如何搜集证据
手上的证据
一种基于Hadoop的大数据挖掘云服务及应用
手上的证据
“证据”:就在深深的水底下——《今生今世的证据》“读不懂”反思