网络安全与法治:关于网络“爬虫”行为的法理思考

2022-11-22 06:27:33徐云梦
法制博览 2022年16期
关键词:爬虫正义规制

徐云梦

中南民族大学法学院,湖北 武汉 430074

随着信息技术的发展和普及,信息化在个人生活、国家安全、网络生态等诸多方面,产生了影响历史进程的改变。信息数据已然成为国家发展的重要战略资源。[1]近年来,在数据采集、传输、存储、应用程序以及基础环境等各个层面,信息系统饱受着非法访问、信息泄露、黑客攻击等一系列问题的侵蚀。这种现象引发了笔者的一些思考。

一、网络“爬虫”的定位

(一)网络“爬虫”的释义

网络“爬虫”,又称网页蜘蛛,是一种搜索引擎;它可以自动浏览互联网的程序代码或数据信息。搜索引擎的网络站点,在“爬虫”技术的帮助下,对自身网站的内容或其他网站的索引,进行更新迭代。

网络“爬虫”的身份识别,是以超文本传输协议(HTTP)中的用户代理字段为媒介,来向网络服务器表明其身份信息。网络中介员通过用户代理的字段,以及网络服务器的浏览记录,来辨认每一个到访的“爬虫”及其访问频率。其中,用户代理字段可能会包含一个可以获取“爬虫”更多信息的统一资源定位系统。然而,某些恶意的网络“爬虫”并不会在其爬取轨迹中,留下任何与用户字段相关的内容;恶意“爬虫”或许会将其身份伪装成容易被信任的知名“爬虫”。[2]故,“爬虫”的身份识别显得尤为重要。

(二)网络“爬虫”的发展背景

社会信息化的迅猛发展,给网络“爬虫”的“野蛮生长”提供了庞大的温床。传统通用搜索引擎在发挥其检索信息辅助功能时,用户享用了便捷的互联网端口及其数据。“爬虫”技术,是搜索引擎技术的核心元素之一;它的发展历程走过了20余年,其形式亦随时代的更迭而趋向多元化,并广泛被运用于数据分析、搜索引擎、人工智能等智慧领域。[3]

网络“爬虫”在发展过程中,“善意爬虫”和“恶意爬虫”的两极分化日趋明显。“善意爬虫”(如搜索软件)给用户查阅所需信息带来了便利,而“恶意爬虫”(如抢票软件)对其扫描的网站(如购票网站等)频繁侵扰,造成了服务器瘫痪或崩溃的风险。[4]出于利益的考量,每一只“恶意爬虫”背后,都是一条真实而强大的利益链条。根据网络采访调查,Akamai大中华区产品市场经理曾指出,“爬虫”攻击会经历初始防护阶段到攻击阶段的演进历程。

谈及近年来的“爬虫”技术发展,受利益驱动,“爬虫”攻击的趋势在增强。根据“2020年互联网安全状况报告”显示,“爬虫”攻击呈现出以下趋势:第一,攻击次数居高不下;第二,攻击手段越发复杂;第三,金融业已成为攻击重灾区。

二、网络“爬虫”对法治社会的影响

法治社会是一个动态运行体系,网络“爬虫”技术对于法治的影响遍及法治社会运行的各个环节,包括立法、法律实施以及公民法律意识等。

(一)网络“爬虫”对立法的影响

“科技成果一旦开始应用于生产领域,种种新的社会关系就会相继出现,法律问题也就接踵而至。”[5]网络“爬虫”在立法方面的影响,主要体现在立法活动上。一方面,网络“爬虫”对社会机制运行带来的危险,催生了新的立法领域。例如,2020年5月28日,国家互联网信息办公室就《数据信息安全管理办法(征求意见稿)》公开征求意见,这是我国数据安全立法领域的里程碑事件。它回应了以网络“爬虫”为主要代表的自动化数据收集技术被不当利用后产生的一系列问题。另一方面,“善意”的网络“爬虫”为立法活动机制的高效运行提供了有力的技术支撑。网络“爬虫”通过合法形式获取的大数据,为立法活动提供了庞大的立法技术规范群,提高了法律规范的科学含量。

(二)网络“爬虫”对法律实施的影响

网络“爬虫”技术对法律实施的影响集中体现在司法领域。一方面,司法的过程不断吸收新的科学技术方法,将之用于案件事实认定和裁判之中。另一方面,以新兴技术发展为依托,司法方法不断实现自我创新。由此可见,人机系统立足于“人、机功能互补”的历史实践,搭建了数据信息技术与人的脑力活动方面的沟通桥梁,解放了人的脑力劳动,服务了国家的法治建设。[6]

(三)网络“爬虫”对公民意识的影响

网络“爬虫”技术中的恶意“爬虫”行为,映射了其应用过程中的法律风险。法律风险改变了公民的法律观念;其体现在意识层面,包括了数据正义观、代码正义观以及算法正义观。[7]

一是数据正义观的构建。互联网上的信息与数据,面临着海量的浏览和应用。数据连接的各端口的应用者们,形成了一个庞大的实施权利与承担义务的群体,继而衍生了对数据权利与义务的分配和隐私保护等问题。公民需要克服偏见与信息差的影响,形成适应数据时代的正义观。

二是代码正义观的形成。“代码就是法律”[8],人类在计算机时代下达指令的方式与早前有所不同:编码成为指挥计算机完成工作的指令符号。商业利益和政府管理模式的代码化圈定,会让服务对象的话语权被削弱甚至缺失。这无疑会制造和加剧社会等差与不公平。建立甚至重塑代码正义显得尤为重要。

三是算法正义观的加强。“算法定义经济”“算法统治世界”成为当今社会时代文明的一个发展趋势。而算法正义已经直接影响商业交易和社会关系的重要问题,并加剧着社会分化。在数据、代码和算法联合过问日常生活中诸多事务的背景下,传统的法律价值面临崩塌的风险。

(四)网络“爬虫”对网络生态的影响

作为网络生态系统中的一员以及中立性的计算机技术,法律从来没有禁止过“爬虫”技术的发展。然而,“爬虫”技术获取信息和数据方式的特殊性与隐秘性,使其在过滤敏感数据时,容易疏忽爬取红线的甄别,最终陷入法律禁区。因此,网络“爬虫”技术面临可持续发展的时代要求。

三、法律对网络“爬虫”的规制

(一)通过法律变革来规范网络“爬虫”行为

法律变革是社会变革的应有之义。[9]面对错综复杂的监管模式和发展格局,建立一套宏微有别的互联网规制模式,显得尤为必要。

一是规制精细化。“互联网的程序、协议和平台并不是和规制分离的,它们本身就是规制的一部分。”[10]“爬虫”这类网络新技术,实现了大规模数据的精准分析、算法建模的多元化,丰富了“定制化”交易关系,建立了“量身定制”商业模式等。而宏观上,国家法律为网络上自主的机制提供了指引、督导和协调作用,其采取的追惩制,体现出社会治理的民主性、灵活性和创造性。

二是正义场景化。普遍且抽象的逻辑化网络场景中,对特定情形、地域和对象的数据分析、程序构建等,成为一种网联的发展趋势。[11]传统法律价值的呈现,有赖于主体责任和权利伦理的承载;尽管正义原则发挥着指导作用,具体的正义和权衡还是有赖于具体情境的实现。故法律正义观的场景化是社会治理的一个重要动力和支撑。

三是,治理平台化。作为平台经济的重要载体,平台发挥着商业交易的媒介作用、社会秩序的治理作用、经济发展的过渡作用。“政府和商务共同推动,正在构筑一种能够实现最佳控制并使高效规则成为可能的架构”,以达到对商业交易和社会秩序的有效规制。由此,平台治理为公权力的扩张设置了一种制约机制,而法律规范应构建多元互动的规制方式。

(二)法制预防网络“爬虫”引发的社会问题

大数据时代的信息革命,给人类带来了超过以往任何时代的想象和创造空间,它将使我们都被算法定义为“数据人”。这种网络环境下的认知,正如王天一先生在《人工智能革命——历史、当下与未来》一书中所言:“人类变成了制定规则的上帝,所有伴随人类进化历程中的既定经验与认知沉淀将遭遇颠覆性的挑战。”[12]

网络“爬虫”引发的社会问题,目前仅限于非法抓取信息的网络“爬虫”行为;该行为对数据的截取、复制和删改等滥用。一是技术方面:过于野蛮的“爬虫”可能造成网站负荷过大(尤其多线程“爬虫”),从而导致网站瘫痪、不能访问等;二是内容方面:网络“爬虫”可能导致网站所有人丧失对自己网站数据的控制权,例如有的数据是网站所有人不愿被他人获取的,或者如果网站数据来源付出了较大代价,却可能因为网络“爬虫”轻易大量被他人获取;三是结果方面:网络“爬虫”还可能造成他人数据被不正当地复制、使用。网站数据如果涉及他人个人信息,还可能因网络“爬虫”导致数据大量被他人未经数据主体同意而获取,从而伤害其利益。

四、网络“爬虫”推动法治进程

(一)法律是调整网络秩序的重要规范

法律与科技是相辅相成的。互联网作为信息技术革命成果的最佳体现,深刻影响和改革着人类生活的方方面面。党的十九大会议思想强调,要建设科技强国、网络强国、数字中国、智慧社会;要建立网络综合治理体系,营造清朗的网络空间;人类面临着诸多共同的挑战,其中包括网络安全等非传统安全威胁持续蔓延。法律在维系现实社会秩序方面发挥着重要功能,自然也是能够成为调整网络秩序的重要规范。具体体现在以下两个方面:

第一,通过法律保障公民理性的网络表达权,净化网络环境文化,加强网络维权意识。表达权是民主社会的根基,是个人发展与社会进步的基本条件之一,但是网络表达的自由也应受到法律的规制。恶意“爬虫”技术的应用,起到了极大的“数据动力源”的作用。例如,微博常常是恶意“爬虫”的重灾区。

第二,通过法律保障公民构建安全的网络经济活动环境。建立安全的网络经济活动环境,依法进行打击非法的网络“爬虫”行为,保护个人信息安全和国家信息安全。例如,《民法典》一千零三十四条至一千零三十八条,分别对个人信息的界定、个人信息处理的原则和条件、处理个人信息的免责事由、个人信息主体的权利、信息处理者的信息安全保障义务这五个方面进行了明确的规制。这体现了新时代《民法典》对隐私权和人格权的法律保护,在一定程度上扩大了规制对象的范围。[13]

(二)构建网络社会的法治秩序

“某视频软件侵权案”的判决中有一句话令人印象深刻:“技术本身的中立性与技术使用者的社会责任、法律责任的关系,实质上反映了技术使用方式对社会发展起到了推动作用还是阻碍进步的作用。”[14]诚然,如果一项技术的使用给某一群体带来了直接的好处,那么相应的代价与责任也应当由其承担。人们面临的各种技术环境问题,其实正是技术中立与放任主义结出的果实,只不过当评价者持批评态度时,我们的话语权便成了“先发展后治理”。

为了避免走“先发展后治理”的老路,杜绝以种种看似合理的辩解理由,来合法化涉嫌违法的数据抓取行为。法治框架下的爬取行为,需要注意以下几个方面:

第一,网络信息技术运用者在民事主体资格上的问题;第二,通过网络“爬虫”技术生成的作品涉及著作权等知识产权上的问题;第三,智能信息系统使人遭受损害的侵权责任问题;第四,公民的网络信息保护所波及的人格权问题;第五,面向未来的法律、政策、伦理制度等方面的构建问题。

五、结语

英国前最高法院院长戴维·埃德蒙德·纽伯格勋爵曾这样说道,“法治是文明社会的基石,由于科学在诸多领域内不断发展、深远探索,科学家们应当了解相关法律规则,指导自己工作的适当法律界限。此外,同样重要的是,法律人要熟悉科学的发展情况,法律需要跟上技术发展的步伐。”

网络信息技术的运用,需要我们踩稳“平衡木”;兼顾数据开放共享、数据所有者经营安全和社会公共利益,以确保数据依法有序自由流动。宏观层面,国家策略应与世界信息网络发展趋势相结合。微观层面,网络数据技术的运用者以及信息技术的受众需要提高自身的法律意识。

猜你喜欢
爬虫正义规制
利用网络爬虫技术验证房地产灰犀牛之说
基于Python的网络爬虫和反爬虫技术研究
主动退市规制的德国经验与启示
南大法学(2021年4期)2021-03-23 07:56:10
从出文看《毛诗正义》单疏本到十行本的演变
天一阁文丛(2020年0期)2020-11-05 08:28:16
保护与规制:关于文学的刑法
刑法论丛(2018年4期)2018-05-21 00:44:30
利用爬虫技术的Geo-Gnutel la VANET流量采集
电子测试(2018年1期)2018-04-18 11:53:04
大数据环境下基于python的网络爬虫技术
电子制作(2017年9期)2017-04-17 03:00:46
论《反不正当竞争法》的规制范畴
法治研究(2016年4期)2016-12-01 03:41:40
有了正义就要喊出来
山东青年(2016年3期)2016-02-28 14:25:49
倒逼的正义与温情
中国卫生(2015年4期)2015-11-08 11:15:50