暗网与信息孤岛

2017-09-30 22:26邱元阳
中国信息技术教育 2017年17期
关键词:暗网爬虫信息量

邱元阳

如果说计算机的出现是一种革命,那么信息时代就是这个革命的结果。而且这个过程还在迅速进行和演化,并且时刻都在产生新的信息。虽然信息不一定能够全部量化,我们还是能够估计出已有信息量的大致量级(ZB级),并且可以发现信息量的积累在呈几何级数增加。

在互联网的催化下,这些庞大的信息和数据遍布各地,并能部分地实现索引和查询。伟大的搜索引擎诞生之后,信息的获取似乎变得轻而易举,甚至我们不想让别人知道的信息,都可能无法完全隐藏。“信息爆炸”的概念不仅体现在信息的增加速度上,也体现在信息的获取速度上。

大数据和云计算的发力,更使得信息的可用性得到充分发挥,似乎只要有了网络,世界就在眼前,所有需要的信息都唾手可得。然而有一天,当我们翻遍网络也找不到需要的东西时,这才发现有些信息我们是看不到的,或者说,是我们搜索不到的。

实际上,我们还是高估了搜索引擎那个爬虫程序的能力。先不说通过技术手段对网络内容进行的屏蔽,即使不进行任何屏蔽和过滤,网络上有些内容我们也是不能直接看到的,搜索引擎已经无能为力。网络上有些故意隐藏的信息需要通过特定的动态请求才能连接和显示出来,而标准的搜索引擎却无法对其进行查找,这就是暗网。

暗网(Dark Net)也称为深网(Deep Web)、隐藏网(Hidden Web),这三个名称也可看作是暗网逐级递进的三个层次。它的形成可能是网站不规范而无法被爬虫识别,或者出于版权保护不愿意被搜索引擎抓取,但更多的则是通过特定的协议和加密规范来建立的网站。

由于暗网的隐藏和匿名特点,不会被法律约束,这个黑暗的世界成为非法电商、黑市、暴力、色情、赌博、邪教、恐怖组织等众多不良网站的安全栖身之所。比如,已被端掉的最大黑市交易平台“阿尔法湾”就身处暗网进行毒品、军火和杀人交易,同类的非法交易平台“汉萨”在暗网上位居第三,“丝路”成为暗网中的亚马逊。章莹颖失踪案的犯罪嫌疑人克里斯滕森也曾经常访问暗网“绑架101”网站。

具有讽刺意味的是,暗网这一令美國FBI、DEA和NSA头疼而又无法监管的技术怪物,正是美国军方一手缔造的。方便间谍活动的在线匿名和线人隐私保护的初衷已经完全脱离了技术控制,“洋葱路由”协议和Tor(The Onion Router)项目代码流出后,诞生的暗网与最初的愿望背道而驰,逐步发展为罪恶的天堂,成为人性深处的阴暗狂欢。

相对于暗网这一“深层网络”来说,我们能够看到的“表层网络”只是信息海洋的冰山一角。但是不能被搜索引擎索引的网络,也不都是暗网。比如淘宝等电商网站,内部数据是搜索引擎搜索不到的,但它仍是公开透明和可以直接访问的。

虽然信息的获取已经极为方便,但还是有无法满足的时候。一方面,很多我们希望保护的信息都会泄露到网上;另一方面,有很多我们想要得到的信息却无从查找。而有些领域,又与外界互不连通,成为一个个信息孤岛。

信息孤岛常指功能不关联、信息不共享的计算机应用系统。从特点上看,暗网也可看作是一个庞大的信息孤岛,它真实存在而又与“明网”互不相通。如果能打开二者之间的通道,暗网的诸多问题就会迎刃而解。然而这并不容易,就连NSA也觉得不可能完全揭开Tor用户的真实身份。

但是,Tor并不是黑恶之源,阴暗需求才是暗网土壤滋生罪恶的源头。endprint

猜你喜欢
暗网爬虫信息量
东南亚暗网犯罪态势及国际执法合作
基于Python的网络爬虫和反爬虫技术研究
嗅出“暗网”中隐匿的犯罪信息
暗网
Python反爬虫设计
被“暗网”盯上的年轻人
基于Scrapy框架的分布式网络爬虫的研究与实现
谁抢走了低价机票
浅谈班班通在初中化学课堂教学运用中的几点做法
走出初中思想品德课的困扰探讨