周晓蕾, 赵刚,李海燕,程晓鸣,黄诚欢
(1 中国移动通信集团上海有限公司,上海 200060; 2 中国移动通信集团公司,北京 100032)
随着网络技术的不断发展,互联网为我们检索信息、网上购物等一系列日常活动提供了极大便利,可以说成为了现代人生活中难以取代的一部分,可是却在无形中遭到一些不法分子利用。目前,互联网上淫秽色情信息泛滥,已经成为一种新型的社会公害。淫秽色情网站提供大量的淫秽色情图片、录像、电影、文字,对网络环境和未成年人的身心健康构成严重威胁。
在商业高度发展的今天,几乎所有的活动都与经济利益密不可分。同样,手机淫秽信息泛滥的主要原因也是为了牟取暴利。其中最明显最突出的利益链条莫过于广告利益链。据国家扫黄打非办公室公布的调查报告称,把淫秽色情信息包装成电信增值服务,通过手机用户购买获利,是各个利益主体的主要获利模式之一。同时,广告经营者和手机制造商协商在手机中内置吸费软件和非法淫秽网站链接软件是另外获利模式之一。无一例外的,这些不法分子通过传播手机淫秽色情信息,大发不义之财。
中国移动响应国家号召,对淫秽信息治理工作非常重视。目前中国移动已完成不良信息监测系统一期建设工作,实现了北京、上海和广东3个大区集中的人工审核,截至2011年8月底,已发现并封堵淫秽色情域名432831个,不良信息治理工作已经卓有成效。同时,重庆移动对于网站内容安全治理工作也十分积极,在IDC部署了低俗内容审计系统,把域名管理、网站备案状态信息、低俗文字及图片审计等一系列工作融入到了日常的运维当中。
中国移动的不良信息监测系统已建成3级架构,由各省采集设备、大区设备和中央设备构成,其中,大区设备负责管辖区域下的不良信息监控,分别在Gi接口、IDC出口、国内网间出口和国际网间出口进行旁路监测,并将监测到的不良信息URL地址及IP地址以黑名单的形式,通过中央设备上报给流控系统进行封堵/解封。
2.2.1 标准化问题亟待解决
通过实际的交流和调研发现,目前三大中心在多个工作环节的操作存在标准不清楚或标准不统一的情况,需要根据整体的管理要求和系统建设要求,为多项工作制定明确的标准。比较有代表性的有:“疑似”不良网站的判定标准、网站的解封标准、封堵验证的标准等。
2.2.2 封堵系统功能受限
目前,封堵系统由于容量受限,一方面需要增加投资给封堵系统进行扩容,另一方面可以考虑通过设定网站排名系统对网站的访问量、流量等进行排名,进而能够在封堵系统容量受限的基础上,根据网站的排名设定封堵优先级。
2.3.1 爬虫技术
网络爬虫是一个自动提取网页的程序,它为搜索引擎从Web上下载网页,是搜索引擎的重要组成部分,通用网络爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL列表;在抓取网页的过程中,不断从当前页面上抽取新的URL放入待爬行队列,直到满足系统的停止条件。利用爬虫技术爬取用户访问的页面,其优点是在前台不需要进行内容还原,减少了前台和后台分析的数据交互;并且在后期的人工/自动取证方面成功率较高。
2.3.2 协议还原技术
协议还原技术是前端数据采集关键技术之一,主要是对采集的数据进行基础协议解析及处理,并按照支持的协议范围,对数据中的文本、图片数据进行还原,获取其内容,同时需要解析出关联的URL域名、访问URL的源IP地址、目的IP地址、源访问端口、目的端口、访问时间、省份标识、采集点标识等信息以供后续处理。一般是指对用户的HTTP、WAP等应用协议的数据进行数据还原。
2.4.1 识别准确率很低
因为各种技术上的原因,导致了目前三大监测中心使用的监测系统发现的“疑似不良网站”的准确率都非常低,根据最新的统计数据分别为“4%”,“10.6%”和“3%”。过低的准确率,导致了人工审核的工作量大大增加,严重影响人工审核效率。进而,过低的准确率给落实“先封堵,后取证”的要求带来极大的困难。
2.4.2 封堵系统没有应用基于URL的封堵功能
目前,中国移动的封堵设备已经部署,但是针对基于URL的Web页面的封堵功能并没有全面采用。因此对一些大型的文库、图库网站,容易因为极少量的不良内容而造成整个网站的封堵或者迫于压力不方便进行封堵。
从技术上讲,基于URL的Web页面的封堵已经基本成熟,但是应用此功能,势必消耗更多的系统资源,更为迫切的要求对现有系统的处理能力进行升级。
3.1.1 精简人工操作部分
当前阶段,不良信息监管流程在多个环节中人工操作的比例非常高,而且从事的都是大量的重复化操作。人工操作是制约不良信息监管效率的瓶颈,全面精简人工操作在整个流程中的比例,是提高监管水平的关键。
根据分析,如果相关系统建设均到位,人的职责主要在于对于特殊网站的取证操作,对于自动处理完成的工作进行确认或抽检。
3.1.2 监测、拔测和封堵系统间的互动
监测系统适用部署在网络流量比较汇聚集中的链路上,例如IDC到核心网的链路、WAP网关的接入链路、BRAS的接入链路等。监测系统实时性好,数据全面准确,但相对于拨测系统来讲,监测系统设计比较复杂,项目投资规模较大。
拨测系统适用于特定的网站和主机扫描识别,目前主要应用于对封堵网站的封堵验证上,也可应用于其它方面,例如对分布较广的移动自营网站和CP网站频道进行扫描,对外省市移动网络进行扫描抽查等应用。拨测系统的优点是组网和系统设计简单,易于扩容,缺点是不能100%对目标网站内容进行抓取分析。
封堵系统在网络中常与监测系统共存,现行的成熟应用是对于黑名单网站、网址、搜索引擎特定关键词进行封堵。
3.2.1 动态IP、动态域名的不良网站封堵策略
对于同时使用动态IP和动态域名来变换身份的不良网站,直接针对其IP地址和域名进行封堵,容易使运营商陷入被动。IP和域名的组合变化,会大大降低运营商的封堵系统的效果,不得不频繁更新黑名单。因此,可以考虑从对提供动态域名的服务器入手,制定评估的策略。实际观察表明,为不良网站提供动态域名服务的服务器,往往在IP地址段和地理位置是具有较强的相关性。一旦在一台提供动态域名的服务器上发现一个不良网站,很可能意味着该服务器上同时还存在有多个使用动态域名的不良网站。所以,可以基于一定的组合参数,来对此类服务器进行信誉评估,一旦满足一定条件,直接对此服务器的IP地址进行封堵。
3.2.2 封堵技术的提高
一些国际网站的知名度比较高,即使出现了达到判定为不良网站要求的信息数量,也不方便直接封堵。一些文库或图库类的网站难免有一定数量的不良信息,完全封堵有些不尽合理。
另外,考虑到封堵系统的容量,对于一些流量极低的不良网站,不适宜采用直接封堵的方式。建议考虑基于客户端请求的内容健康性,引入基于源端IP的动态封堵功能,短时间内禁掉某个IP对某个网站的访问能力。该功能适合在Gi口引入。建议在封堵系统中全面使用基于Web页面的封堵技术。
不妨以处理时长、数量统计、处理效率、来源渠道4个维度作为KPI指标的衡量。其中,处理时长可以包含不良网站判定平均时长,人工审核平均时长,系统处理平均时长,系统封堵平均时长,正常与中标网站判断平均时长;数量统计可以包括中标网站数量,知名网站中标数量,封堵与审核网站数量,封堵域名与IP数量等;通过人均处理量、网站查准率和网站封堵成功率来衡量处理效率;在来源渠道方面,客户举报宗数,举报域名数,有效域名数,涉黄域名数,曾经、新增与二次封堵都能作为考量的项目。
每个大类中包含了详细的KPI指标,以全方位的衡量不良信息治理的建设情况,同时能够为今后的建设给出有力的数据支撑,能够通过对丰富KPI的分析,得出发展中存在的问题,亟待解决的环节,以及未来的目标等。
在手机淫秽信息治理工作上,三大运营商应该担负起社会责任,积极采取相应措施,如完善举报投诉受理流程,加强人工拨测力度,研发移动互联网淫秽色情信息监测过滤系统,清理不合规定的WAP网站等。
国内图像识别技术起步较晚,与国外相比基于内容的图像识别与过滤技术的研究处于刚刚起步阶段。同时,不良图像的识别准确率还有待提高。此外,对多媒体信息内容识别技术的研究项目也不多,特别是对网络文化安全及基于高级语义进行系统监控的研究。因此,加强产品研发、加大技术开发及创新的力度大有必要。
当前互联网用户的心理与行为表现很大程度上是由于其不负责任或者根本没有责任追究机制所造成的。因此,网络实名制作为一种以用户实名为基础的互联网管理方式,可以成为保护、引导互联网用户的重要手段和制度,并保护青少年免受网络不良因素影响。虽然在如何推行实名制和推行实名制涉及的范围等问题上还有争议,但是推行网络实名制应当是一个发展趋势。网络空间已经成为社会生活现实空间之外的另一个重要行为空间与逻辑空间。为维护一个健康安全的网络生活环境,促使每一个为网络使用者在使用网络的过程中严格的遵守网络行为规范,并为自己的网络行为负责,将实名制引入网络,在虚拟空间模拟现实社会管理,将是最快捷、最有效的网络健康安全管理的突破口。在网络中模拟现实社会的模拟,在网络推行实名制将增强个人行为的责任意识。
由于互联网是一个虚拟世界,它没有一个明确的边界,因而国内国际合作就显得尤为重要。从国内角度看,三大运营商之间的合作显得尤为重要,如果仍然保持各自为战的现状,势必会造成监管效率低下,标准不统一,这也不利于国家法律的制定与执行。站在国际角度上,各个国家都会面临网络淫秽信息治理的问题,对于国际间信息的共享就显得尤为重要,从内容上,监测出的非法网站列表就可以实现共享,从技术上,通过共享可以引入国外先进的监测技术,同时也可以向其他国家介绍我们采用的技术手段以共同实现网络信息的净化。例如巴西警方根据“EspiaMule”所搜集到的线索,组织了“Carrossl I”和“Carrossl II”两次行动,不仅取得了极大的成功,而且还成了其与国内外相关机构合作的典范。
总的来说,在手机淫秽色情信息治理工作上,技术和管理两个方面需要同步进行,除了加强技术研究和产品研发,更需要从明确责任、强化意识、合作交流、管理流程上进一步提升与完善,从而达到更好的治理效果。
[1] 陈萍主编. 3G时代治理手机有害信息分析与应对策略[R]. 北京: 北京电信规划设计院有限公司, 2010.
[2] 万晓春主编. 巴西打击利用互联网传播淫秽电子信息犯罪的举措[J]. 上海公安高等专科学校学报, 2010.
[3] 张宇润主编. 保护青少年免受网络淫秽色情信息影响的法律对策[Z]. 合肥:安徽大学法学院,2006.
[4] 周立柱,林玲主编. 聚焦爬虫技术研究综述[R]. 北京:清华大学计算机科学与技术系, 2005.
[5] 刘金红,陆余良主编. 主题网络爬虫研究综述[R]. 安徽:解放军电子工程学院, 2007.
[6] 覃安俐主编. 打击淫秽色情净化网络环境[R]. 成都:成都市公安局网监处, 2007.
[7] 罗意欢,叶俊清主编. 论淫秽电子信息犯罪最新展及其监管应对[R]. 广东:广东省佛山市南海区人民检察院, 2011.