省级基础电信运营商互联网不良信息治理实践浅谈

2022-10-20 09:35周仕开
电子元器件与信息技术 2022年8期
关键词:网页运营商基础

周仕开

中国电信福建公司,福建福州,350001

0 引言

互联网不良信息治理并非一个新话题,多年来,社会各方在互联网不良信息治理方面持续开展研究和探索。基础电信运营商作为互联网基础设施建设的主力军和互联网应用的主要推动力量,始终积极参与互联网不良信息治理的研究与实践。近年来,随着治理环节的逐步前移,省级基础电信运营商也开始逐步建设相关能力平台,建立常态化治理运作机制[1]。

本文从省级基础电信运营商视角,对互联网不良信息治理的研究与实践作了粗浅的探讨,为社会各界提供参考。

1 我国互联网发展的现状

基础电信运营商持续推动我国互联网基础设施建设,为互联网大发展打下坚实基础。“十三五”期间,我国建成了全球规模最大的信息通信网络,为互联网产业腾飞和数字经济繁荣发展创造了条件。截至2021年12月,我国光纤接入用户总数已达5.06亿户(占固定宽带用户的94.3%),移动电话用户总数16.43亿户,其中4G移动电话用户10.69亿户,5G移动电话用户3.55亿户。

根据中国互联网信息中心(CNNIC)发布的第49次《中国互联网络发展状况统计报告》,截至2021年12月,我国网民规模达10.32亿,较2020年12月增长4296万,互联网普及率达73.0%。有手机上网习惯的手机网民规模约为10.26亿,在网民中的占比高达99.7%。互联网已经成为我国各行各业以及寻常百姓的主要信息交互媒介,在国民经济发展中起着不可或缺的重要作用。

2 本文探讨的范畴

通常而言,互联网不良信息是指对互联网安全、社会运行秩序、大多数网民的利益构成严重威胁的信息内容。但不同国家对于互联网不良信息的定义又有所不同,就国内治理实践而言,最为泛滥的互联网不良信息主要是涉黄涉赌信息,本文所指互联网不良信息治理对象即主要为以下两类。

3 互联网不良信息的危害

互联网不良信息继承了传统的不良信息传播的所有危害,是互联网高度普及背景下的犯罪新形式。

3.1 网络涉赌的危害

3.1.1 违法行为隐蔽性强,查处难度大

违法分子为逃避国内执法部门的打击,通常将服务器架设在境外,与国外不法集团相互联系,同时在国内寻找和发展代理人进行网络运营。网络数据更新频繁,打击此类行为对技术要求较高,再加上国内外的认定不同,有些国家和地区甚至将此类违法活动为了逃避罪责,作了非罪化处理,进一步加大了我国司法机关在跨国侦查办案时的取证难度。

3.1.2 往往以集团模式出现

此类违法体系性很强,组织严谨、层级清晰,一般包括网络搭建、规则制定、人员组织、金融服务以及宣传等部分,其严密性与传销组织无异[2]。

3.1.3 运营高效、参与门槛低

参与非常便利,参与人员只要在代理人处获得网站的账号和密码,便可以随时随地参与。成百上千人背后往往仅有几台甚至只有一台电脑进行操控,赌资通过第三方支付平台进行流转。这些便捷性和高“安全性”,助推了此类违法行为的泛滥。

3.1.4 涉案资金巨大,严重破坏了我国金融秩序

相较于传统,新型网络违法行为往往涉案资金巨大,在已查处的案件中,涉及资金为百万、千万金额的案件在某种程度上都属于小案,这严重破坏了我国金融秩序。

3.1.5 严重影响青少年身心健康

青少年是使用互联网的活跃群体,同时也是社会经验不足、思想不成熟的人群。在查处的案件中,有很多初中生、高中生参与其中。据某少管所统计,因参与其中而导致犯罪的青少年约占总人数的32%,严重侵蚀着青少年的身心健康,对社会的危害已经触及国家根基。

3.2 涉黄信息的危害

3.2.1 败坏社会道德与风气

网络不良信息长期泛滥,严重影响了网民的道德观、价值观,不道德的观念被当成理所当然,久而久之会使得全社会处于一种不良的环境中,败坏社会的道德与风气。

3.2.2 引发犯罪行为

不良信息本身就具有巨大危害性,人们在此类信息的长期腐蚀下,会失去传统观念,引发犯罪。许多网络不良信息的发布者为了获取更多经济利益,会发布更加危险的内容来吸引人们的目光,诱导人们一步一步走向极端,增加社会犯罪率。

3.2.3 危害青少年的身心健康

根据2016年共青团中央发布的首份《互联网不良信息对青少年的危害分析白皮书》显示,近80%的未成年人通过电脑、手机等接触过不良信息。青少年处于青春发育期,他们的意识正处于懵懂状态。内心的叛逆,加上我国文化观念相对保守,使得网络不良信息对他们极具诱惑力。青少年沉迷于此,会偏离人生正确的轨迹,甚至走上犯罪道路。

4 基础电信运营商的治理实践

近年来,基础电信运营商持续开展互联网不良信息治理工作,取得了显著成效。

4.1 持续开展垃圾短信治理,阻断互联网不良信息的短信传播渠道

2008年,由工信部牵头,三大基础电信运营商联合开展垃圾短信息整治专项行动, 依法严厉查处群发垃圾短信息的信息服务业务经营者,清理了一批擅自滥发违法有害短信息内容的短信端口、手机服务、群发设备,有力遏制了垃圾短信泛滥态势,短信息服务环境明显净化。

2009年,三大基础电信运营商签订《关于网间垃圾短信联动处理框架协议》,制定了各基础运营企业联手处理跨网垃圾短信的具体合作流程。协议的实施,加强了基础运营企业的协同配合,切实解决了网间垃圾短信息的滥发问题,进一步巩固了垃圾短信治理成果,有效保护了电信用户的合法权益。

2012年,再次组织开展端口类短信群发业务清理整顿专项行动,包括利用基础电信企业自有端口和行业类应用端口、信息服务经营者自有端口和个人通信号码(含小灵通号码、手机号码和固定号码等)开展的经营性群发垃圾短信的行为得到了有效整顿。

4.2 持续开展互联网“扫黄打非”,净化互联网空间

2005年、2009年基础电信运营在工信部统一组织下,对代收费行为进行整顿规范,与代收费合作伙伴签署信息安全承诺书,强化对内容管理责任的落实,坚决杜绝与手机网站采取合作分成方式传播不良信息。

2009年,基础电信运营商配合全国“扫黄打非”办公室,针对手机网站制作、传播不良信息活动不断蔓延的情况进行了专项治理。打击为手机不良网站提供网络接入、建站、增值服务、广告推广、代收费等服务内容,整改关闭违法违规网站3.3万个,斩断手机不良网站背后的利益链条。

2011年以来,在工信部统筹下,基础电信运营商组织人力持续开展“净网行动”,对互联网违法信息开展拨测,对网络接入、重点业务平台等环节加强安全管控。

4.3 持续加大能力建设,不断提升对互联网不良信息的监测能力

为适应互联网不良信息治理的发展趋势,各基础电信运营商还不断提升对互联网不良信息的技术监测能力,逐步将治理环节向下延伸,很多省级公司也已陆续建成相关系统,全域监测、处置互联网不良信息的能力显著增强[3]。

5 省级基础电信运营商的互联网不良信息处置管控体系、治理成效以及主要困难

目前,各省级基础电信运营商已逐步建立了省级互联网不良信息处置管控体系。

5.1 构建以预防、监测、处置、宣教四个关键维度协同统筹的总体管控体系

省级基础电信运营商作为互联网不良信息治理体系的重要一环,在治理实践中承担着重要角色。对上,省级基础电信运营商承接集团公司、政府职能部门等上级单位有关治理政策和治理要求;对下,省级基础电信运营商统筹本省范围内互联网不良信息处置管控体系建设与有序运作。

图1 协同统筹的管控体系

预防是指通过规范网站接入、网站备案和网络信息安全等日常运营管理工作,化解互联网不良信息产生的潜在风险,构建第一道屏障。

监测是指通过建立互联网不良信息监测扫描系统、网站备案监测系统等自动化技术平台,提升对互联网不良信息检查的扫描效率、扫描深度、识别精度,为精准打击提供技术保障。

处置是指建立穿透省市县三级的互联网不良信息工单处置流程,规范和闭环管理全省不良信息处置工作,确保处置效果。

宣教是指梳理有关互联网不良信息治理的国家法律、法规和常见问题,对广大员工和客户开展宣传教育,促使全社会知法懂法,逐步培养起主动抵制互联网不良信息和协同治理的自觉意识。

5.2 技术监测平台

传统人工拨测方式效率低下、费时耗力,建立互联网不良信息技术监测平台,可实现高强度、大覆盖面的自动扫描和识别发现,对提升治理效率意义重大。互联网不良信息技术监测从组成上来说,核心部分主要是网页数据采集和不良信息分析识别两块[4]。

5.2.1 网页数据采集

互联网不良信息网页数据采集方面分为用于主动采集的网络爬虫技术和应用于被动检测的DPI技术。前者在应用层通过HTTP协议进行信息采集,后者先在网络层复制数据包,再采用DPI技术从中提取出相关内容信息。

(1)网络爬虫技术。网络爬虫技术是搜索引擎的核心技术之一,被谷歌、百度等互联网公司广泛采用,也是目前最主要的不良信息主动发现技术手段。

网络爬虫实际上是一个自动提取网页内容的程序。它从网站首页开始收集网页内容,并通过不断抓取网页上的URL链接,逐层深入次级网页,进而实现对整个网站所有页面的内容搜集[5]。

图2 网络爬虫技术的基本工作原理

(2)DPI技术。DPI即深度包检测,也是一种常用的不良信息采集方式。通过镜像操作实现对网络流量抓取,再将抓取到的数据包进行拆包,进而提取出相关内容信息。DPI技术在分析包头的基础上,增加了对应用层的分析,能得到详细内容。

5.2.2 不良信息分析识别

(1)传统信息识别技术。传统信息识别,主要是采用关键词匹配技术,关键词库则是通过长期运营不断积累从而变得丰富。在实施信息识别时,若发现文本中出现关键词,则认为该文本属于不良信息,若文本中没有出现关键词,则认为该文本不属于不良信息。关键词匹配在技术实现上较为简单,但由于汉语的语言特性,上下文语义与关键词本意不一致时,关键词匹配会导致较高误判率。另外,通过同音字替换、关键词变形等,也容易规避匹配。

不良信息分析识别能力的提升,需要经过长期运营积累,通过对识别系统的不断训练,逐步提升覆盖面和优化精准度(图3)。从原理上讲,对文本、图像、视频的不良信息识别是一样的,但是,由于图像、视频需要经过特征表示、特征抽取、特征降维等多个额外数据处理环节才能提取出文字,这也导致图像、视频的识别精度不高。

图3 不良信息分析识别能力训练

AI内容检测。相较于传统关键词匹配识别技术,AI机器学习在对文本识别时,会更侧重于文本的语义信息,对于谐音词、错别字以及“黑话”等会有较大的容错能力(图4)。即使在没有匹配到违规关键词时,只要其文本语义带有不良信息的特征,一样也能被检测出来。当然,AI机器学习也依赖于大量的样本训练,如果不良特征信息过少,AI机器学习模型仍需要传统关键词匹配技术来进行补充。

图4 AI机器学习方案卷积神经网络卷积操作示意图

5.2.3 自主扫描监测平台

本省互联网不良信息监测系统主要分成三层:第一层是数据采集层,主要采集解析来自DNS和DPI的话单,识别出基础数据;第二层是数据处理层,通过高性能数据处理引擎,进行网站状态判断、接入判断、网站内容识别、信息内容监测及处置管理等;第三层是可视化呈现层,主要实现结果展示、任务派发、策略配置管理等(图5)[6]。

图5 系统结构与功能组成

5.3 治理成效

经过不懈努力,省级基础电信运营商在互联网不良信息治理方面已经取得了长足进展,随着技术监测平台的上线,互联网不良信息治理工作如虎添翼,大量包含不良内容的网页、链接被揭露出来并得到整改。

图6展示了笔者所在省从2020年6月-2021年12月所处置的不良信息网页数量,从数据角度对治理成效作了直观展现。

图6 2020年6月-2021年12月本省自主发现并处置的互联网不良信息网页情况

5.4 主要困难

在国家相关主管部门和集团公司的大力推动下,省级基础电信运营商在互联网不良信息治理方面成绩斐然。但是,在具体治理实践中,仍然存在很多困难,仍需要全社会通力协作,逐步加以解决。

5.4.1 网站基数庞大,网页数规模持续快速增长

随着互联网的持续快速发展,我国网站和网页数量也呈现出爆炸式增长。截至2021年12月,我国网站数量为418万个,网页数量为3350亿个。海量网页数据给内容拨测、监测设置了很高的门槛,基础电信运营商必须投入大量算力和带宽,才能尽量确保日常监测扫描的时效性。

5.4.2 监测技术需要持续完善

伴随互联网快速发展的,不仅只有网页数量的激增,还有互联网业务承载模式的不断创新升级和迭代。从传统网站到APP、公众号、小程序,从静态网页到动态脚本网页,从文本信息到图文并茂、语音视频相结合的富媒体,互联网的呈现方式愈加多元化。

基础电信运营持续开展互联网不良信息治理的同时,违法犯罪分子也在不断改变不良信息的呈现方式、不断调整应对监测检查的技术手段。不良信息内容、不良信息链接从显眼位置向隐蔽位置转移、从静态内容向动态脚本转移。当前的互联网不良信息监测,已远非传统人海战术、人工拨测所能解决,对已经部署的全自动技术监测手段也提出了更高要求。

5.4.3 治理工作并未形成合力

互联网不良信息治理工作需要全社会群策群力,但就实践而言,治理工作并未形成合力。在域名管理方面,由于域名注册门槛很低,在日常处置实践中,查处的不良网站通常使用稀奇古怪的域名。在客户内部管理方面,由于对域名疏于管理,被不法分子抢注用于开设不良网站的情况时有发生,由于不重视网络安全和内部人员管理,网络“肉鸡”情况也很常见。在技术厂家方面,由于经济利益考虑,相互之间互相保密,形成技术壁垒。在国际协作方面,绝大部分不良网站开设在境外国家,无法予以根除。总之,全社会未形成合力的例子林林总总,不胜枚举。

6 结语

网络不是法外之地,网络空间的健康发展需要所有参与主体的共同努力,任重而道远。现阶段,互联网不良信息综合治理中尽管还存在着种种问题,但随着法律法规的不断完善、监管监督职责的进一步明确、技术手段日益创新升级、国际合作的广泛开展,我们有理由相信,全社会必定能够搭建起良性互动的框架,共同打造自由便捷、绿色健康的互联网。

猜你喜欢
网页运营商基础
基于HTML5与CSS3的网页设计技术研究
一张图看三运营商政企业务
夯实基础,举一反三
夯实基础,举一反三
基于CSS的网页导航栏的设计
基于HTML5静态网页设计
“防”“治”并举 筑牢基础
搜索引擎怎样对网页排序
第一章 在腐败火上烤的三大运营商
三大运营商换帅不是一个简单的巧合