陈寒非
摘要:互联网视听节目监管系统,具有分析各类媒体信息的功能,能对各种形式与格式的信息进行综合处理,以便相关网站对其进行分类与识别。为了提高网络管理效率,加强网络安全监督,实现网络管理智能化的目标。故而文章对节目数据的标准化、节目内容的挖掘深度以及视听监管系统之间的协调能力等方面进行分析,并结合作者多年工作经验,就优化视听监管系统的措施提出自己的观点,以供同行业工作人员参考。
关键词:互联网视听节目;监管系统;发展
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2015)36-0104-02
互联网视听节目监管系统是广电行业为监督视听节目而推出的系统,这也是广电行业工作重要一环。此类监管主要是为了社会稳定安全而推出的,其通过监管平台对各种视听节目采取监管,保证节目内信息健康向上,及时处理发现的问题,如果问题较为重大,广电系统可以和相关部门形成配合,有效追踪,持续监测,可以说监管系统对于我国视听节目意义重大。
1 问题的提出
1.1 视听节目数据的标准化问题
现阶段监管系统已经比较完备,监管互联网视听节目通常选择特殊地区或特定种类的节目,提取网页数据信息中的音频视频信息,或者在一些其他IP访问视频网站时的信息特征,通过提取这些信息完成监管。由于不同系统采取的信息特征存在差异,也就是采集规范存在不同,相同视听节目的信息可能会被不同的监管系统采集,这种分布过程采用的便是不同的分散标准,此类现象便会导致数据不一致,标准不一。标准存在问题,导致监管系统缺乏统一联动机制,需要人工对于不同信息采取复杂分析,进而造成信息重复等问题,此类问题便是“信息孤岛问题”,这种便是视听节目数据的标准化问题。
1.2 视听节目内容挖掘不深入的问题
互联网平台支撑了快速搜索功能,数据搜索应该呈现快速性、完整性和有效性,而且此类要求较高。分析现阶段监管部门所使用的监管系统,可以得出现阶段视听节目内容挖掘不深入的问题,主要原因便是不能根据网站链接搜索到音频影像节目,或者存在一些收费节目,无法进入。检索搜索对文本信息的检索也较为重要,该类检索方式检索信息能力较弱,产生的结果便是搜索和挖掘已经较为深入,仍不能分析出信息是否匹配,造成监管系统得到的信息较为单一并且可能出现流失。此类原因很容易导致监管系统出现管理误区,也就是俗称的“管理死角”。管理死角的存在便代表了管理漏洞,而这种管理漏洞并不是由于疏忽等方面造成的,所以只有在技术上进行不足。例如收费网站等,现阶段网页存在表层网页和深层网页,深层网页往往是非法信息聚集的场所,不能通过静态连接获取,往往隐藏在搜索表单后,然后在论坛采取一些“回复可见”等方式,此类网页便带来挖掘不深入的问题。
1.3 各个视听监管系统的协调能力不强
现阶段对于特定地域的监管工作较为优异,伴随着互联网走入了万家灯火中,视听节目也成了多种类、影响多个地域的节目,欲监管这类以互联网为平台的视听节目类型,往往监管系统应该联合工作,也就是不同地域的监管系统采取联合,协调合作,才能有效对于这类节目进行监管。为了解决该问题,现代构建了集中的监管平台和节目库,也就是形成统一的数据标准和接口,此类标准应该可以有效扩展,监管平台有利于提升监管工作的工作效果,属于时代发展的体现。
我国现代的监管系统已经开始协调合作,逐渐在合作中寻找一种最佳的模式形成我国特有的监管平台,平台应该收纳各种监管平台分散的监管功能,有效解决传统监管系统存在的部分问题,也有着自身独特的积极作用,我国这部分的工作刚刚起步,仍然处于初级阶段,现阶段的数据标准仍然尚未统一。
2 互联网视听节目监管平台的基本思路
我国的监管工作中,认定监管系统应该包括以下功能:互联网接入功能、视听节目搜索功能、数据分析检索功能和监管功能。监管系统中每一部分的功能模块都有着自己的功能,例如接入功能需要保证高带宽和可靠性,视听节目搜索功能负责的便是在规定范围内,收集网页上所承载的内容,并且进行后续分析。功能模块共同组成了我国的监管系统,也为维持社会稳定发挥了自身的作用。
2.1研发适应监管工作的搜索引擎
监管系统需要有着自身独特的搜索引擎,主要由爬虫系统、分析系统、索引系统和查询系统组成,实际工作中,首先发现视听节目,其次解析节目数据信息,然后存储节目特色,节目索引,最后查询视听节目是否符合我国标准,通过工作流程管理不同种类的网络视听节目。现代互联网发展速度飞快,搜索引擎应该适应飞速发展的速度,并且容纳视听节目数据信息越来越庞大的事实,通过对于未来引擎的期许,搜索引擎应该具有以下几个特点:
2.1.1 快速抓取爬虫系统
爬虫系统通过模拟爬虫的动作状态进而得名,功能为根据网页的连接,进而在有关联的网页内爬行,抓取其中的视频音频数据信息。我国现阶段的监管系统为了符合互联网的更新,爬虫系统是按照周期运行的。伴随着技术的进步,爬虫系统也得到了长足的进步,为搜索引擎的速度做出了贡献。爬虫系统减少了监控系统发生的资源消耗,现阶段采用的主要便是增量式爬虫,这种类型的爬虫系统对于已下载的网页采取量式更新,并且系统只会爬取新产生的网页,在一定程度上来说,此模式提高了工作效率,保证每一次爬的网页都会是新的网页。爬虫系统一定要适应爬取的网站类型,在调试过程中,人工调试有余系统自身适应,所以需要工作人员介入,不断的调整爬虫系统和网站的模型,帮助爬虫系统发挥自己的作用。前文曾经提到网页之中存在深层网页,爬虫系统同样是针对这类网页的良策,可以采用Deep Web爬虫系统,其通过模拟用户的注册或其他涉及表单等方面工作,自动登入到一些需要注册登入的网站,网站通过增加验证码的方式来加强注册难度,爬虫系统现阶段仍然不能通过自动验证来进入这类网站,所以在此类爬虫系统设计时,应该进一步提升。爬虫系统是解决数据挖掘的主要系统,监管系统应重视此类系统,将其提升。
2.1.2 智能解析音视频的分析系统
节目分析功能需要详尽的信息分析视听节目的属性,这类信息主要包括节目信息和网站信息,可以通过对比关键帧来确定节目是否违规,现阶段抽取信息呈现结构化特点。在现阶段互联网因为数据可以转载,所以很多音频视频信息是重复的,这时候需要找到关键点来认证不同的网页信息是否重复,可以采用特征提取和相似度评价的方法来证实。由于互联网视频音频信息格式众多,需要压缩成为统一的标准化格式,在分析系统中应该预留这一方面的接口,将各类信息进行有效压缩,得出统一标准规范,接口可以接入解析和压缩功能模块,既可以外接,也可以内部带有,然后得出统一结果,交由分析系统进行分析。
2.1.3 多角度、多侧面的索引系统
索引系统是搜索引擎中较为重要的一部分,其属于“数据大本营”,索引系统中存有数量庞大的视听网页链接,进而监管系统使用此功能时,可以为监管系统和搜索引擎提供例如网站域名等网站信息。现阶段为了适应大数据,索引系统使用索引压缩方法,一方面提升了系统相应速度,另外一方面节省了磁盘空间。
2.1.4 适合多用户操作、可以多条件重叠查询的查询系统
查询系统主要提供给监管系统以查询功能,当用户需要查询数据时,通过检索、排序等操作,进而帮助用户得出查询结果。查询系统需求准确,所以说系统应该设置的较为详细并且准确。合理的时间限度中,占用更少的网络、存储计算资源,得到最为合理的跨地域多种类合作模式,便是搜索引擎想要达成的目的,也是设计搜索引擎的初衷。
2.2 建立互联网音视频节目的统一监管平台
现阶段针对视听节目的管理标准尚未统一,这也就导致存在多监管系统无法协调 问题,根据现阶段我国国情和监管系统的需求,整合现阶段监管资源已经提上台面,建立一个监管平台,进而有效整合搜索功能等,将搜索的数据信息建立数据库,后期使用中通过数据挖掘技术查询信息,并且开发出多监管系统联动的规则或处理系统,将我国监管部门各自为战的局面改善,这种整合极大提升了监管工作的效率,也提升了监管工作效果。
设计监管平台中,应该包括ICP认证,并且可以查询服务器所在地,系统的设计应该可以容纳互联网的发展,进而提供给用户独立的并且可以不断实时更新的ICP数据库,方便监管系统使用ICP服务器,这种模式利于不同地区的监管部门完成独立工作。现阶段中,ICP数据库可以有效发现热点节目,一些非法分子通过论坛等传播一些非法视屏,用来谋取利益,或骗取点击量,可以说热点节目如果突然出现,往往便不寻常,现阶段对于热点节目的评价主要评价两个方面的指标:一是节目搜索引擎出现的次数,二是网站本身提供的点击次数。这两种指标评价虽然较为准确,但是仍然存在漏洞,各个监管部门仍然需要独立的ICP服务器,可以通过ICP服务器得到网站人数的实时变化,准确的判断热点节目,对监管工作有十分重要的意义。
统一的互联网视音频节目监管平台应该对于视音频节目分类,方便后期的检索工作,也就是索引系统应该存在,进而对视音频节目整理,利于原有监控系统进行去重合并等工作。同样,通过索引系统的工作,有效的管理热点节目,监管系统可以通过索引系统及时发现热点节目,采取及时监控,这对于监管工作是一种提升。
监管平台中同样应该包括视听节目数据转换系统,提供给监管部门统一的转换格式和分帧基准,建立统一信息库。监管平台的建立时,应预留一部分外在接口,为日后的新业务诞生提供便利。
3 结束语
监管系统是互联网视听节目的外界监督措施,实时的监控互联网视听节目,防止消极内容进入互联网,也防止一些恶性信息散播。本文分析了监管系统存在的问题,并提出了建立监管平台,望笔者的思考能够为从业人员带来启蒙,为祖国稳定献上一份绵薄之力。
参考文献:
[1] 孟庆博. 互联网视听节目监管系统简介[J]. 计算机光盘软件与应用, 2015(1):141-142.
[2] 王冉. 构建安全的网络视听节目监管系统[J]. 有线电视技术, 2014(1):99-101.
[3] 裴鹏真. 互联网视听节目监管系统的应用与实践[J]. 计算机光盘软件与应用, 2014(4):88-89.
[4] 房敬敬, 秦思思. 4G背景下对移动互联网视听节目管理的思考[J]. 商业文化月刊, 2015(12):56-57.
[5] 刘伟杰. 基于互联网视听节目源的搜索与处理系统的探索研究[J]. 广播与电视技术, 2014, 40(12):37-38.
[6] 周涛. 虚拟化云计算技术在互联网视听节目监管中的应用[J]. 世界广播电视, 2014(1):59-63.
[7] 周侠. 分布式采集在互联网视听节目采集中的应用[J]. 广播与电视技术, 2014(10):40-40.