模式匹配在条件接收系统中的应用

2015-07-02 00:30冯燕强
电视技术 2015年4期
关键词:模式匹配字符消息

冯燕强

(广西广电网络公司 加密系统部,广西 南宁 530028)

模式匹配在条件接收系统中的应用

冯燕强

(广西广电网络公司 加密系统部,广西 南宁 530028)

通过前端条件接收系统,可以向用户发送授权指令、邮件、公告等信息,同时前端条件接收系统还会接收来自营业厅的催缴费信息、加授权或者减授权的指令,即前端系统对外是具有一定的开放性。因此,对邮件、公告信息、催缴费信息等内容建立审查机制是十分必要的,而这些内容大多数为文字,使用模式匹配算法来建立自动审查机制是一个好的选择。主要介绍文本过滤在条件接收系统中的重要性、如何将模式匹配算法加入到条件接收系统中。

条件接收;模式匹配;数字电视

条件接收系统(Conditional Access System,CAS)是付费数字电视的核心技术,是对数字电视内容的一种保护手段,保证用户只有在满足一定的条件下才能正常收看特定的内容[1]。通过CA技术可以决定某项业务能被使用的前提是用户必须有授权,对于没有授权的用户是不允许使用的,这就保证了合法用户的权益以及运营商的权益。在CA系统中是通过加扰和加密来实现条件接收这一功能,将声音、图像、数据流按某种方式打乱即加扰,这样就能够让用户不能正常收看节目,而加扰的关键就是控制字;而加密则是对控制字进行保护的处理过程。经过加密处理的控制字和加扰的节目信号一同发送到机顶盒,机顶盒则对加密过的控制字进行解密,然后使用控制字对加扰的信号进行解扰,从而还原出原始的声音、图像,这样用户才能正常收看节目。这是CA系统最重要的功能,但根据需要,CA系统还有发送邮件、屏幕显示(On-Screen Display,OSD)等功能。

屏幕显示(OSD)在现行广电系统的主要作用是菜单显示、催缴费、升级提示、天气预警等。其中催缴费、升级提示、天气预警类的OSD显示只起到提示作用不影响用户正常收看节目,菜单显示又可以分为两类:显示类和带操作类。

1 模式匹配的可行性分析

在客户端中,CA消息在机顶盒上显示是要经过一系列的判断、转换。这就表明从CA系统中下发的邮件、OSD消息会最终作用于用户的机顶盒,这就隐藏着一种可能,如果CA系统下发的消息是非法的、反动的或者其他影响社会安定团结的内容,会造成不好的社会影响。因此,在发送端中建立消息审查,从而过滤这类消息,严格控制了CA系统下发的消息,这就能从源头杜绝这类安全播出事故的发生,也能杜绝不管是有意还是误操作造成的事故,实现自动审查的功能。

模式匹配:是指在给定长度为n的目标串T=T1,T2,…,Tn中查找长度为m的模式串P=P1,P2,…,Pm的首次出现或多次出现的过程。这里Ti(1≤i≤n),Pj(1≤j≤m)∈Σ(字符集),若P在T中出现1次或多次,则称匹配成功,否则称匹配失败[2]。上述的消息都是以文字的形式存在,所以使用经典的模式匹配算法对这类消息进行过滤是行之有效的方法。邮件和OSD类消息从各个地方汇聚到CA数据库之后,由CA系统调用模式匹配算法对这类数据进行检查,对于内容与指定的模式不匹配的数据可以进行删除等操作,这样就能实现自动审查,这是一种强制检查的行为,可以在一定程度上防止不合法的不良言论在数字电视网络中传播。

2 模式匹配算法的实现

首先是将模式串和文本串左对齐,匹配的方向是从模式串的右边开始,即从右向左匹配,当出现失配的情况下,会使用坏字符规则和好后缀规则来决定下一个匹配的位置,即使用这两个规则来决定模式串右移的距离,直到文本串的末尾或者匹配成功。

坏字符规则分两种情况:

1)如果模式串P中不存在字符x,则字符x之后的文本字符串不会与模式串P产生匹配,因此跳过字符x使得模式串P的首字符与字符x的下一位字符相对齐[3],具体体现如图1所示。

图1 坏字符规则1

2)如果字符x存在于模式串P中,则把字符x与字符x在模式串P中最右的位置相对齐[3],如图2所示。

图2 坏字符规则2

好后缀规则是利用已经匹配的字符串来进行跳跃,分如下两种情况:

1)如果模式串P中存在与已经匹配成功的字符串 p′相匹配的子串,并且该子串是符合条件的最右子串,则移动模式串P,使得该子串与已经匹配的字符串p′对齐[3],如图3所示。

2)如果模式串P中不存在与 p′相匹配的子串,则在 p′中查找最长后缀,该后缀必须与模式串P的前缀完全匹配,即符合条件 p′[m-s…m]=P[0…s][3],如图4所示。

图3 好后缀规则1

图4 好后缀规则2

3 模式匹配应用于CA系统

CA厂家很多,但大多数的CA系统在邮件和OSD之类的消息都有字数限制,一般消息长度为150个字符,这就意味着文本串的长度最长为150个字符。数据从各个地方汇聚到CA系统的接口,最后插入到数据库中。在插入数据库之前,会调用模式匹配算法的程序对这类数据进行检查,只有匹配失败的邮件和OSD消息(即不存在非法的、敏感词之类的存在)才能插入到数据库中去。前端CA系统的数据流向如图5所示,模式匹配算法的具体流程图如图6所示。

图5 CA系统数据流图

图6 算法流程图

从图5可以看出,数据流来源于CA系统开放给外部的接口,通过互联网传到CA的数据库中,EMMG服务负责不断从CA数据库中取数据,然后生成EMM数据流发给加扰机,加扰机对EMM数据流进行加扰后传给调制器,调制器将加扰后的数据调制成特定的信号后通过HFC网络传到用户中,这样就完成了整个EMM流传播。由此可见,在数据进入数据库之前就把非法的数据信息拦截,就能防止非法数据被下发到数据传播网络中,也能在不影响EMMG服务各项正常动作的前提下,对这类数据信息进行检查。

例如:“尊敬的用户,您的收视费即将到期,请到营业厅或工、农、交、建、中行及移动手机缴费”是最常用的催缴费信息,以该信息作为文本串,而以“移动”作为模式串,对模式匹配算法如何应用于CA系统中进行说明,同时验证了模式匹配算法在CA系统中是不是可行的。

第一步是计算出模式串中每个字符在模式串中最右的位置,这个位置是当出现不匹配的情况下模式串应该右移的距离。第二步将文本串和模式串左对齐之后开始进行匹配。匹配开始的方向为模式串的右边开始,而“敬”字与“动”不匹配,而且“敬”在模式串中不存在,符合坏字符规则1,按坏字符规则1来移动模式串,这时候“移动”和文本串中的“的用”对齐;不断重复这个过程,直到“移动”与“及移”对齐才与前面的匹配过程不相同。当“动”字和文本串中的“移”字不匹配的时候,因为“移”位于模式串中而且位置为1,所以该模式串只右移一个位置,移动之后,模式串与文本串的“移动”对齐。再次进行匹配之后就检测到匹配成功,这时后面的匹配就没有必要进行下去了,匹配成功之后说明该信息存在该过滤的内容,则直接删除该消息不让其被发送到传输链路中。这样就达到对敏感词进行过滤的功能。

模式匹配算法独立于CA系统之外,只有在数据要进入CA数据库的时候才会调用该算法对数据进行检测,这样就不会影响CA的正常工作,也能在需要的时候对模式匹配算法进行升级和改进。在日常工作中,发送该类消息都有固定格式,这就让员工在发送消息时有所松懈,稍不注意就会将不该发送的信息发送给用户,在没有模式匹配加入的自动检查机制中,员工作发送操作的下一瞬间,用户就会收到不该收到的信息,这在广电系统中轻则被定义为扰民行为,造成的影响轻微,而如果消息具有煽动性,则会影响社会稳定,情节更严重。

4 结束语

CA系统作为广播电视行业中的核心技术,在保证合法用户的权益以及运营商权益的工作中起到非常重要的作用。广播电视是现代人获取外界信息的来源之一,和人们的生活息息相关,而CA系统则和人们的距离是比较近的,CA系统发出的信息影响着人们对国家、社会的看法,使用先进技术严格把控CA系统所发出的信息,避免不良影响的情况出现,这都是CA系统不可或缺的。

[1]郑思娴.数字电视条件接收系统适配层的研究与实现[D].长沙:湖南大学,2005.

[2]严蔚敏,吴伟民.数据结构[M].北京:清华大学出版社,1997.

[3] DONALD E K,JAMES H M,JR VAUGHAN R.Fast pattern matching in stings[J].SIAM J.COMPUT,1977,6(2):323-350.

Application of Pattern Matching in Conditional Access System

FENG Yanqiang
(Encryption System Department,Guangxi Radio and TV Network Company,Nanning 530028,China)

Through the front end of conditional access system,which can be authorized to the user instructions,email, announcements and information,at the same time,the front system can also accept conditional access system to place business hall of payment information,add authorization or subtract instruction,authorized by the front-end system of foreign is open.Therefore,a review system of the mail information,announcements and push payment information is very necessary to establish and most of the content for the text,using pattern matching algorithm to set up automatic review mechanism is a good choice.This paper mainly introduces the importance of text filtering in conditional access system,how to join the conditional access system pattern matching algorithm.

conditional access system;pattern matching;digital TV

TN949.197

A

10.16280/j.videoe.2015.04.002

2014-10-17

【本文献信息】冯燕强.模式匹配在条件接收系统中的应用[J].电视技术,2015,39(4).

冯燕强(1987—),广电工程师,主要从事CA系统的开发及维护。

责任编辑:薛 京

猜你喜欢
模式匹配字符消息
一张图看5G消息
基于模式匹配的计算机网络入侵防御系统
字符代表几
一种USB接口字符液晶控制器设计
图片轻松变身ASCⅡ艺术画
HBM电子称与西门子S7-200系列PLC自由口通讯
具有间隙约束的模式匹配的研究进展
OIP-IOS运作与定价模式匹配的因素、机理、机制问题
基于散列函数的模式匹配算法
消息