图像通信领域编解码方法非专利文献检索策略

2012-04-01 12:30贺艳娟

电视技术 2012年2期

贺艳娟，冯薇，池娟，姜丹

（国家知识产权局专利局专利审查协作北京中心，北京 100190）

责任编辑:魏雨博

随着信息时代的到来，人们对信息的依赖越来越高，对信息的质量要求也越来越严苛，不可避免地带来了多媒体承载信息的吞吐、存储和传输问题。所以必须对数字化信息进行压缩，实现快速的编解码算法，用尽可能少得数据来表达尽可能多得信息，从而易于传输和节省存储的空间。由于数据是由特征信息和冗余组合而来，而冗余数据对于信息的表达是没有用处的，因此将特征信息保留，将冗余信息去除即可实现压缩编码。

视频编码中的关键技术包括：1）空间抽样，在实际应用中，对彩色图像采用全分辨率编码实际上是没有必要的，利用人眼视觉系统对色差信号的不敏感特性，可以有效降低原始编码数据量；2）量化，量化是视频编码中最直观的数据压缩过程，也是各种视频编码算法产生失真的主要过程。量化使数据的分布范围变小，分布状态变得集中；3）预测编码与运动估计，预测编码的方法是根据离散信号之间存在一定相关性的特点，利用前面一个或多个信号预测下一个信号，然后根据实际值和预计值之间的差值进行校正编码，从而实现压缩的目的，预测编编码主要包括帧内预测编码、帧间预测编码，对于帧间预测编码，需要应用帧间运动补偿技术；4）变换编码，是消除图像数据空间相关性更有效的方法，尽管图像变换本身并不压缩数据，但可以使图像数据在变换域内最大限度的不相关。其主要包括K-L变换、离散余弦变换（DCT）、锯齿形扫描和游程编码；5）熵编码，利用图像阵列的数据统计特性进行数据压缩，常用的有两种：变长编码和算术编码，二进制算法编码是目前最新图像和视频编码标准的主要熵编码方法。在实际压缩过程中一般采用结合空间采样、量化、预测、变换、熵编码等多种方法的混合编码方案，以达到最佳的压缩效率。

从20个世纪80年代以来，由ISO和ITU制定了一系列的视频压缩国际标准。其中ITU组织制定的标准以H.26x命名，主要针对实时通信的应用，如H.261，H.263，H.264；而ISO和国际电工委员会（International Electro technical Commission，IEC）的共同委员会中的MPEG组织制定的标准以MPEG-x命名，主要针对视频数据的存储、广播电视和视频流的网络传输等应用。其中以H.264/AVC性能最为优越，在H.264标准中，还分别推出了可分级视频编码（Scalable Video Coding，SVC）扩展和多视点视频编码（Multiview Video Coding，MVC）扩展以应对越来越多样的应用需求。AVS是我国自主研发的视频编码标准，该标准是以当前H.264框架为基础，并在此之上作了一些改进，增加和删除了一些算法，压缩效率比H.264相差不大，实现的难度大大降低。该标准主要针对高清晰度电视、高密度光存储媒体等应用。

随着图像编码技术的进一步研究，涉及图像编解码的专利申请量也迅速增加，包括对现有编码算法的改进以及自创的新编码算法，比如运动估计与运动补偿技术中块匹配算法的改进等，以解决现有算法存在的缺陷，还包括对现有标准的应用或改进，比如可分级视频编码或多视点视频编码的技术改进，以解决现有标准中还没有涉及到的问题。由于标准组织成员、高校科研院所或大型企业对图像编解码的各个方面都在进行着深入的研究，覆盖的技术面比较广，比较新颖，在检索过程中，通常很难在专利文献数据库中检索到比较相关的专利文献，而非专利文献具有更新速度快，技术内容全面，技术原理类综述类的资料较多的特点，此时对于非专利文献数据库的检索就显得相当重要。而对于高校科研院所的一些研究者，其往往将自己的研究成果第一时间发表在比较有影响力的国内核心刊物或国际刊物上，因此，对于图像编解码算法的检索，要时刻考虑非专利文献数据库的检索，而对于常用的非专利文献库的使用和实际案例在其非专利文献数据库的检索策略就显得尤为重要。

下面将对图像编码专利申请常用的非专利文献数据库和实际案例在非专利文献数据库中的检索策略作简单的介绍。

1 图像编解码方法的非专利数据库的使用

对图像编解码领域中常用的数据库进行概括性描述，总结如下：

1）CNKI全文数据库是中文非专利文献库，其特点是数据全，功能强。该数据库涵盖的中文期刊相当全面，包括了关于广播、电视类的文献80000多篇，有助于我们了解背景技术，另外，硕士博士论文在我们查找申请人为高校学生的情况下，对我们查找其论文有很大帮助。

2）IEEE/IEE Electronic Library（IEL）是外文非专利文献库，该数据库属于全文数据库，能直接查找文献的全文，包含了很多有关图像通信领域的期刊、会议，有关图像编解码算法的最新研究成果经常在这些期刊或会议上发表。

3）ISI WEB of knowledge是外文非专利文献库，包括科学引文索引扩展版SCIE、科技会议录索引ISTP、科学文摘数据库INSPEC等，其以科学引文为核心，可追踪文献的引用和被引用情况。

4）ISO和国际电工委员会（International Electro technical Commission，IEC）的共同委员会中的MPEG组织制定的标准以MPEG-x命名，主要针对视频数据的存储、广播电视和视频流的网络传输等应用，如MPEG-1，MPEG-2，MPEG-4，可在 http://mpeg.chiariglione.org下载MPEG的多个视频标准。对MPEG视频标准的改进的申请通过直接到标准的下载网站下载会获得很大收获。

5）ITU组织制定的标准以H.26x命名，主要针对实时通信的应用，如 H.261，H.263，H.264，可在 http://wftp3.itu.int下载多个时间版本的H.26x音视频和多媒体标准。对H.26x音视频标准的改进的申请通过直接到标准的下载网站下载会获得很大收获。

2 图像编解码方法的典型案例在非专利文献库的检索策略

【案例1】

申请号：2009101543362

发明名称：一种多视点视频信号的编码方法

申请日：2009年11月27日

申请人：宁波大学

发明人：蒋刚毅，彭宗举;何萍;郁梅

权利要求1：一种多视点视频信号的编码方法，其特征在于该编码方法在基于H.264编码标准的多视点视频编码校验模型JMVM上，采用JVT推荐的分层B帧编码预测结构对多视点视频信号中的彩色视频进行编码，具体过程如下：对于彩色视频中的所有I帧以16×16宏块为单位进行处理，对于当前正在处理的I帧中的各个16×16宏块，编码器采用现有的H.264的率失真优化技术搜索Intra16×16、Intra8×8和Intea4×4宏块编码模式，从这三种宏块编码模式中选出率失真代价最小的宏块编码模式作为各个16×16宏块各自的最优宏块编码模式，再利用各个16×16宏块各自的最优宏块编码模式对各个16×16宏块进行编码；对于彩色视频中的所有P帧以16×16宏块为单位进行处理，对于当前正在处理的P帧中的各个16×16宏块，编码器采用现有的H.264的率失真优化技术搜索 SKIP、Inter16×16、Inter16×8、Inter8×16、Inter8×8、Inter8×8Frext、Intra16×16、Intra8×8和Intra4×4宏块编码模式，从这些宏块编码模式中选出率失真代价最小的宏块编码模式作为各个16×16宏块各自的最优宏块编码模式，再利用各个16×16宏块各自的最优宏块编码模式对各个16×16宏块进行编码；对于彩色视频中的所有B帧以16×16宏块为单位进行处理，对于当前正在处理的B帧中的各个16×16宏块采用如下步骤进行编码（此处省略）。

检索过程：本申请涉及H.264多视点视频编码，是比较新的研究方向，首先在CNKI中国期刊全文数据库中以本申请的发明人为作者进行检索，找到很多相关文献，但均不能作为对比文件，考虑到高校通常将研究成果可能首先发表在IEEE等国外期刊，于是转向IEEE中进行检索，找到以发明人为作者内容相同发表日在本申请的申请日之前的文献（Fast Mode Selection and Disparit Estimation for Multiview Video Coding，2009 Third International Symposium on IITAW，20091122），该文献最终导致该申请视撤。

启示：申请人有时候会对研究成果先发表在国外刊物上，而不是国内刊物上，因此，在国内非专利数据库上检索不到，此时，有必要在国外非专利数据库中检索。在IEEE数据库中以发明人为入口进行检索时，由于发明人有多种英文撰写方式，比如：姓名的全拼拼音，包括姓在前，名在后和名在前，姓在后两种情况（例如：Jiang Gangyi，Gangyi Jiang）、姓为全拼名为缩写，也包括姓在前，名在后和名在前，姓在后两种情况（例如：Jiang G.Y.，G.Y.Jiang）。所以如果没有将这四种情况都考虑到，很可能造成漏检；另外，如果发明人比较多，逐一变换为英文名比较费力，比如本案例，可以使用发明名称中的关键词作为题名进行检索。

【案例2】

申请号：200780000221.7

发明名称：可分级视频压缩中插值的方法与装置

申请日：2007年1月11日

优先权日：2006年1月11日

申请人：华为技术有限公司

权利要求1：一种可分级视频压缩中插值的方法，其特征在于：用于可分级视频压缩的层间预测中，亮度分量和色度分量采用互相独立精度的插值滤波器，亮度分量和色度分量的插值滤波器的抽头系数也互相独立，插值滤波器可以是对称或者不对称的。

检索过程：可分级视频编码或可伸缩视频编码属于低码率视频编码H.264的研究范围。因此，在Google网站用域(site:wftp3.itu.int)输入以下关键词进行检索：svc,lum,chroma,filter,interpolat，得到评价创造性的对比文件：Chen Ying,Zhai Jiefu,Yin Peng,New downsampling and upsampling processes for chroma samples in SVC spatial scalability,JOINT,VIDEO TEAM(JVT)OF ISO/IEC MPEG＆ITU-T VCEG(ISO/IEC JTC1/SC29/WG11。

启示：本申请涉及的可分级视频编码或可伸缩视频编码属于低码率视频编码H.264的研究范围。该类申请的申请人或发明人可能属于ITU-T组织的成员，其申请的技术方案可能已作为提案向ITU-T组织提交并公布，或者已经被其它竞争成员提交过。因此，对涉及到国际编码标准的专利申请，到相关的组织网站上直接进行检索是十分有必要的。

【案例3】

申请号：200610041780X

发明名称：一种基于上下文自适应变长解码的方法

申请日：2006年2月13日

申请人：清华大学

发明人：何芸，瞿艳梅

权利要求1：一种基于上下文自适应变长解码的方法，其特征是，解码是在控制器(30)的控制下对输入的变长编码数据解码，包括对五个语法元素的解码：解码从coeff_token解码（1）开始，采用基于分组规则的组标识数分配方法或者存储转换方法解码非零系数的个数total_coeff和拖尾1trailing_one的个数trailing_ones；trailing_one_sign解码（2），解码拖尾1trailing_one的符号；level解码（3），解码剩下的非零系数的幅度值；total_zeros解码（4），解码最后一个非零系数之前零的个数；run_before解码（5），从最后一个非零系数往前，解码它到前面一个非零系数之间的零的个数。

检索过程：本申请涉及H.264中的其中一套熵编码技术，即基于上下文的自适应变长编码CAVLC，技术方案是对变长编码数据的5部分语法元素的解码，由于该算法发展时间短，目前提出的实现方案很少，在国内主要集中在高校中研究H.264标准的一些实验室和课题组，除清华大学外，本申请背景技术部分还给出了对此有比较前沿研究的浙江大学的严晓浪、秦兴。因此扩展了相同研究领域的不同高校的研究人员，以扩展的多个作者为入口在CNKI，IEEE，ISI WEB of knowledge中检索，尽管在CNKI和IEEE中未检索到合适的对比文件，但在ISI WEB of knowledge中检索到一篇对比文件：Xing Qin，Xiaolang Yan，A Memory and Speed Efficient CAVLC Decoder， Proc.VCIP 2005，pp.1418-1426，Jul.2005，最终该篇对比文件使申请人缩小了保护范围。

启示：申请人为高校或科研院所的申请，发明人的同一实验室或课题组中研究领域比较接近，有些可能是延续性的研究，一般还会有多个高校的实验室分别进行研究，所以在进行检索时，不仅要检索发明人的文章，还要检索与发明人研究接近的同实验室人员和相关实验室人员的文章，可以以发明人和相似研究人员所属的单位进行跟踪检索。随着国内科研人员的专利意识增强，会注意先申请专利后在期刊上发表文章，然而他们往往还是会在专业会议，尤其是一些英文国际会议上提前公开研究成果，而IEEE的会议文章并不全面，此时ISI Web of Knowledge可以作为补充检索。

3 检索体会

通过以上案例的检索，结合在审查过程中其他案例的检索得到一些体会，总结归纳如下：

1）在非专利文献检索中，参考文献可以作为追踪检索的工具，这有点类似于专利文献检索中根据同族进行追踪的方法，比如针对某发明申请，审查员检索到发明人的一篇论文，公开了本申请的大部分内容，只是时间晚于本发明。但是，通过阅读该论文的参考文献，审查员可能找到可以作为现有技术评价该申请新颖性创造性的另一篇文献。

2）对于申请人为高校或科研院所的申请，发明人有可能在将研究成果发明专利之前，将成果提前发表在国内外期刊上，尤其是相对比较新的图像编解码算法，大都将研究成果发表在国外的期刊或会议上，所以在外文非专利数据库中检索也很有必要；另外申请人为高校或科研院所的申请，其发明人的同一实验室或课题组中研究领域比较接近，有些可能是延续性的研究，所以在进行检索时，不仅要检索发明人的文章，与发明人研究接近的人员的文章也不能遗漏；比如申请人如果是博士或者硕士，在其博士论文或硕士论文末尾会有作者在攻读学位期间发表的论文和参与的课题的列表，这些文献的内容与申请的内容的相关性很大，很有参考价值。

3）对于图像编解码方法的专利申请，申请的技术方案往往与现有的编码标准之间关系紧密，大多数是对现有标准(比如MPEG，H.264)的应用或改进，而对于这类申请的技术内容其大部分已被现有标准中公开，相应的标准很可能可以作为影响新颖性或创造性的文献使用。

4 结束语

本文以实际审查案例为例，对图像编解码方法的特点进行了介绍，并根据其特点分析了在非专利数据库中的检索思路，给出了自己的一些心得体会。错误之处请大家批评指正。

[1]周荫清.信息论理论基础[M].北京：北京航空航天大学出版社，1993.

[2]毕厚杰.新一代视频压缩编码标准—H.264/AVC[M].北京：人民邮电出版社，2002.

[3]AVS.The Information Technology Advanced Audio and Video Coding Part 2:Video[S].2005.