大数据环境下可视媒体版权保护模式研究

2018-03-14 19:20姜明芳
现代情报 2018年2期
关键词:数字资源版权保护大数据技术

〔摘要〕大数据技术的快速发展与应用,加快了可视媒体大数据的传播与利用。可视媒体数据的特点与广泛应用也带来了一些新的可视媒体大数据安全性问题。构建网络环境可视媒体大数据版权保护模式,可为数字图书馆可视媒体应用服务提供安全保障,增强图书馆数字资源综合服务能力。充分挖掘可视媒体价值稀疏性与视觉稀疏性,提取可视媒体稀疏特征,建立可视媒体大数据稀疏感知计算模型,从可视媒体稀疏特性角度给出可视媒体大数据版权加密、版权认证、版权告示与版权审计追踪方案设计思路,构建可视媒体大数据版权保护应用新模式。结合数字图书馆应用实践验证了该版权保护模式的有效性,该版权保护模式可较好维护数字图书馆中可视媒体大数据机密性、完整性、可用性、可审计性,切实提升大数据环境数字图书馆可视媒体内容服务能力。

〔关键词〕图书馆;数字资源;版权保护;可视媒体;大数据技术;稀疏性

DOI:10.3969/j.issn.1008-0821.2018.02.017

〔中图分类号〕G25076;TP3097〔文献标识码〕A〔文章编号〕1008-0821(2018)02-0106-05

Study of Copyright Protection Scheme of Visual Media in

Big Data Environment

Jiang Mingfang

(Department of Information Science and Engineering,Hunan First Normal University,Changsha 410205,China)

〔Abstract〕Rapid development and application of big data technology is speeding up the dissemination and utilization of visible media big data.Features and intensive application of visual media also bring about some suecurity issue.Construction of copyright protection mechanism of visual media big data under Internet environment can provide safety guarantee for content services of visual media in digital library,and ehance integrated service ability of digital resources in digital library.Firstly,sparse features were extracted by eploiting the data sparsity and perception sparcity of visual media,and then a sparse perception computing model for visual media big data was built.Then the design idea of visual media copyright encryption,copyright authentication,copyright notice and audit trail scheme were given from the point of view of sparse feature computation of visual media.Finally,the copyright protection application schema of visual media big data under network environment was developed.Its application in digital library prove the effectiveness of this copygright protection mechnisam of visual media.It could safeguard the confidentiality,integrity,availability,and auditing of visual media big data in digital library,and enhance content service ability of visual media in digital library under big data environment.

〔Key words〕library;digital resources;copyright protection;visual media;big data technology;sparsity

視觉是人类认知世界重要的手段,人类接受信息的83%来自视觉。由图像、视频和数字几何等媒体信息组成的可视媒体具有较强的直观性和普适性。相较于其他媒体,可视媒体更易于存储、交流与传播。随着信息技术与通信技术的不断发展,可视媒体的应用越来越广泛,并逐渐成为人们生活中不可或缺的信息承载、储存、展示和表达的方式[1]。近年来,移动互联网与无线网络的快速发展与迅猛普及,更是带来了互联网用户规模的急剧增长,同时也产生了大量的可视媒体数据,媒体数据占据了互联网资源的60%以上。互联网上的可视媒体数据种类繁多、体量大,数据来源多样化,数据密度低、价值稀疏,可视媒体用户往往需要在短时间内得到快速响应,可视媒体已具备大数据特征,并成为了现代社会重要的信息资产[2]。网络可视媒体的出现为图书馆服务模式带来了新的机遇与创新,大数据环境下可视媒体的内容服务正在成为可视媒体大数据应用的一种重要形式,但同时,可视媒体大数据的无序、不可控、内容真实性等安全问题日益突出。

当前,可视媒体大数据版权保护是可视媒体大数据应用的关键技术,亦是数字图书馆服务模式创新乃至可视媒体产业发展的瓶颈问题。周鑫等[3]将博弈理论引入数字图书馆信息资源版权保护研究,运用演化博弈方法研究分析数字图书馆、作者、政府三方的行为影响因素,并从三方各自角度出发提出对策建议。除从上法律层面探讨数字资源版权保护外,新媒体时代的版权保护亦需要从技术上保障数字资源版权。数据加密与数字水印技术很早就被用来保护数字媒体内容安全与版权归属[4-6]。张军亮、朱学芳针对古籍数字化图像特征,设计基于二值图像数字水印技术的古籍图像版权保护方案,用以保护数字化古籍资源版[7]。朱光提出一种基于零水印的彩色图像版权保护策略[8],通过提取图像SURF(Speeded Up Robust Feature)特征来构造零水印序列,实现了对彩色图像的版权保护和鉴别,可应用于网络环境下图博档彩色图像资源的版权保护。文献[9]设计用于图像认证的半易损数字水印算法,可用于验证图像资源完整性。李旭东提出一种SVD域图像数字水印方法[10],通过奇异值分解与重复嵌入策略嵌入水印,利用多数投票原则提取水印以增强算法鲁棒性。为充分权衡用户初步预览功能与电子图书版权保护之间的矛盾,文献[11]提出一种面向电子图书的可逆可见水印方案,通过充分利用电子图书视觉特性与可逆嵌入策略,实现了可见水印自适应嵌入和原图像无损恢复,该方案在保护电子图书版权的同时,允许用户预览,而仅授权用户可去除可见水印而浏览高清电子图书。Rani和Raman设计了基于混沌加密和视觉密码的数字图像版权保护方案[12]。Hossaini等[13]将视觉密码与方向可控金字塔变换相结合设计了一种盲图像水印算法用于保护图像版权,视觉密码的采用使得水印嵌入不改变原始图像,且具有较好的水印鲁棒性。Ahuja和Bedi通过轻微调整部分视频DCT系数嵌入水印,实现一种适用于MPEG-2视频的水印方案以实现视频版权保护[14]。Kamnardsiri[15]联合离散余弦变换和离散小波变换设计一种鲁棒图像水印算法以保护数字艺术图像版权,但原始艺术图像的不可恢复影响了人们对艺术的欣赏,降低了作品的艺术价值。Hashmi等结合可见水印和不可见水印技术实现对图像、视频的实时版权保护,并设计基于安卓的数字水印原型系统[16]。但这些版权保护方案亦未较好考虑到网络环境可视媒体的大数据特性,不适用于可视媒体大数据的版权保护应用。而可视媒体大数据版权保护是可视媒体大数据应用过程中不可回避的关键技术问题,网络可视媒体大数据版权保护研究成果将极大地促进图书馆数字资源服务模式创新与可视媒体产业健康持续发展,必将形成新的技术创新与经济增长点。

本文旨在深入剖析可视媒体大数据特点的基础上,充分挖掘可视媒体大数据的价值稀疏性与视觉感知稀疏性,从可视媒体大数据稀疏表示的角度对网络可视媒体大数据版权保护策略展开研究,探寻可视媒体大数据版权加密、内容认证、版权告示与追踪等版权保护新方法,构建可视媒体大数据版权保护应用新模式,为可视媒体大数据的机密性、完整性、可用性与可审计性等可视媒体内容安全保障提供理论与方法支持。

1可视媒体大数据稀疏特性

网络环境可视媒体数据规模大、数据种类繁多、数据来源多样化、数据冗余大、数据处理速度快,已经完全具备大数据特性。而要实现大数据环境可视媒体数据的高效实时处理和版权保护,势必要充分挖掘利用可视媒体大数据的内在特性,特别是可视媒体大数据的价值稀疏性与视觉感知稀疏性。

11价值稀疏性

价值密度低是大数据的一个典型特征。大数据环境可视媒体通常具有多个相同或相似拷贝,可视媒体体量虽大,但价值密度低。可视媒体大数据海量异构、来源多样化,往往局部稠密与全局稀疏、量大低值与可用稀少共存。正因为大数据中并非所有数据对用户都有价值,一些垃圾信息甚至对数据使用起反作用,有效信息获取有如“浪里淘沙”,如何对大数据进行高效筛选,去粗存精,去伪存真,从中分析识别出稀疏的有用信息,才是体现大数据真正价值的关键。

12感知稀疏性

實际上,在自然的信号中,数据的稀疏性是普遍存在的。神经生物学的研究表明,人类视觉系统的信息处理机制是一个高度复杂非线性过程,它具有感受野等级特性、反馈机制、注意选择机制、特征选择性等特性。在信息处理过程中人类视觉系统对信息并不是一视同仁,而是表现出选择特性。一方面是由于脑容量有限,难以实时处理全部信息;另一方面也由于外部信息并不全都有重要价值,大脑只需对部分重要的信息做出响应即可。视觉系统对视觉刺激特征的高度选择性主要体现在方位/方向选择性、空间频率选择性、速度选择性、双眼视差选择性、颜色选择性等[17]。人类视觉系统的特征选择性与自然图像、视频中所体现的颜色、光强、纹理、时空相关性等感知敏感性均已表明,自然图像、数字视频等可视媒体本身就是稀疏信号,可以在一组过完备基下,用少量的非零稀疏系数线性表示出来,且信号的稀疏表示能获得对原始信号的良好近似。

可视媒体数据上大数据中占据绝大多数,数据冗余和价值稀疏给网络带宽与存储空间带来巨大挑战。此外,如何通过高效算法快速地完成数据清洗与数据提纯,挖掘有价值信息是大数据背景下可视媒体应用亟待解决的难题。探寻可视媒体大数据的稀疏表示模型对可视媒体内容服务与大数据应用有着重要的理论价值与应用意义。

2大数据环境可视媒体版权保护模式

现有数字媒体版权保护方案由于未能充分利用可视媒体大数据的特性,难以为大数据环境可视媒体通信传播提供实时有效的版权保护。本文在充分挖掘网络可视媒体大数据稀疏特性的基础上,构建大数据环境可视媒体版权保护应用模式,从版权加密、版权认证、版权告示与违反追踪多方面维护可视媒体大数据版权,为网络环境可视媒体大数据内容服务提供理论与方法支撑。可视媒体大数据内容服务系统是一个集可视媒体大数据存储、分析、利用与展示的有机系统工程,集成于可视媒体大数据内容服务系统的版权保护模式设计可借鉴大数据存储系统模型设计[18]与ISO(国际标准化组织)组织的OSI(Open System Interconnect)参考模型,即ISO开放系统互连参考模型,该模型分为物理层、数据链路层、网络层、传输层、会话层、表示层和应用层共7个层次。因此,根据OSI参考模型的基本原理,本着“数据下沉,统一处理,提升服务”的基本原则,将大数据环境可视媒体版权保护模式分为资源层、数据分析层、功能层、接口层与展示层共5个模块,各模块之间相互互联互通,形成有机的系统,如图1所示。

可视媒体大数据版权保护模式设计的基本思路是:从可视媒体大数据稀疏性出发,充分利用可视媒体大数据价值稀疏性与视觉稀疏性,运用稀疏编码与统计分析建立可视媒体大数据稀疏感知计算模型,取可视媒体大数据稀疏表示,提取可视媒体稀疏特征,完成去冗存真与数据清洗,为网络环境视媒体大数据实时处理与内容服务提供关键技术支撑。通过设计基于稀疏特性的可视媒体大数据选择加密技术与基于感知哈希(Perceptual Hash)的可视媒体大数据可搜索加密方案,保障可视媒体机密性与可用性。之后开发基于感知哈希的可视媒体大数据版权认证协议,维护可视媒体大数据内容完整性。而通过结合可见数字水印技术和鲁棒感知哈希,设计可视媒体大数据版权告示与盗版追踪方案,确保可视媒体内容服务的可审计性,从而实现可视媒体整个生命周期内完备的版权保护模式。大数据环境可视媒体版权保护模式设计的核心技术有可视媒体大数据感知计算模型建立、可视媒体版权加密技术、可视媒体版权认证协议、可视媒体大数据版权告示与跟踪方案。

21可视媒体大数据视觉稀疏计算模型

网络环境下可视媒体大数据具有价值稀疏性与视觉感知稀疏性。价值稀疏性是指大数据环境可视媒体的数据规模大而数据冗余度高,为减少带宽需求与存储需求,适应大数据流实时处理环境,首先要充分挖掘可视媒体大数据的价值稀疏性,实现可视媒体大数据抽样。以数字图像为例,可将图像大数据流划分为固定大小的时间片,这样图像大数据可表示成矩阵M∈

瘙 綆 m×n,其中图像即为一个m维列向量,而n为一定时间内的图像数,这样就可利用低秩优化对矩阵M进行分解(见式1),从而实现图像大数据降维[19]。

minL*+λS1

s.t.L+S=M(1)

其中*、1分别代表核范式和1范式,λ是一个非负正则化参数,L为低秩部分,S为稀疏部分。于是可由低秩部分L来计算图像的信息熵,根据信息熵确定抽样图像(质心媒体),从而完成可视媒体大数据稀疏采样。

然后由于可视媒体本身的视觉稀疏特性,进一步根据视觉稀疏性可视媒体的线性及非线性统计特征、空域和变换域统计特征、低维和高维特征的相关性、以及不同统计特征对质心媒体进行稀疏感知分析,利用稀疏编码与统计分析提取可视媒体稀疏感知特征,为网络环境可视媒体大数据的实时处理与版权保护等提供稀疏感知计算理论依据。

22可视媒体大数据版权加密技术

加密是保护数据机密性的重要手段,但对于海量异构、冗余度高的可视媒体大数据流,通常的加密算法不能满足大数据实时处理环境。一种思路是通过充分挖掘可视媒体大数据的数据规模大、价值稀疏特点,设计基于稀疏的可视媒体选择加密技术。首先通过可视媒体大数据稀疏采样完成自适应流抽样,并根据可视媒体价值稀疏性选择质心媒体,然后对质心可视媒体中的视觉感知重要信息进行加密处理,以实现对可视媒体大数据的选择加密,并满足可视媒体大数据实时处理要求。另一种情形是,云计算环境中,为维护用户敏感数据安全,可视媒体数据须经加密后存储在云端,但同时人们往往需要从加密媒体数据中检索符合条件的可视媒体,为此设计可视媒体密文检索方案。先利用视觉稀疏计算模型生成可视媒体感知哈希摘要,然后通过无损数据隐藏技术将可视媒体感知哈希到加密可视媒体中,同时使用公钥加密对感知哈希关联的关键词进行加密生成关键词陷门。然后在用户检索过程,服务器根据用户输入的关键词陷门执行检索,返回包含该陷门对应关键词的可视媒体密文文件。最后用户使用密钥解密服务器返回的可视媒体密文,即可获得查询结果。

23可视媒体大数据版权认证协议

网络环境下对可视媒体的完整性认证至关重要,而通常的基于數字水印的版权认证方案要求用户终端具备水印嵌入、检测功能,这在大数据实时处理环境下是不现实的,为此可设计基于感知哈希的可视媒体大数据版权认证协议。首先利用可视媒体视觉稀疏计算模型生成依赖于可视媒体数据的感知哈希信息。然后在感知哈希生成过程中要充分挖掘可视媒体的价值稀疏性去除冗余信息,并较好利用视觉稀疏特性获取可视媒体高层语义特征,从而确保感知哈希序列良好的鲁棒性与区别性。最后,在认证时通过提取可视媒体感知哈希,并与云端认证中心注册哈希值进行匹配以实现可视媒体完整性认证与篡改检测。

24可视媒体大数据版权告示与跟踪方案

相对于加密与数字水印技术而言,可见水印技术由于无需水印检测即可宣示版权,更加轻便快捷,更能适用于大数据环境可视媒体内容服务应用之中。在网络可视媒体大数据应用系统中,可根据可视媒体视觉稀疏计算模型设计自适应可见水印方案。首先由可视媒体视觉稀疏计算模型计算出可见水印自适应嵌入因子与尺度因子,实现可见水印自适应嵌入,于是无需水印检测即可通过可见水印的自适应半透明呈现以实现对可视媒体的显式版权告示。

此外,为能向授权用户提供高清可视媒体内容服务,结合可逆可见水印技术与鲁棒哈希设计可视媒体违反追踪方案。将加密技术与可逆信息隐藏技术相结合,设计安全可控的可逆可见水印方案,使得仅授权用户可去除可见水印浏览高清可视媒体。进一步为实现用户违反追踪,设计基于鲁棒感知哈希的可视媒体盗版追踪方案,首先根据可视媒体鲁棒感知哈希生成指纹编码,然后通过自嵌入技术嵌入到可视媒体之中,违反追踪识别阶段,通过数字指纹的相似性判决来追踪授权用户的非法传播。

3数字图书馆中可视媒体大数据版权保护应用实践

可视媒体是数字图书馆应用中数字资源的主要形式,因而可视媒体内容版权保护是数字图书馆应用的重要组成部分,是推动数字图书馆内容服务健康发展的重要基础。下面探讨可视媒体大数据版权保护模式在数字图书馆中的应用实践,如图2所示,从数据机密性、完整性、可用性与可审计性方面验证方案有效性。

图2可视媒体大数据版权保护模式数字图书馆应用

机密性:数据拥有者在上传数据时,均经加密处理后上传至数据中心,从而保证了可视媒体数据的机密性。

完整性:高级授权用户向云端服务器发送可视媒体数据使用请求时,可通过提取可视媒体数据中的感知哈希,并将其无损嵌入到可视媒体之中。认证时由服务器端进行哈希值匹配以完成可视媒体内容认证与篡改检测,从而验证可视媒体内容完整性。

可用性:普通授权用户通过解密可获得含可见水印可视媒体数据,而通过安全可逆可见水印高级授权用户可进一步去除可见水印获得原始可视媒体,从而实现了为不同类型用户提供不同质量的可视媒体内容服务。另外,通过可视媒体密文检索方案保证了用户对加密可视媒体内容的搜索需求,这都是可用性的表现。

可审计性:当有高级授权用户非法传播不带可见水印的可视媒体后,可视媒体数据版权所有者可向云端服务器提交审计请求,云端服务器计算待审计可视媒体鲁棒感知哈希,并生成可视媒体指纹编码,再通过数字指纹相似性判决实现对可视媒体非法传播进行识别与非授权用户追踪,从技术上实现用户传播行为的不可抵赖性。

从可视媒体大数据版权保护模式在数字图书馆的应用实践中发现,所设计的版权保护模式能有效实施对可视媒体大数据的版权加密、版权认证、版权告示与审计追踪,可较好应用于大数据环境数字图书馆可视媒体内容服务实践之中。

4结语

可视媒体是数字图书馆中数字资源的重要形式,网络可视媒体大数据版权保护是可视媒体大数据应用的重要基础,亦是数字图书馆内容服务模式应用推广的瓶颈。从可视媒体大数据的内在特性出发,在充分挖掘其价值稀疏性视觉感知稀疏性的基础上,设计基于稀疏特性的可视媒体大数据版权保护模式,提出切实可行的大数据环境可视媒体版权加密、版权认证、版权告示与审计追踪方案思路。通过可视媒体的数字图书馆应用实践验证了该可视媒体版权保护模式可有效维护网络环境可视媒体大数据的机密性、完整性、可用性与可审计性。该版权保护模式可为网络环境可视媒体内容服务提供安全保障,促进数字图书馆内容服务模式创新。

参考文献

[1]胡事民.网络环境下的计算可视媒体[J].中国计算机学会通讯,2015,11(12):49-54.

[2]马利庄.可视媒体大数据的智能处理技术与应用[EB/OL].http://www.sohu.com/a/74641148_263856,2016-05-10/2017-07-20.

[3]周鑫,蒋勋,杨国立.多方博弈视域下的数字图书馆版权保护策略——以商业性文献型数字图书馆为例[J].图书馆论坛,2017,37(8):98-104.

[4]徐正全.可视媒体信息安全[M].北京:高等教育出版社,2012.

[5]孙婧.可视媒体内容加密的视觉安全性研究[D].武汉:武汉大学,2013.

[6]鲍劼,李丕仕,都平平,等.高校图书馆面临的数据安全问题及防护策略研究[J].现代情报,2017,37(7):93-96.

[7]张军亮,朱学芳.基于二值图像水印的古籍數字化图像版权保护及其实现[J].现代图书情报技术,2010,(9):79-83.

[8]朱光.基于零水印的图博档彩色图像资源版权保护策略研究[J].现代图书情报技术,2015,31(12):89-94.

[9]计云倩.数字图书馆的图像版权保护研究[J].情报探索,2014,(5):112-115.

[10]李旭东.用于图像资源版权保护的SVD域数字水印方法[J].现代情报,2014,34(11):75-78,95.

[11]姜明芳.适用于电子图书版权保护的可逆可见水印方案[J].现代情报,2014,34(2):58-61.

[12]Rani A,Raman B.An Image Copyright Protection Scheme By Encrypting Secret Data With the Host image[J].Multimedia Tools and Applications,2016,75(2):1-16.

[13]AEAE Hossaini,ME Aroussi,K Jamali,S Mbarki,M Wahbi.A New Robust Blind Copyright Protection Scheme Based on Visual Cryptography and Steerable Pyramid[J].International Journal of Network Security,2016,18(2):250-262.

[14]Ahuja R,Bedi S S.Copyright Protection Using Blind Video Watermarking Algorithm Based on MPEG-2 Structure[C]//IEEE International Conference on Computing,Communication & Automation,2015:1048-1053.

[15]Kamnardsiri T.Digital Art Image Copyright Protection Using Combined DWT-DCT Based Watermarking Technique[C]//The International Conference on Digital Arts,Media and Technology(ICDAMT 2016),2016:83-94.

[16]Hashmi M F,Shukla R J,Keskar A G.Real Time Copyright Protection and Implementation of Image and Video Processing on Android and Embedded Platforms[J].Procedia Computer Science,2015,46:1626-1634.

[17]施华.图像处理中的稀疏表示理论及应用研究[D].厦门:厦门大学,2016.

[18]梁俊荣.基于Hadoop的图书馆复合大数据存储系统研究[J].现代情报,2017,37(2):63-67.

[19]金静,党建武,王阳萍,等.自适应低秩稀疏分解在运动目标检测中的应用[J].计算机科学与探索,2016,10(12):1744-1751.

(责任编辑:郭沫含)

猜你喜欢
数字资源版权保护大数据技术
图书出版版权保护的困境与出路思考
当前传统媒体版权保护的难点及对策
互联网环境下的音乐版权保护
评价高校图书馆数字资源综合服务能力
传统媒体版权保护面临八大难关