浅谈基于图像识别技术的云报纸

2017-06-08 03:44杨建方
中国传媒科技 2017年4期
关键词:图像识别报纸模块

■文/杨建方

浅谈基于图像识别技术的云报纸

■文/杨建方

在信息技术飞速发展的今天,互联网新媒体作为一种新兴传播方式,如雨后春笋般迅速崛起。互联网新媒体凭借着多元化、及时性、快速性、互动性、广泛性等特点,不断冲击传统纸媒的发展。本文主要介绍图像识别技术如何为传统纸媒与互联网新媒体牵线搭桥,使报纸的静态内容翩舞灵动,使有限的篇幅扩充完善,使偏角的广告立体呈现,衍生出全新的商业模式。

图像识别;云报纸;传统纸媒;融合;应用

引言

在互联网媒体异军突起、传统纸媒饱受冲击的情况下,我们是否需要摒弃传统纸媒,转战新兴媒体呢?答案是否定的。在新媒体时代,各种信息良莠不齐,真假难辨,而纸媒多年发展的职业品性,使其对真实性的坚守近乎苛刻。同时传统纸媒发展至今,往往具有强大的采编队伍作为支撑,而新兴媒体虽有海量性、广泛性等特点,但其在原创性、深入报道上较传统纸媒占劣势。

综合传统纸媒和互联网媒体的优势,两者融合发展迫在眉睫。现今大多数传统纸媒仍然是将付费阅读、广告的模式从纸上搬到网上,为了解决这种纯粹的文字数字化现状,下面来介绍一下两者深度融合的领路人之一(图像识别技术)及其融合新事物(云报纸)的概要和应用。

1.技术概要

1.1 什么是图像识别技术

图像识别技术是指通过图像扫描、采集平台获取图像信息,对图像进行预处理,去除无关信息,将原始图像转换成适于计算机可处理的图像特征,最终通过对特征的计算、比较和分析,判断出图像的状态或本质,得到最终的输出结果。

1.1.1 图像信息获取

图像信息获取是指通过扫描图像或捕捉屏幕图像的方法,将原始图像用图像矩阵中的像素点表示,每个像素用红(R)、绿(G)、蓝(B)三基色的8位灰度值(0-255)表示并存储。其中捕捉屏幕图像包括键盘捕捉、软件捕捉、视频捕捉、相机拍摄、摄像机拍摄、网络下载、制图工具等。

1.1.2 图像预处理

图像预处理主要是为了消除图像中的无关信息(干扰、噪声、差异等),将原始图像转换成适于计算机处理的图像特征。总体来讲,图像预处理主要包括图像的增强和图像的复原[1]。图像增强技术是指在图像处理过程中将人们感兴趣的图像特征有选择性地突显出来,并削减或去除无关的信息,它主要包括灰度调整、平滑减噪、图像锐化等。

1.1.3 图像特征提取、分析

图像特征提取旨在对图像信息进行整理、分析、归纳,提取能准确反映图像本质的特征值,同时最大限度地简化数据,最终使这些特征值具备精简性、完整性、准确性、可测性。1.2 云报纸概述

云报纸是指利用图像识别技术,读者通过智能移动终端设备拍摄报纸图片、版面、标题等信息的方式,打开云端对应的多媒体互动信息。

2.融合现状和融合措施

2.1 融合现状和缺陷

随着互联网的发展,人类在生产生活过程中,除了身临其境的现实世界以外,还被虚拟世界所包围,传统纸媒作为现实世界的成员之一,如何改变两者之间格格不入的窘境?当下大部分媒体采用版面刊登超链接二维码的方式,有些媒体还采用交互式报纸、采写个性化报纸等方式,试图填涂两者之间浩瀚的鸿沟,然如泥神过江,自身难保。

二维码不属于报纸版面内容,也不属于广告、新闻图片范畴,它是强加给报纸的版面“补丁”,它虽然给读者提供了丰富报纸内容的“传送门”,却影响了报纸版面的美观性和直观性。

为了解学生对三稿式写作教学模式的认可度,明确他们的真实意见和态度,笔者使用李克特5级量表设计了调查问卷。问卷分为两大部分,分别调研学生对句酷批改网作文反馈和三稿式写作教学模式的态度和看法。调查于第十六周后测结束后的二十分钟内进行,共收回有效问卷39份。之后笔者依据目的抽样原则选取6名同学(优秀、中等和较差各两名)进行了访谈。

交互式报纸以其昂贵的价格、复杂的工艺和未能解决批量生产等原因,使其在融合之路上“未引先迷”。

采写个性化报纸需要复杂的技术、大量的采编人员,且市场小众化、印刷复杂化。另外,读者必须提前预告兴趣内容,使读者和采编人员需要大量的时间开销。

2.2 融合措施介绍——浅析图像识别技术在云报纸平台中的运用

读者使用智能终端设备(智能手机、PC等)的图像识别工具,对传统报纸、数字报纸等的图片、版面、文字等进行扫描或捕捉,将获取的区域以图像形式在终端处理和识别,最终得到访问云报纸内容的目的。本文以报纸核心内容之一的文字为例,对于图像识别技术在云报纸中如何穿针引线,发表一下个人对云报纸平台的浅薄理解,如图1为云报纸平台文字识别结构图。

2.2.1 数据采集/存储模块

该模块完成对图像的获取工作,通过对纸质报纸扫描,或通过爬虫技术,对数字报纸定时采集和存储,从而获取研究样本。存储中由于有图像文件需要处理,所以结合使用数据库和文件系统的形式,采集的图像直接保存在文件系统里,并利用数据库存储图像的路径、识别结果等,为生成字典打下基础。训练样本模块与分类识别模块描述类似,这里不再展开。

图1 云报纸平台文字识别结构图

2.2.2 图像预处理模块

该模块主要完成对图像的阈值分割(灰度化、二值化等)、边缘提取和形态学处理三个环节,然后利用提取出来的边缘信息计算文字的形状特征。

Gabor变换属于加窗傅立叶变换,Gabor函数可以在频域不同尺度、不同方向上提取相关特征。另外Gabor函数与人眼的生物作用相仿,被广泛应用于图像纹理识别上。

该模块将归一化后的图像与Gabor滤波器卷积从而得到Gabor特征。在图像质量较差的情况下,为了提高平台的识别率,可引入一种特征加权的技术。此方法根据特征矢量中邻近分量的离散程度对其本身进行加权,从而使离散程度相对较小的特征分量在分类中的作用得到加强,并且使得离散程度相对较大的特征分量在分类中的作用得到减弱。[2]基本思路是将邻近的特征抽取子窗口构成一个特征加权组,在这个组内按照相应的规则,进行权值计算,最后将求得的权值作用于该组内的各个特征值。最终将Gabor变换后的结果输入分类识别模块。

2.2.4 分类识别模块

该模块使用libSVM或Matlab的SVM作为支持向量机的实现,这里以libSVM加以阐述。平台采用libSVM进行训练和分类,选取国家一级字库中的3755个常用汉字,以及二级字库和部分低频汉字,对于每个汉字,分别用m种常用字体和n个大小模板参数生成m×n个样本,采用其中的(m-1)×n个作为训练样本,提供给SVM作为学习过程的输入向量。学习完成后,针对剩下的n个作为测试样本的图像进行分类测试,从而实现文字识别。

3.云报纸的应用

3.1 云报纸在视频中的应用——云播

云播主要包括云直播和云点播两部分,云会议和云教育是目前云播的重要体现形式。

云会议作为目前最先进的通讯技术之一,使用户摆脱了时间、地域的限制,通过网络实现实时高清的远程会议和交流。云报纸作为宣传系统的重要成员组成,以其广泛传播的性质,预报会议开始时间、地点、内容、参会人员等,读者仅需扫描报纸图片即可准时进入会议现场,参会人员表达建议、媒体人员采写稿件、受众读者发表评论,如临其境。3.2云报纸在新闻中的应用——云新闻

云新闻是指基于云计算商业模式应用的新闻网络平台服务。在云平台上,所有的新闻供应商、代理商、策划服务商、战略决策、价值管理、战略投资、制作商、行业协会、管理机构、行业媒体、法律结构等都集中整合成资源池,各个资源相互展示和互动,按需交流,达成意向,达到放大企业的价值成长与基业常青的目的,从而降低成本,提高效率。[3]

3.3 云报纸在社交中的应用——云社交

云社交的引入,报纸版面仅需保留姓名、性别、年龄、工作等基本信息即可,读者一扫,便在云端展示对应的详细资料(即时QQ、MSN、微信、手机号码等),相较于传统报纸的社交更具及时性、直观性、便利性、开放性、广泛性。

3.4 云报纸在营销策划中的应用——云营销

云报纸下的云营销(以下简称云营销)依靠云端软件、报纸、移动智能终端等主要媒介,通过网络把静态营销转换成在智能终端的实时参与。比如促销单位发放的优惠券刊登于报纸上,用户扫描后直接进入领取兑换,做到“见报即优惠”。

3.5 云报纸在广告和消费中的应用——云广告、云消费

云报纸下的云广告(以下简称云广告)是基于云计算商业模式下的广告服务平台,通过智能终端扫描或捕捉报纸画面,将静态广告以静态或动态的多样化形式呈现。

云报纸下的云消费(以下简称云消费)突破传统店铺面积限制、陈列限制、库存限制,突破时间与空间限制,突破商品与服务限制,通过智能终端扫描或捕捉报纸画面,将产品或服务以货币形式展示给用户,用户通过云支付方式快捷安全地支付。

云广告、云消费作为云营销的两个重要分支,衍生出巨大的商机。

4.总结

云报纸的运作需要大量的采编人员和新媒体运作人员,大家需要彼此互相支持、通力合作。

图像识别技术作为当前重要的计算机前沿技术之一,云报纸仅仅是其应用领域的沧海一粟,作为一名报人,更作为一名技术工作者,需要更深入地挖掘探索,将其应用到报业发展的各个领域。在互联网时代,运用图像识别技术,使万物互联、万“像”互联。

[1] 孙凤杰,崔维新,张晋保,张旭东,肖学东.远程数字视频监控与图像识别技术在电力系统中的应用[J].电网技术,2005,29(5):81-83.

[2] 汪驭超,曹嘉.基于Matlab分析的Gabor滤波技术和SVM在交通标志识别中的应用研究[J]. 公路交通科技(应用技术版),2011(05):265-268.

[3] 莱芜分类信息.洛阳g3云推广服务中心 [EB]/[OL]. www. laiwunews.cn/xinxi/22238336.html,2016-07-09.

(作者单位:绍兴日报社)

TN911.73

A

1671-0134(2017)04-073-02

10.19483/j.cnki.11-4653/n.2017.04.016

猜你喜欢
图像识别报纸模块
28通道收发处理模块设计
“选修3—3”模块的复习备考
报纸
基于Resnet-50的猫狗图像识别
高速公路图像识别技术应用探讨
图像识别在物联网上的应用
卖报纸
可以吃的报纸
图像识别在水质检测中的应用
卖报纸