新闻出版业大数据应用新业态分析*

2015-01-30 15:29:03石佳靓孙建军
中国出版 2015年15期
关键词:新闻出版图书数字

□文│闵 超 石佳靓 孙建军

在新兴信息技术的推动下,人类社会各领域、各行业产生的数据量呈现出前所未有的爆炸式增长,由此也激发了各行各业对自身产业变革的历史机遇的关注。[1]

信息内容一直以来都是新闻出版产业最重要的资源,在大数据环境下,信息内容的表现形态呈现出显著的变化趋势。这些新特征包括:①数字化:即信息内容从传统纸媒向电视、电脑、平板、智能手机、电子阅读器等新媒介转移;②碎片化:即信息内容的组织粒度由原先的整体细化到篇目、章节甚至词句;③语义化:即利用自动识别工具实现语义查询、自动对比、概念关联等功能,内容交互性大大提高;④可视化:例如通过数据统计、分析、挖掘等技术发现新闻线索,依靠可视化技术以形象化、艺术化的方式加以呈现;⑤动态化:在传播过程中利用视频、音频和图片等方式动态呈现,同时通过用户参与不断动态优化产生的信息内容;⑥社交化:即用户消费信息产品时还能享受到经由社交媒体渠道传递的社交体验;⑦个性化:即不同兴趣的用户能够获得更加符合自己口味的内容产品,甚至能够发现自身的兴趣增长点。

一、国内外新闻出版新业态

信息作为新闻出版内容的核心构成,在大数据环境下呈现出崭新特征,由此生成新型的新闻出版形态,进而催生了一批新闻出版新产品、新服务和新应用。对于大数据环境中出现的新闻出版新业态,我们分别从新产品(涵盖出版、印刷、发行环节)、新服务和新应用三个角度进行梳理。其中新产品是指那些位于产品研发端的,已经成型、形态清晰而且相对完整的新产品;新服务是指那些位于用户消费端的,为用户提供的、相对零散的、全新内容服务或者体验;新应用则是指新闻出版机构为支撑新产品、新服务,对数据资源进行的有效利用与尝试。

1.国内外新闻出版新产品

语义出版。语义出版利用语义技术对文本进行深度描述,满足用户基本需求之外的文献分类、注释、关联推荐等深层需求。[2]国内外知名出版机构,如《自然》杂志(Nature)、英国皇家化学会(RSC)[3]、爱思唯尔(Elsevier)、[4]中国知网、万方数据、人民出版社[5]等已经纷纷推出自己的语义出版模块。

动态图书。动态图书通过用户参与,产生量身定制、自由访问、及时更新的个性化内容,如Chen 等人[6]介绍的开放式几何“动态教科书”和克利乐葵(Coliloquy)公司为亚马逊金读(Kindle)电子设备提供的“动态小说”。[7]

按需印刷与按需出版。按需印刷和按需出版重新组合了出版发行的各个环节,是数字环境下的一种全新印刷出版方式。[8]如英格拉姆内容集团将按需印刷与行业发行网络无缝连接,改善了库存状况,降低了运营成本。

数据新闻。数据新闻从精确新闻发展而来,重视用户参与,用数据代替文字讲故事。[9]《卫报》[10]《纽约时报》、英国广播公司(BBC)、美国有线新闻网(CNN)以及我国门户网站都开设了相关栏目,为用户提供轻量化的阅读体验。[11]

数字教育产品。数字教育被视为数字出版领域最具盈利前景的产品模式,大数据应用在数字教育领域也将大有可为。电子教材更便于搜索、记录、复制、粘贴等操作,还可以跟踪和分析学生的学习行为,便于教师因材施教。

2.国内外新闻出版新服务

自助出版。自助出版是一种颠覆传统出版盈利模式的快捷出版形式,[12]更符合Web 2.0 时代“去中介化”和“以用户为中心”的理念。它不仅可以有效缩短出版周期,而且能够增加著作权人对出版物的控制和收益。

图书社交。图书社交是在图书制作和营销过程中加入社交元素,借助社会化媒体满足用户的社交需求。其平台聚集了大量用户和图书数据,具备强大的图书推荐和传播能力,可以提升社区成员购书的意愿和需求。

个性化推荐和预测。传统意义上的个性化定制根据用户阅读过的内容,推荐与之相关的内容。一种更高层次的推荐服务是,更加关注读者的阅读规律,发现并推荐连读者自己都没有发觉的感兴趣的领域,《纽约时报》是这方面的先行者。[13]

创新的数字内容服务。优质内容经过碎片化、语义化之后,形成优质的数字内容资源,在此基础上可以创造出丰富的数字内容服务。如亚马逊的“页购”服务、金牌用户免费服务、云图书馆服务和无限制订阅服务(Kindle Unlimited),等等。

3.国内外新闻出版新应用

大数据能够在选题策划、营销推广、用户研究和定价优化等方面协助新闻出版机构作出科学决策,并已有诸多有益尝试。

选题策划。运用大数据技术有助于发现潜在热门题材,描摹人物形象。除了为人熟知的 《纸牌屋》,读者数据还能被用来描摹理想主人公的形象,使得人物情节更符合读者的口味。[14]比如Coliloquy 对浪漫小说中完美男主角“有着纯正欧洲口音、30 岁上下、黑头发、绿眼睛”的勾画即基于对读者阅读状态的统计。

营销推广。利用大数据技术,科学制定图书营销方案,追踪营销效果。哈珀·柯林斯出版集团基于自有数据库和图书销售平台,利用大数据技术分析图书营销的关键影响因素,从而制定科学的图书营销战略。[15]还有一些出版数据挖掘公司专门从事图书营销成效的追踪工作,例如图书观察者(Bookseer)、封面蛋糕(Covercake),等等。[15]

用户研究。利用数据分析预测用户行为,改进阅读体验,提高用户黏性。巴诺书店在销售非小说和长篇纪实类文学作品时,分析读者可能产生倦怠的节点,在其中添加视频、网页链接等内容,吸引读者继续阅读。[16]《纽约时报》则基于网站900 万的日均访客量数据分析可能会取消关注的用户,从而采取措施增加他们的留存率。[17]

定价优化。利用大数据优化产品定价、广告定价。例如哈珀·柯林斯出版集团通过整合数字销售和定价数据集,分析数字销售影响因素和需求弹性变化,将分析结果综合运用到市场战略和定价战略中;《金融时报》也利用大数据分析,参考多种变量(位置、用户、目标参数、地区、时刻等),优化广告定价,取得了良好效果。

二、新闻出版机构面临的大数据挑战

大数据技术带来了全新机遇,借助大数据,新闻出版机构可以提高生产效率、优化营销模式、拓展产业链条、提升内容价值,等等。挑战与机遇并存。当大数据由理念落地为实践时,隐藏的问题和困难将逐渐浮现。新闻出版机构应该对大数据可能带来的挑战作出清醒的预判和充分的准备。

1.大数据考验出版机构数字化转型成效

大数据的本质是更加广泛、深入的数字化,出版业对大数据的利用应以行业数字化转型、媒介融合为基础和支撑。中国传统出版业还处在数字化转型的关键期,要想在内容、阅读、营销、管理等方面实现“数据化”运作,首先应继续深入推进“数字化”。在出版企业内部没有建立起统一的数据标准、构建统一的数据共享平台、完善数字出版组织管理架构的情况下,推进大数据战略将困难重重。

2. 大数据带来“数字鸿沟”和“信息孤岛”问题

“富者愈富,穷者愈穷”的马太效应,在行业数据资源分布上体现得更加明显。如果没有相应的基础设施、专业人员及配套的政策保障,数据采集工作在传统出版企业中将难以开展,由此在出版企业之间横亘起一道道“数字鸿沟”;如果只是各部门、各机构各自为战,采集到的数据也只是分散、芜杂、互不关联的数据,从而在企业内部形成一座座“信息孤岛”,数据的效用得不到最大程度的发挥。

3.大数据考验出版机构数据管理能力

大数据背景下,信息的战略价值愈加凸显,与此同时,也不应忽略由此带来的数据管理问题。在企业内部,数据真实性、完整性、一致性、关联性和有效性直接关系到数据质量问题;在网络环境下,内容的流动性和阅读的数字化,让数字版权保护成为一个严重的问题;在数据资产化后,极易引发滥用数据与侵犯隐私等法律、政策和伦理问题。

4.大数据考验出版机构数据变现能力

对产业组织而言,大数据问题的本质不是技术创新,也不是数据形态的多样化,而是实现“数据驱动业务”的相关战略与战术。数字化转型和大数据战略的实施,将企业的前期投入转化为数据基础设施及相关配套资产。如何合理有效地开发利用得来的用户数据、产品数据、销售数据等战略资产,将其转化为出版生产力,成为出版机构亟待解决的问题。

5.大数据考验出版机构数据人才储备

任何战略和行动最终都落实到个人,对传统出版机构来说,大数据问题尤其如此。目前我国出版产业的专业人才大多属于传统出版领域,既熟知传统出版又懂数字出版及其经营模式的复合型人才则相对匮乏。如何培养和吸引这样的复合型人才,为其分配合适的工作和岗位,最终在企业内形成专业的职能部门,是对出版机构的又一考验。

三、国内外新闻出版机构的数字化战略部署

国内外新闻出版产业界涌现出的一批新产品、新服务和新应用,对于提升新闻出版机构的运转效率、产品价值和用户体验等起到巨大推进作用。这些新闻出版新业态的出现,得益于相关机构的远见卓识、对行业变革的深刻预判以及通过一系列行之有效的战略措施作出的战略部署。他山之石可以攻玉,下文将总结一些主要的战略举措。它们尽管根植于相异的社会环境和文化体系,但是并不妨碍我国新闻出版机构择善而从,从中汲取经验,抓住大数据机遇。

1.传统出版与数字出版协同发展

对大多数新闻出版机构而言,传统业务仍是生存的基础,销售收入的大部分仍然来自传统业务;数字业务则是发展的基础,未来收入的大部分将来自数字业务。传统出版和数字出版业务协同发展,相互促进,是实现资源优化配置和持续发展的稳健举措。一方面应该继续重视传统业务,细化市场划分,丰富图书品类,确保销售收入;另一方面对优势内容资源进行多次开发,延展资源价值,不断拓展数字新业务。

重视数字产品研发,深入推进新闻出版机构的数字化转型。国外出版传媒集团的数字化转型思路概括起来有两条:一是以自建内容分发渠道、强化内容生产实力为核心的转型思路,二是以投资、收购业务相关或者特色创新的新媒体企业为核心的转型思路。兰登书屋、哈珀·柯林斯、麦格劳·希尔等的数字出版收入占总销售收入的比重已占到1/4~1/3。[18]

2.灵活创新数字产品和服务

从产品研发到营销,新型数字业务可以在多个环节、多个维度展开。产品创新的方式和途径也是多元化的。国外企业的多元化战略存在两种模式:水平多元化模式,即“图书—网络—手机—电视—电影”一体化的发展模式;同心圆多元化模式,即以出版产业为圆心辐射相关产品和相关领域,避免不熟悉的业务领域。

在营销方面,用做传统媒体的思维做营销是远远不够的,新媒体需要新的营销思维,国外相关机构在两条战线上下功夫。其一,为自己做营销,在产品促销、付费模式、用户定位等方面有所创新,如电子书分页购买服务、《纽约时报》的“收费墙”服务、亚马逊的精准图书推荐等。其二,更进一步为别人做营销,从提供广告版面升级为提供营销解决方案,如美国第一大报业集团甘乃特顺势开展的数字广告、比价服务等在线营销业务。

3.积极采纳和拥抱新技术

大数据时代,新闻出版机构的本职并非创造新技术,却可以积极采纳和拥抱适合自身的新技术。历史悠久的《纽约时报》采用亚马逊云服务和弹性计算服务,通过建立存储了海量早期文章的数字档案(称为“时光机”),不但获得了大数据量实时传输能力,而且极大地节省了信息技术投资开销。[19]英国皇家化学学会利用非关系型数据库,以可扩展标记语言(XML)的形式存储了数百万份图片、论文等科学数据社交媒体数据,使其期刊、论文出版数量成倍增长。

对于数字技术的引进问题,国外新闻出版机构的解决方法主要是成立专门的技术部门,或者直接收购或与技术提供商合作。然而,一个更深层次的问题可能是新技术与原有业务的融合。为此,出版企业应当着力推进技术融合,建立全域数据模型,重视数据标准化和规范化工作。对于不断涌现的新技术,新闻出版机构应该采取的态度既不是漠然处之、不为所动,也不是苦命钻研、狂热崇拜,而应该是敞开怀抱、灵活采纳,使新技术成为新旧业务相融合的桥梁和支撑。

4.利用网络社区和社交网站聚拢用户

无论是作者还是读者,用户始终是优质内容的创造者和消费者,传统产业市场份额的流失本质上是用户的流失。在保留和拓展用户时,增进用户的社交体验和网络社群归属感,效果是显著的。《纽约时报》一方面建立时报人社区,为读者提供自由交流、反馈意见与评论的网络平台;一方面在面书(Facebook)、推特(Twitter)等社交网站上建立专页、专题以吸引年轻读者。亚马逊则在2013年收购了世界最大的读书社交网站古德瑞兹(Goodreads),扩张其图书社区计划。这种读者参与的社交化机制,不仅有助于了解读者的阅读兴趣,而且自动汇集了大量的读者数据和图书数据,为信息定制化服务奠定基础。

5.数字化管理降低运营成本

传统新闻出版机构开展数字业务的问题在于,在其成本结构中,非数字业务收入的减少量大于数字业务收入的增加量,开展数字业务的收入往往不能弥补非数字业务的损失。因此,他们首先要做的是提高优质内容的生产效率,从而获得较高的内容产品溢价,利用数字化的管理手段降低运营成本就是一个行之有效的方法。兰登书屋不仅对供应链效率进行投资,而且投资管理智能系统,使得零售书商的效率可以不断提高。巴诺书店旗下的诺克(NOOK)自助出版平台能够将其上游出版者进行有效整合,为其编辑出版提供便利途径,并且进一步联系下游的印刷发行环节,优化产业效率。亚马逊海量资源的低价战略,同样归功于其利用信息技术和巨额投资降低网站运行成本、人力成本和物流成本的运营成本控制策略。

6.吸纳和培养大数据人才

任何战略部署最终都落实到个人,不少传媒集团都设立了关于数据和新媒体运营的高层职位、专职部门或者成立有关信息技术和服务的子公司。《纽约时报》和《华盛顿日报》分别聘请了哥伦比亚大学的数学家和网络统计专家担任首席数据官(CDO),组建机器学习团队,开展数据模型的建立工作。高端数据人才及其团队为传媒机构注入了新鲜血液和活力。

传媒机构一方面需要促进人员的新媒体转型,使习惯传统生产方式、管理方式的媒体人转变观念和工作方式,适应数字化新媒体的要求;另一方面,应重视大数据人才的招聘和培养,通过引进新型人才,设立专门岗位,形成强大的职能部门,培育起能在大数据时代下开疆拓土的新媒体力量。

注释:

[1]赵国栋,易欢欢,糜万军.大数据时代的历史机遇:产业变革与数据科学[M].北京:清华大学出版社,2013:35-38

[2]Semantic Enrichment: The Key to Successful Knowledge Extraction from STM Literature[R]. Chennai, 2008

[3]翁彦琴,李苑,彭希珺.英国皇家化学会(RSC)科技期刊语义出版模式的研究[J].中国科技期刊研究,2013(5)

[4]翁彦琴,彭希珺.爱思唯尔(Elsevier)语义出版模式研究[J].中国科技期刊研究,2014(10)

[5]张炯.大数据引领的三种新型出版模式之实践[J].出版发行研究,2014(7)

[6]Chen X, Li W, Luo J, et al. Open geometry textbook: a case study of knowledge acquisition via collective intelligence[M]. Berlin Heidelberg: Springer, 2012

[7]吴赟.产业重构时代的出版与阅读——大数据背景下出版业应深度思考的五个关键命题[J].出版广角,2013(23)

[8]欧懿,燕今伟.按需印刷和按需出版及其对图书行业的影响[J].图书馆理论与实践,2011(5)

[9]徐锐,万宏蕾.数据新闻:大数据时代新闻生产的核心竞争力[J].编辑之友,2013(12)

[10]文卫华,李冰.大数据时代的数据新闻报道——以英国《卫报》为例[J].现代传播:中国传媒大学学报,2013(5)

[11]魏金梅.大数据时代的用户新闻生产[J].采写编,2014(3)

[12]王武,彭巧灵.“出版平民化”的狂欢泡沫——析自助出版在中国普及的可行性和面临的困境[J].编辑之友,2012(12)

[13]《媒介》编辑部.放眼看海外——国际报刊媒体探索案例汇编[EB/OL].媒介,2013(5)

[14]姚永春.出版企业掘金大数据的两个层面[J].出版广角,2014(4)

[15]刘银娣.数据驱动出版:基于大数据的传统出版模式变革研究[J].中国出版,2014(15)

[16]陈砚青,徐璐明.小心:你读书时,“书”也在读你[EB/OL].中国作家网,http://www.chinawriter.com.cn/wxpl/2012/ 2012-07-10/133900.html, 2012-07-10[2014-11-11]

[17]崔绮雯.从《纽约时报》看传统媒体拥抱科技变革[EB/OL].ifanr,http://www.ifanr.com/401362, 2014-02-14[2014-11-11]

[18]谭跃.关于出版国际化的主要思考[J].中国出版,2014 (17)

[19]Tewari K. Leveraging Big Data Opportunities for Growth [EB/OL]. Publishers' Forum , http://publishersforum.de/wpcontent/uploads/2013/04/KrishnaTewari_LeveragingBigData.pdf, 2013-04-01[2014-11-11]

猜你喜欢
新闻出版图书数字
马克思新闻出版思想的文本考释及其当代启示
图书推荐
南风(2020年22期)2020-09-15 07:47:08
欢迎来到图书借阅角
答数字
班里有个图书角
关于新闻出版改革的若干思考
新闻传播(2016年10期)2016-09-26 12:14:49
数字看G20
南风窗(2016年19期)2016-09-21 16:56:12
论新闻出版中少儿图书的版面设计
新闻传播(2016年1期)2016-07-12 09:25:12
长三角新闻出版职教创新联盟在上海成立
出版与印刷(2015年4期)2015-08-15 00:45:53
成双成对