刘银娣
[摘 要] 随着数字化转型的逐步深入和“大数据”时代的到来,欧美大众出版商开启了大数据应用的艰难探索,与读者建立直接关系,获取海量数据;将数字阅读平台与社交网络相结合;并依托专业团队,建立图书大数据挖掘与分析能力。我国出版企业应用大数据的时候要注意在数字化转型过程中即建立大数据意识;联合行动,共同建立出版大数据分析平台;并明晰自己的需求和目标,制订大数据应用规划。
[关键词] 大数据 大众出版商 欧美出版
[中图分类号] G239 [文献标识码] A [文章编号] 1009-5853 (2015) 04-0082-04
1 欧美大众出版商应用大数据的背景
2008年9月14日,伯利斯·卡克卡(Boris Kachka)在《纽约杂志》(New York Magazine)上发表了一篇题为《终结》(The End)的长文。该文宣称:“图书业已经不再是具有前景的产业”“以兰登书屋、哈珀·柯林斯、西蒙与舒斯特等为代表的现行大众出版模式已经穷途末路,难以为继”[1]。然而,2014年企鹅兰登书屋集团(Penguin Random House,2013年7月企鹅出版集团与兰登书屋合并成立的新的大众出版集团)、哈珀·柯林斯(HarperCollins Publishers)、西蒙与舒斯特(Simon & Schuster)、阿歇特出版集团(Hachette Book Group)和麦克米伦(Macmillan)这全球五大大众出版集团中,除了阿歇特出版集团的数字出版产品收益占总收益的比重比上年略有下降,仅为10.3% [2]外,其他四家集团财报显示,其数字化产品收益在总收益中的比例均在缓慢上升(尽管上升的幅度开始变小),且均超过了20%。费伯出版社(Faber & Faber)以及布卢姆斯伯里出版社(Bloomsbury Publishing)等中小型独立大众出版商也逐渐走出了自己的数字化创新道路,并开始与亚马逊、苹果、谷歌等大型技术提供商争夺谈判筹码和话语权。
在出版业数字化转型过程中,出现过多股信息技术创新热潮,有些确实深刻推动了商业和社会变革,有些则最后被证明只是炒作。正如马克·韦泽(Mark Weiser)曾经说过的:“在我们这个时代,最高深的技术是那些令人无法察觉的技术,这些技术不停地把它们编织进日常生活,直到你无从发现为止”[3]。大数据正是这样一项技术。大数据整合云计算技术,将触角伸到包括社交媒体在内的能用网络连接起来的所有海量信息资源,引发信息技术变革的重点由“T”(技术)逐渐转向“I”(信息)转变,并对以“信息”为主要工作对象的出版业形成了直接而巨大的冲击。就专业出版企业而言,其从各个科学研究领域获取、加工并制造大量数据集,本身就在出版大数据;对于教育出版企业而言,数据和分析已经成为实现企业目标至关重要的手段,他们整合学科教学材料、数字化学习方式、交互式课程学习标准以及教材学习效果测量等建立教育平台,并将教育平台与学校信息系统相联系。而大众出版商尽管在数字化转型中未像伯利斯·卡克卡所说的那样“难以为继”,但在新的大数据浪潮中明显不像专业出版商和教育出版商那样具备“先天优势”。尽管如此,从2012年开始欧美大众出版企业在数字化转型过程中也开启了应用大数据的艰难探索。
2 欧美大众出版商大数据应用策略
由于缺乏海量数据和利用数据分析推动出版决策的思维,欧美大众出版业在利用大数据做出更加理性而明确的决策方面远远落后于教育出版业和专业出版业。因此,在大数据应用方面,欧美大众出版商首先着眼于获取海量数据,并在社交媒体热潮兴起的过程中将数字阅读平台与社交网络平台相结合,实现其内容产品的“精准营销”。除此之外还依托专业团队,建立图书大数据挖掘与分析能力。
2.1 多渠道与读者建立直接关系,获取海量数据
包括连锁和独立书店在内的实体书店近10年来一直在衰退,其总销售额在这一时期不仅没能增长,反而有所下降。与之相反,亚马逊、苹果、谷歌等网络书店在这一阶段的增长速度却非常惊人[4]。对于欧美大众出版商而言,这是好消息:得益于这些网络销售渠道,图书(包括电子书)销售量和销售额都在持续增长,而且,通过这些网络销售渠道,出版企业可以更好地了解读者。但这同时也是坏消息:出版企业并不是那些了解读者的人。这种状况的产生主要是由历史原因造成的:大众出版业的读者非常分散,多年来B2B(Business to Business,企业到企业)主导的商业模式使得出版商未能直面读者,因此也就无法获取自己读者的相关数据。为了解决这一问题,欧美大众出版商利用多种途径与消费者建立直接联系。
首先,欧美五大大众出版集团以及一些中小型大众出版商纷纷开设官方网站,并在自己的网站上增设售书业务,增加与读者直接交易的机会。然而,出版商网站流量较低,致使其逐渐开始采取更加灵活有效的网络售书策略。一方面,它们借助作者的知名度为其建立电子书店,增加用户流量,提高用户忠诚度,并获得更多有价值的读者数据。例如,哈珀·柯林斯出版集团就为C.S.路易斯(C.S.Lewis)等多位知名作家建立了电子书店,为收集第一手读者行为数据打下基础。另一方面,欧美大众出版商还自建数字图书仓库,将读者从搜索引擎引导到自己的数据库,增加与读者直接接触的机会。例如,西蒙与舒斯特集团就基于自建的数字图书仓库,将读者从谷歌图书搜索(Google Book Research)页面拉回自建的数字图书页面,从而获得可观的读者数据。
除了自建图书销售平台外,欧美大众出版商还加强合作,联合建立大数据分析平台,并通过数据共享获取海量数据。2013年2月,阿歇特、西蒙与舒斯特和企鹅共同出资建立了网络书店——书呆网(Bookish.com)。除了这三家企业外,书呆网还与42家出版商建立了合作关系,包括哈珀·柯林斯、麦克米伦、霍顿·米夫林(Houghton Mifflin Harcourt)、兰登书屋(Random House,Inc.)等[5]。书呆网集合这45家出版商的内容资源开展网络图书销售业务,与读者建立直接联系。但是正如其首席执行官阿尔迪·哈扎伊(Ardy Khazaei)指出的,书呆网的主功能是“图书发现工具”而不是网络书店。书呆网成立伊始就一方面通过聘请6位专业书评人为读者提供专业的图书推荐;另一方面利用现代信息技术开展更多有价值的工作,包括收集社交媒体和媒体新闻中关于某本图书的所有描述和广泛的读者评论,挖掘出与图书相关的所有重要主题,提供功能强大的数据集,将大数据技术应用到图书知识中,努力打破亚马逊对出版数据的垄断等,致力于成为原创内容读者和作家 “最青睐的客户端”[6]。经过近两年的运作,书呆网逐渐发现专业书评人的图书推荐未能起到帮助读者发现自己所需图书的目标。因此,2015年它取消了这一业务,重新组建了编辑队伍。编辑队伍更重要的职能是发现图书而不再是通过书评方式推荐图书,同时它更多地将图书发现功能拓展到对社交媒体读者评论数据的挖掘上。截至2015年4月1日,其在脸书(Facebook)上已经有18677位粉丝,在推特(Twitter)上也有13587位关注者[7]。关注其社交媒体账户的读者数量看似并不庞大,但是这些读者的用户黏度、活跃度都非常高,其产生的读者数据已经可以极大地帮助书呆网更快更好地发现阅读需求的变化,并帮助读者发现那些真正符合其阅读兴趣的图书。
2.2 将数字阅读平台与社交网络平台相结合,实现内容产品“精准营销”
随着互联网技术的发展,阅读不再仅是一种个人体验,而是可以在众人之间分享的社交行为。尤其社会化阅读的兴起将社交有效地嫁接到了阅读平台上,不仅提升了阅读的传播效力,同时也为出版商更好地了解读者提供了重要的平台和渠道。在此背景下,欧美大众出版商纷纷将其数字阅读平台与社交网络平台合作,并利用大数据技术深入挖掘和整合社交媒体中的读者数据,以实现内容产品的“精准营销”。
2007年8月,哈珀·柯林斯正式推出“内部浏览”(Browse Inside)网站。 该网站将数字化阅读、图书销售平台以及社交网络平台相结合,允许用户在线浏览几页图书内容,同时也向我的空间(MySpace)、脸书(Facebook)等社交网站以及亚马逊等图书销售平台提供数字仓库中的图书内容。使用者在博客和个人网页上点击“Browse Inside”按钮,就会出现插件形式的图书页面。12 月,该网站又增加了“站内搜索”(Site Search)功能,读者可获得哈珀·柯林斯网站上与该书内容相关的节选内容及相关链接[8]。兰登书屋也在社会化媒体兴起伊始,就在脸书、推特、优兔(YouTube)等社会化媒体平台开设自己的“社区”,与读者进行互动、交流,并为不同用户提供一个网上交流平台,然后根据用户的反馈及时更新内容。除此之外,兰登书屋还宣布与苹果应用软件开发平台Mobile Roadie合作,启动了读者社交网站“读书地带”(www.readerplace.co.uk)[9]。2013年11月14日,兰登书屋宣布与图片分享网站“兴趣图片”(Pintrest)合作,将独特的“兴趣图片”技术整合到官方网站中,网站访问者通过“兴趣图片”技术可以更快地发现最受欢迎的图书和作者,读者如果发现自己喜欢的内容,也可以直接将图片发布到“兴趣图片”平台上[10]。数字阅读平台与社交网络平台相结合帮助欧美大众出版商更好地了解读者需求及其阅读行为,通过深入挖掘这些读者数据,一方面可以实现其内容产品的“精准营销”,降低营销成本;另一方面,一旦作者或读者的“粉丝”在社交媒体上与其他人分享了这些内容,那实际上也就起到了宣传和营销的作用。
2.3 依托专业团队,建立图书大数据挖掘与分析能力
大数据离出版业已经越来越近,然而欧美大多数大众出版商实际上并不具备处理大数据的能力,无法独立组建内部图书大数据分析系统。这并不意味着放弃对大数据的应用,欧美多家大众出版企业借助外部专业从事图书大数据挖掘与分析的专业公司,例如图书观察者(Bookseer)和封面蛋糕(Covercake)等帮助其收集海量数据,推动大众出版业真正成为 “需求驱动”的产业。
图书观察者和封面蛋糕是两家专注于图书市场数据收集的专业图书大数据挖掘与分析企业,其定位是出版商的大数据解决方案提供者。通过提供数据,它们帮助出版商做出图书出版和营销决策。其中,图书观察者于2012年成立,是一家专门为出版市场提供市场分析和情报的专注于图书营销的数据服务公司,由英国出版老将皮特·克林利基(Peter Collingridge)和技术专家斯蒂芬·贝特(Stephen Betts)建立。图书观察者可以跟踪和收集各种媒体数据,包括推特、脸书以及亚马逊销售博客(Amazon Sales Blogs)这些社交媒体的数据以及尼尔森图书观察(Nielsen BookScan)的销售报告、谷歌的搜索数据等。收集数据后,它利用大数据技术整合所有馈送数据(data feed),并形成可视化的时间轴,允许出版商对这些数据点进行必要的连接。目前,英国三大大众出版商——企鹅(企鹅兰登书屋)、阿歇特、哈珀·柯林斯都是“图书观察者”的大数据分析服务的订阅者。与之相似,封面蛋糕也为出版商提供从各个社交媒体平台上跟踪和收集的数据及其分析结果,它还可以基于社交媒体平台上关于某本图书的所有评论数据生成曲线图和评分。该企业得到了美国连锁书店运营商百万书店(Books-A-Million)的支持。二者签订了一项协议,提出将会基于封面蛋糕的大数据技术帮助“百万书店”提升图书销量以及读者的购书体验。
3 对我国出版企业应用大数据的启示
欧美传统出版企业在大数据应用方面的探索,既为我国出版企业的大数据应用提供了宝贵的经验,同时也迫使其抛开将大数据看作“概念炒作”的疑虑,有计划、有步骤地应用大数据推动出版业的深刻变革。
3.1 在数字化转型过程中建立大数据意识
从欧美大众出版企业大数据应用的案例中,可以看到“数字化”是“数据化”的基础;若想把大数据融入出版业,实现数字化转型非常重要,否则“大数据”只能成为出版业的陷阱。如果无法实现数字化转型,我国传统出版企业只能联合当当、亚马逊、京东商城等图书网络销售平台获取大数据。且不说这些销售平台是否愿意向出版企业提供读者购买行为和阅读行为数据,就算他们愿意提供,要价必然非常高昂。当前,我国传统出版业数字化程度还不太高。在这个时期,抛开“数字化”去盲目跟风炒作“大数据”概念是不合时宜的;因为要实现在内容、阅读、服务、管理方面的“数据化”,首先得将“数字化”进行彻底。在“大数据时代”已经到来,并对商业、政治等领域造成巨大变革的时期,完全无视“大数据”的数字化转型也是不恰当的。我国出版企业应当以数字化转型为主要发展方向,同时建立大数据意识,并在转型过程中首先实现内容和业务信息的数据化。在此基础上,确定自己的大数据应用需求和目标,定义自身的价值数据标准,确定大数据收集、存储的类型和范围,着力夯实数据基础,扩大数据规模,扩展数据容量,收集、存储更全面有效的出版数据及相关数据,成为规模数据拥有者[11]。
3.2 联合行动,共同建立出版大数据分析平台
出版业在使用大数据方面有很多优越条件,因为其主要工作对象 ——“内容”本身就是一种重要的数据。目前的实际情况是出版界几乎完全不了解其图书的销售以及阅读情况,无法实现为其生产的内容或提供的服务找到消费者和读者的企业目标,但是这些知识几乎都可以通过数据分析得知。对于传统出版企业而言,除非他们能够建立与消费者直接接触的渠道,否则就会被大数据的发展浪潮抛弃。尽管目前我国大多数出版社都建立了官网、社交网络账户和移动客户端,但是这些平台用户流量有限,仅靠这些渠道数据远远不够。欧美大众出版商为了掌握一手读者数据资源共同出资建立“书呆网”,并以此作为开展出版大数据分析的据点和平台。我国出版企业目前的专业化和集中化程度也不高,由于成本原因很难获得需要的“大数据”。因此,要想真正获取海量出版数据,建立大数据应用的基础,就需要整个行业联合行动,建立统一的图书销售和阅读平台,将各个出版企业的信息资源整合成海量的数据资源库,掌握一手用户阅读行为数据,才能真正进行大数据应用和创新。
3.3 明晰需求和目标,制定大数据应用规划
出版业负载着许多数据点:不同销售渠道和形式(印刷和数字)的图书销售数据;亚马逊、当当网等不同渠道的销售排名情况;图书价格数据;各种畅销书排行榜;社会媒体评论;主流媒体和新媒体以及社会阅读网站的评论;促销(广告等)和交易数据等。一方面出版企业需要尽可能地收集各种数据点,构建一本包括所有零售商那里的销售进展和读者需求、阅读倾向图表的书,帮助出版商得出自己的结论;另一方面,出版企业还要能够清晰地了解、描述其需求和目标。因为不管一种工具多么强大,如果运用者不清楚自己的需要,就无法得到有效的应用。因此我国出版企业在利用大数据技术时,首要的问题不是选择合适的工具去完成工作,而是明确想要达到什么目标以及如何达到目标。目前,对于全球出版业而言,如何制订有效的大数据战略,尚无非常成熟的经验可供学习。这对于我国出版企业而言,既是挑战,也是重要发展机遇。因为在这个领域,我们和发达国家出版企业的差距还不是很大,都处于在黑暗中摸索的阶段。然而,摸索并不意味着可以随心所欲,我们仍然需要在明晰大数据应用需求和目标的基础上制订适合自己的大数据应用规划,并真正利用大数据技术推动我国出版业的深层次变革。
注 释
[1]Boris Kachka. The End[EB/OL].[2014-08-01]. http://nymag.com/news/media/50279/
[2]The Lagard鑢e Group. Lagard鑢e 2014 Full-year Results[R/OL].[2015-03-20].http://www.lagardere.com/fichiers/fckeditor/File/Relations_investisseurs/Resultats_financiers/resultats_annuels/2014/Presentation-DDH_RA-2014_version-reunion-analystes.pdf
[3]徐子沛.大数据[M].桂林:广西师范大学出版社,2013:50
[4]Calvin Reid. BISGs MIP 2013: A New World of Big Data, Complexity and Collaboration[EB/OL].[2015-02-21].http://www.publishersweekly.com/pw/by-topic/digital/conferences/article/57253-bisg-s-mip-2013-a-new-world-of-big-data-complexity-and-collaboration.html
[5]Bookish. Partners[EB/OL].[2014-07-20]. http://www.bookish.com/partners
[6]Edward Nawotka. Bookish.com Launches, Applies Big Data to Book Discovery[EB/OL].[2014-07-30].http://publishingperspectives.com/2013/02/bookish-com-launches-applies-big-data-to-book-discovery/
[7]About Bookish[EB/OL]. [2015-04-01]. https://www.bookish.com/about/
[8]渠竞帆.哈珀·柯林斯引领大众出版数字化潮流:整合成就全球业务立体布局[N].中国图书商报,2008-12-05
[9]修安萍.美国大众出版社之转型研究[D].武汉:武汉理工大学,2012:34-35
[10]Random House. media & publicity[EB/OL].[2014-12-20].http://www.randomhouse.biz/media/publicity/files/2013/
09/Heartland_PressRelease1.pdf
[11]姚永春. 出版企业掘金大数据的两个层面[J].出版广角,2014(4):28-32
(收稿日期:2011-10-09)