出版企业应用大数据技术的挑战及对策

2017-12-15 21:28王兆国
现代出版 2017年5期
关键词:出版合作大数据

摘要:在大数据技术及其应用日益广泛的趋势下,出版企业面临获取大数据资源不足、适合大数据技术模式的复合型人才短缺等突出困境,亟需在通过与大数据产业融合、完善技术人才储备等方面破局。

关键词:出版;大数据;合作;人才

近年来,我国有关大数据的政策支持力度不断增强。例如,2015年9月,国务院发布了《促进大数据发展行动纲要》(国发[2015]50号),对支撑大数据发展的国家级统一平台进行了总体规划,体现出国家层面对大数据发展的顶层设计和统筹布局。由此可见,大数据已成为国家信息化深化发展的核心主题,發展大数据已成为构建数据强国、推动大数据治国的必然选择。在此影响下,出版企业有必要将大数据技术更好地应用于业务中,探索出版资源与大数据技术有效结合的可行路径。

一、大数据技术带给出版企业的机遇

对出版企业来说,书刊等产品发行后销售情况如何,具体哪类读者购买,市场上同类产品的销售情况如何,诸如此类的问题对经营决策非常重要,但在传统出版模式下无法及时地获得反馈。大数据技术的应用,使得及时准确地回答上述问题成为可能。

目前对于大数据的理解阐述,虽然描述不一,但大多存在一个普遍共识,即大数据具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。从大数据技术的特点来说,高速、廉价的数据处理技术将极大地提升出版企业的出版、发行效率,实现对出版流程的“实时监控”和精益管理。如图1所示,基于大数据的预测将为出版企业的产品策划提供方向,为构建出版业的生产流程、运行机制、产品形态、盈利模式等带来机遇。

在大数据应用上,一些出版企业已经初尝胜果。例如,浙江少年儿童出版社根据产品在一段时问内的市场总销售额计算产品的备货周期和提印数量,京东商城通过分析8000多万用户购买行为得出不同产品的关联消费规律。美国学乐出版集团、Callisto传媒公司、MSN Now数字出版企业等均是率先运用大数据技术开展产品策划、用户服务等内容的先导者。

二、出版企业应用大数据技术面临的挑战

大数据的最终价值在于如何高效利用已经产生的数据资源,并从中挖掘可利用的信息,以便为企业生产经营决策服务。相比大数据在金融、通信等行业中的应用,出版企业在大数据应用方面典型的成功案例不多,多数企业持观望态度。究其原因不难发现,应用大数据技术,出版企业面临着数据运用、分析、挖掘、预测、共享等诸多困难,其首要挑战是究竟如何获取自身所需要的数据、如何利用好这些数据,也就是构建出版企业的数据采集、分析和整合模式;其次是出版企业在获取有效数据的渠道、数据分析模式、人力资源等方面的不足。

1.出版企业获取外部大数据的渠道不足

大数据时代企业所面对的主要问题是数据的获取和分析。出版企业要想在大数据时代有所作为,须在掌握传统数据获取和应用能力的基础上,推进新型的包含统计分析、信息智能和语言处理等综合性数据挖掘技术能力的提升。当前全社会尚未建立数据集成的开放大数据共享平台,因此除了企业自身的数据来源外,移动阅读基地、大数据服务商、社交媒体、电子商务平台等成了出版企业获取数据为数不多的途径。

第一,移动阅读基地。移动阅读基地以手机、专用阅读终端、平板PC等为主要载体,具有在线阅读、本地书籍完美支持等特性。目前最有影响力的是中国移动手机阅读基地和电信天翼阅读。2014年中国移动阅读基地网站月访问用户突破1.3亿人次,日均点击量超过6亿次,产业合作伙伴近600家,是国内规模最大的掌上新媒体平台。电信天翼阅读是一款多屏无缝连续阅读的一站式数字阅读平台,截至2015年5月,图文阅读内容超过35万册,已有注册用户突破2.4亿。上述阅读基地可以对用户进行细分和肖像描述,从而提供更加个性化的数据,便于出版企业进行深度挖掘从而制定策略。

第二,专业大数据公司。国外出版行业的大数据技术应用主要针对电子书和数字出版物,目前已有相对成熟的专业大数据公司为出版企业提供服务,如美国的Hiptype公司、Netflix公司等。出版企业采购其数据分析报告,利用大数据分析辅助出版选题策划、内容生产、精准营销。Hiptype公司专门开发了一套电子书阅读分析工具,根据与电子书有关的丰富数据做大数据分析,能够提供用户年龄、收入和所在地理位置等信息,能告知出版商多少读者看完免费章节后进行了购买,多少读者阅读完了全书,能统计读者平均阅读页数,最喜欢从哪些章节开始或结束阅读等。Netflix公司是一家数字内容选题辅助分析的数据供应商,利用大数据分析对海量用户信息进行数字内容数据分析,为出版商提供读者的具体行为数据分析。国内方面,开卷公司除了每年的销售数据报告外,也从2015年开始对服务进行升级改造,并推出了“Smart在线查询分析系统——模型库模块”,为出版企业用户进行选题、发行、经营管理提供数据分析和结果展现。出版企业通过数据交易的形式可从电子商务平台手中获得大量的出版物交易、用户评论等数据。

第三,电子商务平台。截至2016年6月,我国网购用户达到4.8亿,比2015年6月底增长0.63亿,呈现出持续增长的势头。就图书市场来讲,2015年全国图书零售市场同比增长12.8%,销售额达到624亿,动销品种数为168万种。实体书店零售市场继2014年实现3.26%增长之后,2015年继续保持正向增长,同比增长0.3%,规模达到344亿。同时,网上书店零售市场规模保持高速增长,达到280亿左右,同比增长33.21%。电子商务的迅猛发展为出版企业记录了大量的历史交易数据:包括用户的购买时间、购买商品种类、购买数量、支付金额等。阿里、京东等主流电子商务平台都推出了自己的数据交易业务。

第四,网络社交媒体。社交媒体是指在web2.0基础上,由用户自己生产内容、进行交流的网络媒体应用总和。社交媒体在中国兴起的时问不长,但我国使用社交媒体的人呈几何级数增长。根据《2015年中国互联网、社交和移动数据报告》的数据,截至2015年底,我国社交媒体用户6.59亿,超过了美国和欧洲的总和;其中手机社交媒体用户5.74亿,占到了社交媒体用户的87.1%;用户平均每天要花1小时43分钟在社交媒体上,几乎占总上网时间的一半。移动阅读行业规模持续增长,2015年移动阅读市场规模达108亿,同比增长22%,占移动数字出版领域比例逐年增高。网络社交媒体保存了海量数据信息,可拿来为我所用。例如,国内某出版社在编制《2015年度图书销售大数据分析报告》时,采用的销售数据不仅来源于社内统计软件和当当网、京东网等网店平台,还包括出版社的官方微博、官方百度贴吧、豆瓣官方小站等社交媒体。

尽管上述移动阅读基地、大数据公司、电商平台、社交媒体掌握的大量图书销售数据是出版企业重要的用户数据来源,出版企业可借力获得大量的产品反馈信息,然而,目前针对数据服务平台、数据分析、数据应用等产品和服务还没有建立统一的标准,基于数据买卖和合作的数据挖掘外包服务等还不规范,对我国大多数出版企业来说,对通过上述渠道付费获得的数据应用,大多仅仅停留在定性分析上,远没有到完全信任数据的真实性和可靠性,并由此来制定或调整企业产品思路、发展规划的程度;另—方面,除了数据的真实性有待完善外,上述来源往往会出于商业运作等方面的考虑,以致可能对数据有所保留。例如,出版企业只能获得图书的销量,却无法获得目标读者更详细的个人信息,比如读者的收人隋况、阅读喜好、购买意愿等,这将无法进一步细分目标群体并进行针对性的出版活动。

2.数据分析模式构建难度大

大数据的建构是一个集数据采集、加工、标引、统计、分析、建模、服务于一体的数据生产体系,面对海量数据,出版企业只有建立了科学有效的数据分析模式,才能应用数据服务出版的各项工作。由此,企业需要在什么样的网络平台上实现大数据带来的管理、销售、服务的变革,是出版企业面临的最大选择困境。

首先,相比通信、互联网等行业,我国出版业在资本、技术等方面的整体实力较弱,再加上出版企业长期以来“重内容、轻技术”的传统,使得我国出版企业在构建数据分析的生产经营模式时开始就处在了弱势地位。

其次,我国出版业的大数据服务存在诸多不足:第一,数据服务商提供的服务还局限于对出版企业原有的内部数据进行挖掘、分类和整合,而针对企业所需的外部数据的专业分析明显不足;第二,数据应用的效果主要集中在缩短出版生产时问、节省成本、提升出版物的格式转化效率等初级的出版流程优化上,而出版企业亟需的挖掘用户需求、创新服务形式的数据挖掘能力较弱;第三,出版企业间缺乏数据共享,加之数据服务商的信息标准不同,导致出版企业各自为政,使得数据重复加工的现象严重。出版企业自身构建大数据平台受制于资金、技术等方面,而依托外部的數据又难以达到企业的要求,上述多重因素导致了出版企业在大数据面前“多看少动”的局面。

3.适合大数据技术模式的复合型人才短缺

大数据技术属于新兴的高新技术,它改变了传统的信息传播模式,改变了出版从业者特别是编辑人员的工作理念,使得参与出版流程的主体、对象、场所、途径、方式和结果等都发生了一系列新的变化。大数据的上述特点将对传统的出版流程进行重构,不仅对相关出版企业的软硬件配置提出了严格的要求,相应的运行机制也要以数据为中心,进行科学合理的设计。笔者认为,不论是运行机制的重构,还是部门的重新组建,能够实现相关职能的人才是根本。

第一,出版企业欠缺大数据技术人才。当前出版业的数字化出版转型包含了产品形态技术的数字化、出版流程的数字化,以及为用户提供多元化数字信息服务业务等多个方面。就出版流程数字化来说,无论是编校审环节采用的协同数字编纂平台、销售环节采用的电子销售平台,还是用户反馈环节购买、阅读、评价、修改建议等行为,每个环节都会产生大量的出版数据。面对一个集数据获取、加工、利用和反馈为一体的系统化、流程化模式,出版企业必须配备诸如数据分析师、数据可视化专家、数据库程序员等大数据技术人员。大多数出版企业不具备该类人才,但可以根据自身实际和所处发展阶段选择引进此类技术人员,或者与其他技术类公司合作。

第二,“以数据为中心”运行机制所需的信息交互和管理人才。如图1所示,出版企业借力大数据技术的基础是具备数据驱动和交互的机制。随着出版活动越来越依靠数据的挖掘分析能力,构建以数据为中心的运行机制是出版企业的大势所趋。新的运行机制要求数据技术部门与编辑、营销、生产等部门联系更加紧密,响应更加快速,工作交叉也越来越融合。这就需要在数据技术人员与编辑、营销、生产等部门之间的信息交互和管理人才,要求既懂数据分析的来源,又能将数据背后的信息结合到有关的出版活动中,配合有关部门制定科学合理的决策。

三、出版企业应用大数据技术的可行路径

尽管对出版企业来说,大数据技术还是个新生事物,但现阶段的出版模式正在经历由技术驱动向由数据驱动转变,这已是不争的趋势,后者的优势在于以数据分析为基础的决策贯穿从选题策划、内容加工到内容传播与营销的整个出版过程。出版企业应用大数据技术,可从外部合作、内部机制完善、人才升级等路径展开。

1.外部与大数据产业融合

客观地讲,目前大多数出版企业自身对大数据应用的技术能力储备、对大数据出版项目的投入力度、对销售渠道的把控程度等,并不具备大数据应用条件,要充分利用大数据促进出版活动,加强出版业和互联网及大数据企业的合作可谓变通之举,如以外包、平台共建、资源共享等形式实现出版业和大数据产业深度融合,借力互联网和大数据企业的平台创新产业发展模式。对此,发生在2014年的两个案例很有代表性:一是长江传媒集团数字出版有限公司与淘宝网络有限公司签订合作协议,利用长江传媒的出版内容资源优势和淘宝网络在技术、营运和渠道上的优势,双方在平台搭建、数字内容资源和出版、选题策划营销等方面进行广泛深入的合作。另一个案例是IBM全球企业咨询服务部与陕西奥达集团合作完成的西北出版物物流基地项目,曾入选2014年中国各行业大数据应用案例TOP100。西北出版物物流基地的核心定位为以出版业为主,打造产业发展云平台,借助业务分析与优化,为人驻的出版企业用户提供数据分析,助力其决策。

2.内部完善人才储备和运行机制

如前文所述,出版企业应用大数据技术,获取数据、应用数据的能力是短板,但大数据商业价值的开发,又离不开数据技术的应用。因此,出版企业要想在大数据时代勇立潮头,就必须在大数据技术应用上提高运用能力和水平。具体来讲,一方面要引进或培养具有数据采集、储存、分析和应用能力的人才队伍,另一方面出版企业应提升数据分析水平,从多个业务层面着手,将大数据融入出版产业链多个环节之中,使其成为一种业务模式、组织资产和管理要素。

就前一方面而言,整个出版业可以说在人才队伍、资源、经验等各方面都很薄弱。近年来,我国部分地方出版企业在人才队伍的组建上初见成效,具体做法是:首先从数字出版部门和具有市场图书销售经验的编辑部门抽调骨干力量,组建专职团队。此外,再外聘三支兼职团队:一是能够采集用户数据的基础团队,二是能够开展数据分析、建模的技术团队,三是出版业内对大数据已经形成一定研究的专家团队。通过实施具体的大数据项目,三支兼职团队和一支专职团队逐步有效融合,初步打造出地方出版业可行、特色、可持续的大数据布局采集、加工、建模、应用、修订、完善的业务全流程。

就后一方面来说,加快线下出版数据资源的商业价值开发,构建由数据驱动出版行为的决策机制和运行机制,能有效推动出版管理、编辑业务和营销等各环节的转型和升级。例如,商务印书馆以该社出版的近30部字典工具书为基础,研发了高达40万词条量的精品工具书数据库,并提供关联检索、智能检索等个性化服务和知识化服务,实现了数据价值的有效利用。

(王兆国,武汉理工大学出版社副编审)

猜你喜欢
出版合作大数据
初中体育多样化教学改革的实践探索
众筹出版是一种出版创新
大学英语创造性学习共同体模式建构案例研究
基于大数据背景下的智慧城市建设研究
民国时期老课本出版略探
玛丽·安·伊万斯小说在中国的出版与接受
从西方青年学者与翻译家看中国出版“走出去”