浅析大数据在图书出版行业中的应用

2022-11-05 01:44:04江小珍
今传媒 2022年6期
关键词:选题策划工具

江小珍

(北京航空航天大学出版社有限公司,北京 海淀 100191)

一、引 言

随着互联网的蓬勃发展,用户在PC网页或手机APP中留下了包括定位、消息记录、消费记录、阅读记录、评价等不同类别的庞大信息数据集,而如何从这些信息数据集所包含的海量数据中挖掘需求、发现机会,是包括出版行业在内的各行业需要面对的机遇和挑战。随着云计算等技术的普及,大数据技术的应用门槛和成本不断降低,非互联网企业也可以通过大数据技术对目标数据进行提取、存储、分析和可视化展现,以此发掘商业价值。出版社可以结合自身实际,由浅入深地逐步推进大数据在图书选题策划、图书营销发行等不同工作环节中的应用。

二、大数据的定义和特点

大数据 (big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过主流软件工具,在合理时间内达到撷取、管理、处理并整理成为帮助企业经营决策更积极目的的资讯。

(一)大数据的主要特征

1.数据体量巨大

据统计,人类有史以来的所有印刷品承载的数据量的大小是百PB(1PB=1024TB)量级。当前个人电脑硬盘的主流容量为TB(1TB=1024GB)量级,一些大企业的数据量达到了EB(1EB=1024PB)量级,公共互联网上的数据量则更加的庞大。

2.数据类型繁多

早期PC互联网上的主要数据是便于存储的、以文本或数字类型数据为主的结构化数据。当前,移动互联网上的非结构化数据占比越来越大,主要包括图片、音频、视频等类型的数据。数据种类的多样化对数据处理能力提出了更高的要求。

3.价值密度低和处理速度快

大数据价值密度的高低和数据总量的大小成反比,例如,在实际工作中,连续不断数小时的安防监控视频,有用的部分可能只有几秒。在类似的需求场景下,如何通过大数据挖掘技术来完成数据的“提纯”就至关重要。

(二)大数据和传统数据分析的对比

数据源的开放、公开、易获得是大数据的基本特征之一。一些商业机构会定期向社会提供数据源,如百度数据开放平台 (http://open.baidu.com);部分政府机构也会提供一些权威的开放数据源,如国家统计局网站 (http://www.stats.gov.cn);公共互联网每天产生的大数据可以通过应用程序接口 (API)和爬虫技术,在一定的开放性规则下获取或采集到,如阿里云的 API市场平台 (https://market.aliyun.com/)。而传统数据主要在机构内部流动,跨机构获取数据的壁垒和成本非常高。

大数据关注的是全部数据,而不是抽样数据。随着云计算成本的降低、数据挖掘算法的不断改进和丰富,以及机器学习和人工智能技术的发展,大数据对全部数据进行的分析应用法取代了传统的数据抽样分析法,使得数据分析的全面性和准确性得到了提升。

传统的数据分析重实证研究,强调在理论的前提下先建立假设,再收集数据来验证假设,是一种自上而下的决策和思维过程。而大数据重预测,这种预测是一种自下而上的知识发现过程,是在没有理论假设的前提下,去洞察社会现象、趋势和规律。例如,通过采集、分析社交网络上带有时间标签的海量信息,可以预测事件的发展走向、电影票房的变化趋势等。

与传统数据分析关注的因果关系不同,大数据关注的重点是“是什么”,而不是“为什么”。大数据分析更关注发现数据间的相关性,通过对海量数据进行相关性分析,可以发现那些不能靠直觉发现的信息和知识。

三、大数据在图书出版行业中的主要应用方向

图书出版工作的主要生产环节包括:选题策划、组稿、编辑加工、排版制作、印制、营销发行等。其中,在选题策划的指向性、营销发行的精准性上,大数据技术能够发挥其作用。

(一)大数据和图书选题策划

1.传统选题策划过程中存在的不足

广义来说,选题是指经过分析、考量,选中主题后拟实施的项目。出版社的传统图书选题策划过程主要依靠编辑在工作中所积累的经验,以及其所使用的市场调研手段,比如,问卷调查、书店探访等。这种传统的选题策划方式存在着调研数据样本较小、数据时效性滞后、人为主观性较强的缺点,并且,受编辑自身知识结构、工作经验、审美与价值观念的影响较大。

2.大数据技术对选题策划过程的优化作用

使用大数据技术可以有效优化传统的选题策划流程,提高选题的质量,从而提升出版社的整体选题策划水平。

首先,使用大数据技术围绕选题进行广泛的信息采集。信息采集的内容包括市场环境信息,比如,学术信息、行业信息、出版信息、竞争对手的产品信息等;读者的阅读需求信息,比如,用户阅读行为、购买记录、连载书访问量等。信息采集的来源包括:互联网上能够满足读者个性化阅读需求的平台,比如,博客、微博、论坛、贴吧、书评网站、各大门户网站的读书频道、文学网站、社交网站等;读者进行网上购书的主要电商平台,比如,当当、京东、亚马逊等;行业数据平台,比如,开卷数据、出版物数据中心服务平台 (PDC平台)等。

其次,使用数据挖掘与处理技术对收集到的各种信息进行梳理、筛选、挖掘和分析,并得出一些指向性的数据预测结果。这些预测结果的类型可能是近期热门的内容题材、某类书籍在市场中受欢迎程度、已出版的同类书籍的销售情况等,这些信息可以为选题策划的决策提供更准确的参考,降低选题失败的风险。

(二)大数据和图书营销发行

出版行业对大数据的应用还体现在营销和发行工作中。在互联网公司个性化的内容推送环境下,个性化、定制化、主动化已成为当代读者的需求和特点。人们对图书的需求开始变得更多元且细化,小众市场的浮现也创造了强大的市场价值,因此,图书的营销和发行也需要向更加个性化、精准化,更具及时性的方向发展和转变。为此,图书出版方可以通过使用大数据技术,从以下几个方面来提高图书的发行量:

1.时效性

研究发现,读者在电商平台的购买习惯和行为正在发生较明显的变化:读者购买的决策时间更短了。出版社在电商平台进行广告投放时,选择的时间段对交易转化来说非常重要。大数据营销可以基于对海量数据的处理,分析出读者最容易实施购买行为的黄金时段,从而指导其进行广告推送,这样更有利于提升产品的销量。

2.个性化

传统的图书营销以媒介为导向,出版社推送什么内容,读者就被动地接受什么内容。而大数据技术指导下的图书营销能够以读者为导向,根据读者的偏好和关注点,安排相关的内容并及时推送给读者。

3.关联性

大数据营销可以将广告与消费者的行为习惯进行结合,在每个时间段内上下关联,给读者营造一个完整的购买情境,从而激发读者的购买欲望。

4.性价比

大数据营销可以更加精准化地推送相关广告,做到有的放矢。相比之下,在达到相同的销售目标的前提下,大数据营销比传统营销所需要的广告量更少,性价比也更高。

四、出版社如何应用大数据

随着云计算及相关软、硬件技术的进步,大数据应用的技术门槛和使用成本在不断降低,但是,出版社在工作中尝试应用大数据时也存在观念难以扭转、技术人才不足等问题。出版社在应用大数据时要结合自身实际,由简单到复杂分步骤进行,以此减少阻力,实现平滑过渡。

(一)利用现有工具和平台

对编辑来说,掌握专业的大数据技术具有一定困难,而利用现有的大数据工具和平台来做数据采集和分析,既不需要编辑具备专业的IT技术能力,也无需出版社投入资金成本。从广义上的大数据应用来说,在编辑日常工作中,就已经在使用出版行业内的基础大数据工具和平台了,比如,开卷数据、出版物数据中心服务平台 (PDC平台)等。在出版行业以外,各大互联网公司和专业的大数据软件应用公司也提供了大数据分析工具,比如,字节跳动的巨量算数、腾讯的微信指数、百度的百度指数等。本文对上线较久的百度指数工具的趋势研究、需求图谱、人群画像三个主要模块,进行分析说明。

1.趋势研究

趋势研究通过对设定关键词的搜索量的数据进行比对,来分析某个方面的发展趋势,可以是不同关键词的搜索量之间的对比,也可以是对同一个关键词在不同时间段的搜索量之间的对比。比如,针对同一个领域的不同名家作者,可以借助趋势研究工具,对过去一两年内这些作者的搜索量进行分析对比,预测未来谁的合作价值更大;再比如,分析在一个出版大方向上的不同子方向,哪一个子方向的热度可能会更高;又如,分析、预测某类图书产品在未来不同的时间出版发行对销售的影响,等等。借助趋势研究工具,可以通过对不同关键词的搜索趋势进行对比、分析,并做出科学预判。

2.需求图谱

需求图谱可揭示用户在搜索关键词之前或之后经常搜索的词。图谱中的圆点越大,说明该词被搜索的次数越多;而离中心的圆圈越近,说明该词与设定的关键词的相关度越高。这一功能可以用来发现之前未发现的信息,也可以用来修正对市场的判断。比如,用选题名称或书籍拟用的名字作为关键词来做需求图谱时,可以看到用户搜索的其他相关关键词,这些相关关键词可能有助于发现竞争对手和相关线索,也可能有助于发现更易被用户接受的图书名称,甚至有助于发现这一领域较受欢迎的作者。总而言之,借助需求图谱可以发现更多的相关可能性和机会。

3.人群画像

人群画像是对互联网上搜索关键词的用户进行画像分析,包括地域分布和人群属性等。在利用人群画像提取了关键词访问人群在各省市的分布情况、年龄分布以及性别后,编辑可以据此修正图书产品的策划和工作思路,营销发行人员可以根据特定地域的用户偏好进行针对性地运营和推广,以实现图书社会效益和经济效益的双丰收。

(二)自建大数据分析工具

现有的大数据分析工具和平台的优点是使用成本低,缺点是不能很好地满足个性化和深入的大数据应用需求。有条件的出版社在现有大数据分析工具和平台不能满足需求时,可以投入一定的人力、物力资源去自建大数据分析工具。

自建大数据分析工具,首先要厘清需求。确定需要采集哪些类别的数据、从哪里采集、对所采集的数据如何进行数据项和维度分析、分析后的数据结果通过何种方式进行展现等。在厘清需求之后,可以建立自己的技术团队来进行研发,也可以外包给大数据软件公司进行研发。

(三)建立数据中台

出版社在应用大数据会遇到各业务板块、各自分散的大数据应用满足不了出版社整体需求的情况。比如,在数据管理方面,存在数据集分散、维护困难、人力耗费过多,部分数据休眠、应用弱,以及基础数据标准不统一的问题;在数据应用方面,存在信息获取不全面、决策信息支持不够的问题。解决这些问题需要基于出版社的实际情况,整合各业务板块中分散的大数据应用,建立出版社统一的大数据运营中台。通过打通社内数据、行业数据、公共互联网平台的数据和整合各项应用工具,无需来回切换不同的工具和平台,只需运用大数据运营中台就能实现各项大数据的应用需求。

1.选题策划

编辑可以使用选题策划工具,发现最有潜力的市场,提炼出不同读者群体的不同需求,挑选出社会公众关注度高的题材,并在社交媒体上发起市场调查,从而实现精准的选题策划。

2.营销发行

营销发行人员无需使用外部工具和平台即可对公共互联网平台的数据进行采集和分析,实现精准营销,提升读者的购买率。

3.运营管理

在数据处理方面,运营人员可以在数据平台中实现一次制作、全平台流转、自动更新;在经营分析方面,管理人员可以通过可视化的大数据进行结果展现,对出版社的经营状况有更直观的了解,从而做出更加科学的决策;在绩效分析方面,管理人员可以通过透视分析工具清晰看出图书的盈利情况,并通过关联分析对编辑的绩效了然于胸;在指标监控方面,管理人员可以在移动端随时查看各项经营指标,并且在经营出现异常时,数据平台会触发预设的指标阈值设定并主动推送异常报警消息,管理人员可以据此及时发现问题、修正问题。

五、结 语

以上是对大数据在图书选题策划、图书营销发行工作中的应用的初步思考和实践。

2021年,最火的互联网热词是“元宇宙”,先行的探索者们已经在尝试研究构建一个与现实世界平行的数字世界,这是大数据发展的一个令人激动的方向。目前,“元宇宙”还处于早期研究阶段,但大数据已经渗透到了各行各业,成为了影响社会生产和发展的重要因素之一。展望未来,针对大数据的挖掘及运用会带来生产方式的变革。出版社应顺应时代的发展趋势,积极利用大数据技术提升工作质量和效率,实现更好的社会效益和经济效益。

猜你喜欢
选题策划工具
本刊特别策划
本刊特别策划
本刊特别策划
波比的工具
波比的工具
本刊诚征“独唱团”选题
时代邮刊(2019年24期)2019-12-17 11:49:30
谈诗词的选题
中华诗词(2019年1期)2019-08-23 08:24:24
本刊诚征“独唱团”选题
时代邮刊(2019年16期)2019-07-30 08:02:06
本刊诚征“独唱团”选题
时代邮刊(2019年18期)2019-07-29 08:49:12
“巧用”工具
读者(2017年18期)2017-08-29 21:22:03