大数据技术在图书选题策划中的运用分析

2022-08-19 02:06黄水飞
传播力研究 2022年20期
关键词:选题策划出版社

◎黄水飞

(江西高校出版社,江西 南昌 330000)

21世纪是数字经济时代,也是知识经济时代,中国出版行业在新的时代背景下正在逐渐改革升级,由传统单一的发展环境,逐渐步入多元化、开放化、创新化的发展格局,尤其是各类信息技术和新媒体技术的出现,新的读者群体对于出版业有了全新的要求,更加青睐于个性化、便携化、社交化的阅读体验。在这一进程中,出版业如果缺少对于新读者群体的需求分析,仍然是凭借传统经验或者是小面积问卷调查的方式了解读者需求、确定图书主题,就会导致出版风险增加,所出版的书籍不符合读者真实需要,提高了库存压力,导致投资失败。另外,新生代读者群体生长在网络环境中,对于传统的出版业营销手段并不熟悉,传统的图书选题策划也无法精准高效地传达给新生代读者,营销效果越来越不明显,出版业发展将面临全新的挑战压力。在这样的背景下,我国出版业应利用全新的技术手段,精准把握读者的关注需求,强化选题分析和优化能力,根据读者实际喜好精准高效地选择图书主题,提高营销效益,因此,大数据技术的出现对于我国出版业而言有着十分重要的意义。

一、大数据技术思维逻辑

本文讨论的大数据技术思维逻辑是指将大数据技术应用到图书选题策划时所采取的运用逻辑,应用大数据技术参与图书选题策划需要贯穿于图书出版、制作始终,随着我国现代文明建设的日益发达,社会各界对于文化知识的需求量也在逐渐增加,图书市场迎来了全新的发展机遇,也将面临更为激烈的市场竞争,出版业必须积极强化创新与改革,通过打造全新的业态格局来满足新的市场需要。利用大数据技术进行图书选题策划,需要从图书的组稿、编辑、设计、宣传、销售等一系列流程环节中融入大数据思维,以此来提高图书选题策划的效益与创造力。同时也要积极发挥大数据优势强化出版业与市场、与社会的沟通能力,结合市场发展趋势及时调整出版业图书选题策划能力,最大限度的规避新兴市场所存在的潜在风险与损失威胁,而这也是大数据技术应用时的底层逻辑[1]。

二、图书选题的思维逻辑

图书选题策划是图书出版前必须要进行的重要工作,将直接关系到图书出版后的成功与否,图书选题需要制定详细的计划方案,很多出版社会将图书选题视为一项特殊的系统性工作,会贯穿于图书出版的始终,对于全体出版社工作人员而言都将是一项重要的工作挑战,需要深度考量。具体而言,图书选题策划至少包含五个思维逻辑:

一是收集信息。由于图书选题工作是一项系统化的工作,也需要工作人员投入思想与创意,所以在工作之初需要收集大量的创意性信息,收集信息时也要充分注意到所收集到的信息价值和未来用途,既要体现出图书编辑的采编能力,也要强化出版社对于图书市场的敏感度。

二是明确立题。图书选题策划的过程中,立题将直接代表出版图书的主题思想,需要建立在大量信息基础之上,同时要有明确的出版目标,以此来确保图书选题工作的准确性[2]。立题时需要注意的是:首先,要能够体现出出版社的特色,争取打造个性化市场;其次,如果是策划大众读物,应该打开视野,挖掘市场大多数读者的阅读兴趣;最后,一定要抓紧时代发展先机,明确图书定位,找准立意的切入点。

三是市场调查。选题的过程中需要经过市场调查,以此来确保出版社投资的效益。当选题和投资项目基本确定后,出版社需要认真调查分析图书市场和社会反应,了解市场中一切与图书选题相关的知识领域以及相关专业行业的动态变化,在这其中挖掘图书出版后能够获得的竞争优势,为图书销售创造有利条件。

四是市场定位。当图书选题已经确定,且市场调查结束后,就需要开展市场定位设计工作,该工作的重点是根据市场调查结果确定图书规格、用材、风格、页码、定价等,根据不同的目标读者对图书进行细致化的设计,以此来瞄定市场走向[3]。后期将进入到生产制作层面,此时意味着项目投资已经开始,出版社在这一阶段的工作关注点是对图书印刷质量的控制。

五是营销策划。营销策划作为图书选题策划的最后一个环节,主要的实施步骤是:首先,图书出版之前进行预热式营销宣传,为图书出版造势,保障良好的宣传效果;其次,图书出版后的营销策略,在当前的技术背景下,需要开展线上宣传销售和线下宣传销售两方面的工作。为避免侵权事件的出现,面对目标读者时要积极引导读者阅读和购买,要保持图书销售长时间的热度,才能够使图书能够在一段时间内维持稳定的销量。

三、大数据技术在图书选题策划中的运用策略

(一)提取数据

以我国某大型图书购物网站为例,该网站的每一个图书商品页面都会列明记载图书相关咨询、图书属性、主题和卖点等。利用大数据抽取技术可以对网站上的数据信息进行挖掘和分析,并最终纳入到图书检索信息资源库中,为以后的图书选题策划提供原始数据支撑[4]。在大数据技术环境下,使用网页抓取技术,能够使图书的实体信息与市场需求信息同时被捕获到,并且可以容纳到同一个数据库之中,具体而言,大数据技术在图书网站上的数据获取过程如下:

一是提取图书ISBN号,并在图书信息中附加上“销量排名”“检索排名”“点赞排名”“猜你喜欢”等标签,这些都可以成为图书的销售推荐数据,也可以成为图书未来选题策划的切入点,网站需要将这些数据归纳和运用起来,将其拼接成图书网站的高级搜索标签。

二是模拟HYTP请求功能。在检索框中抽取图书链接,能够最后获得该购物网站中图书的真实网址和产品的ID。

三是根据上一步所获得的图书商品网址,利用HTTP请求来获得商品详情页和相关数据信息,利用大数据技术对其中的详细数据进行获取,数据将成为出版社图书信息资源库内的重要选题策划资料。

四是根据第三步所获得的图书ID,并根据互联网中的图书信息拼接成图书评价页面URL,提取读者评价,并将其纳入到图书选题策划市场动态信息数据资源库。

(二)挖掘数据

进行图书选题策划所需要的数据资源,在挖掘的过程中,需要关注两点要求,分别是浅度挖掘和深度挖掘,以某一金融类图书为例,对该书进行选题策划时,数据浅度挖掘和深度挖掘数据的具体开展方法是:

首先,进行数据浅度挖掘。此时会对图书相关的各类基本数据信息与市场需求信息进行比对,建立其市场数据统计分析系统,在浅层次上对该书的内在有利信息进行挖掘[5]。比如,可以挖掘读者在线阅读时的评价和热度等,根据这些数据信息对图书的选题策划进行数据基础建设。

其次,进行数据深度挖掘。此项工作较为复杂,需要根据图书选题策划信息进行筛选,利用贝叶斯算法以及大数据技术进行结果分析。贝叶斯算法使用流程可以分三个阶段来进行,一是准备阶段,利用网站中的大数据技术对图书选题策划数据进行收集整理,并生成相应的应用数据,可以为第二部的分类规则提供数据参考;二是建模阶段,网站后台系统会自动根据客户需求生成新的应用数据,并计算其中各个数据类别,对每个被计算过的图书属性进行信息分辨,按照属性类别提供图书选题策划数据信息,并且可以对下次检索时同类图书信息再次出现的情况进行预估验证,建立贝叶斯模型;三是分类阶段,系统会按照第二步数据信息建立起贝叶斯模型,对图书选题策略进行样本计算,推测图书选题策划样本属性,并且获得选题策划后的数据信息[6]。

(三)选题策划

1.需求分析

出版社需要根据当前图书市场的走势、读者需求、阅读情况反馈以及相关媒体报道、图书盈利走势来试试获取舆情发展信息。利用大数据技术,对各个生产经营环节进行信息化建设,并将其与互联网及相关网站进行融合建设,提供完善的数据信息量,提高数据获取和收集的效率,为图书选题策划工作提供源源不断的数据信息支持。同时,出版社为了能够满足读者的阅读需要,需要在大数据技术系统中建立起具备选题策划功能的工作模块,利用大数据技术挖掘图书选题策划工作中的资源,并建立不同的工作模块。本文讨论的是可以建立起四大工作模块,包括图书属性数据与市场情况分析模块、图书市场信息管控模块、图书市场信息存储模块以及图书选题策划数据挖掘模块。利用Jsoup等软件,对系统内的数据进行提取和分析,结合Hadoop文件系统来对这些数据进行管理和存储,这些数据都将成为图书选题策划的基础。利用大数据技术进行图书选题,模块设计和操作流程如下图:

2.功能设计

利用Jsoup软件对图书选题策划数据进行筛选和使用,需要基于Hadoop生态系统来进行开展,对本时期图书市场营销热度等信息进行挖掘,以供图书与选题策划使用。主要涉及到的功能设计包括:

首先,需要对图书属性数据和市场反馈信息进行收集。该项功能可以基于购物网站上的HTTP模拟技术来开展,可以直接获得网站上图书详情信息,并利用超文本文件分析技术筛选出无效信息,获取网页中的市场信息、用户行为信息、书记属性信息数据等,这些数据的提取将成为出版社数据库建立的重要资源。

其次,需要发挥数据挖掘功能。数据挖掘功能的发挥依靠的是浅度数据挖掘和深度数据挖掘两个方式,对于图书相关的海量信息而言,恰当地选择和分类才能够使数据挖掘工作更有效率和价值,可以使出版社的图书选题策划形成明确的功能分类,并且利于后期的深入选题工作。

最后,信息反馈功能。利用分析结果中所涉及到的图书制作日志来建立数据挖掘方案,使信息反馈结果能够发挥作用,帮助出版社建立完善的图书选题决策。

四、大数据技术在图书选题策划中运用的具体步骤

(一)准备阶段

在准备阶段主要是对信息进行积极的收集,作为预备环节,信息来源可以从以下几个渠道获得:编辑自有数据库、传统媒体数据库、网络新媒体数据库、门户网站数据库等等。以门户网站数据库为例,可以是国家官方媒体、中央网站等。在这些网站内搜索符合主流思想意识的,有利于实现社会效益和经济效益的重要价值信息,为后期的图书选题奠定基础。准备阶段需要使用专业数据挖掘技术和舆情分析软件,通过建立专业的领袖数据库来打通图书选题数据源头,领袖数据库将包含编辑身份信息、读者数量信息、发表文字数量等等。新媒体技术的发展已经颇具规模,自媒体的研究也日益成熟,利用大数据技术结合新媒体技术,对网络资源进行软件开发,具体而言,在进行信息扫描和词频统计时,可以使用ROST News Analysis Tool,在进行网页信息收集时,可以使用ROST Detail Miner技术软件。另外,在对新媒体进行研究和数据应用时,随着科学技术的进步,能够选择使用的软件技术将会越来越多,所以应用时可以进行更加精细的划分,比如,针对微博中的知微等大数据分析技术。

(二)策划阶段

图书选题策划阶段主要是编辑需要进行选题设计,提出投资的出版物题目、编辑的意图、内容走向、写作规划、编辑进度、截稿时间、作者和目标读者等,升级传统工作做法。本文讨论了利用大数据技术进行数据收集后,具体如何利用信息挖掘和舆情分析,来确定图书的题目、作者和读者,同时对选题进行辅助性的论证。

1.题目选择

图书题目目前可以从四个渠道来进行信息的筛选,网络媒体与新媒体可以使用特殊的大数据技术软件来协助信息挖掘工作,如果利用词频分析软件来对网络媒体与新媒体中的文本信息进行筛选,得到关键词列表,剔除无价值词汇后,按照词频的程度进行排序,排名靠前的词汇,来辅助图书命题工作,设计出有创新性的题目,在编制题目的过程中,可以利用语义软件,对题目词语进行多样化的设计和选择。

2.作者确定

在信息搜索阶段可以获悉在网络上一些热门作者信息、标签信息等基础信息,同时也能够获得作者作品信息数据库,比如,作者有哪些著作、读者口碑如何、市场销售情况如何等等,甚至还包括作者的文风、个人品格、兴趣爱好等信息,不仅可以分类分析,也可以进行总结性分析。同时,通过获取平台中的同类和异类作者的互动关系网络图,帮助出版社制定优秀作者名册。

3.目标读者

利用大数据技术手段获取读者信息是为了更为全面地去了解读者市场,找出潜在选题,以此保障出版社可以出版符合市场需要的图书。这一过程中,编辑必须积极关注读者的阅读体验,无论是个人亦或是群体,都要进行细致的分析,讨论读者的阅读体验和精神层面需求。目标读者的规划、分析、筛选应该与作者的选择步骤相匹配,这些也需要基于读者信息来进行,包括身份认证、标签划分、总结分析等,之后再针对不同类型的读者进行文本信息分析。

4.选题论证

图书题目的选择可以来自于网络各个渠道所获得的信息资源,而在大数据时代下,利用大数据技术可以充分发挥出网络媒体和新媒体的资源优势,利用特定的软件对各类信息进行深度挖掘。比如,可以使用词频分析软件,对网络媒体和新媒体中的文本信息进行筛选,得出关键词列表,剔除没有价值的信息后,需要对已经制定好的选题计划进行论证,论证逻辑思想是:对于背景类信息分析需要包含政策法规与行业发展;对于舆情类信息进行分析,则需要对目标选题是否符合国家要求,是否存在变动情况以及未来走势进行分析;对于原则类信息进行分析,主要需要针对出版社领导所制订的选题计划进行;对于同类选题进行比较分析,需要根据语义网络图再对选题进行论证时参考同类选题,一方面是对未出版的同类选题进行对比分析,判断是否有更大的可选性以及是否存在重复性问题,另一方面则需要对市面上已经出版过的同类选题进行对比分析,考证同类选题的市场销售情况,以此来预测该选题未来的市场价值。

五、结语

利用大数据技术进行图书选题策划工作有着明显的优势,可以促进出版社更好地适应现代化的时代,提高图书编辑与选题策划的效率,降低编辑工作压力,但是也存在着一定的缺陷。比如,技术应用专业性更强,容易出现偏差等等。所以未来出版社的发展水平将直接取决于大数据技术的使用能力,值得广大业界人士予以关注。

猜你喜欢
选题策划出版社
本刊特别策划
本刊特别策划
本刊特别策划
我等待……
本刊诚征“独唱团”选题
谈诗词的选题
本刊诚征“独唱团”选题
本刊诚征“独唱团”选题
今日華人出版社有限公司
本期策划