杨艳妮+袁甜阳子
[摘 要] 在考虑网络学习社区出版选题策划特殊性的基础上,提出网络学习社区的出版主题选择模型。基于对热门话题的采集及话题过滤分类等技术建立候选选题库,并结合人工辨识采集选题信息,从而探索提升网络学习社区出版选题组织效率的方式。
[关键词] 网络学习社区 网络出版 选题策划
[中图分类号] G232.1 [文献标识码] A [文章编号] 1009-5853 (2017) 02-0036-05
Topic Selection Planning of Publication Content in E-learning Community
Yang Yanni Yuantian Yangzi
(College of Art & Communication, China Three Gorges University, Yichang,443002)( Zhizhesihai (Beijing) Technology Co., Ltd,Beijing,100083)
[Abstract] Considering the particularity of the topic planning of E-learning community publishing, this paper puts forward the topic selection model of the E-learning community. Based on the collection of hot topic and topic filtering classification technology, it builds alternative selection database, and combines with artificial perception to collect topic information, so as to explore the ways to enhance the organization efficiency of the topic selection in E-learning community publishing.
[Key words] E-learning community Network publishing Topic planning
1 引 言
Web 2.0 环境下,网络学习社区作为一种新兴的网络信息资源创作与组织模式,用户拥有参与表达、创造、沟通和分享的能力,用户在网络学习社区中发布内容,虚拟学习社区环境则促进用户间的互动以及信息共享。网络学习社区包括内容资源、用户和平台组织,基于网络学习社区的电子出版物改变了传统出版的内容资源和组织方式,降低了出版的成本和门槛,因而成为网络学习社区传播内容的一种方式。自2012年5月豆瓣阅读上线,除了挖掘其自有内容资源和社区资源,也开启了出版代理模式。果壳、知乎、虎嗅和雪球等越来越多的网络学习社区开始输出社区内容、出版成书,占据图书排行榜,如《知乎日报》《豆瓣每日精选》等。
网络学习社区聚集了大量用户群体以及他们生产创作的内容资源,按照不同的兴趣偏好,用户群体可以划分为一个个社区群组,而主题丰富、数量庞大的信息资源则“散落”于社区空间中。内容资源是出版产业赖以生存和发展的核心要素[1]。好的知识内容吸引新的用户迁入网络学习社区,用户将内容以共享方式进行传播,在这一良性循环中,网络编辑如何有效利用社区零散的信息资源,将其重新分配、重组、传播是网络学习社区出版考虑的重要问题。海量数据对策划编辑的选题能力和信息处理能力提出挑战[2],在进行网络学习社区出版内容选题策划中,既要明确出版选题及选题实现承载着的知识传播与接受的功能,又要遵循社区信息资源传播的规约。在本研究中,在考虑网络学习社区出版选题策划特殊性的基础上,提出网络学习社区的出版主题选择模型。
2 网络学习社区出版选题策划的特殊性
我国网络出版工作和环境共同决定了选题策划必须符合政治性原则、创造性原则、价值性原则等基本要求。但对于各个网络学习社区而言,除了承担着用户信息共享、知识交流、文化传播等功能,作为盈利性企业组织,其每一项业务开发都应围绕企业整体战略目标运营。相较于传统出版社的网络出版工作,网络学习社区出版运营一方面随着网络出版物的传播扩散,学习社区整体的影响力得以扩大,延伸触达至非本社区用户,增加用户接受网络学习社区的几率;另一方面,基于对学习社区中优质内容的聚合和傳播,激励学习社区内优质用户的内容生产行为,增加用户的社区黏性,从而形成良性知识交流共享氛围。此外,培养“大出版策划”思维,将网络学习社区的选题策划和社区营销整合起来,实现网络学习社区出版的“双效”提升[3]。因此,综合网络学习社区其本身特点及学习社区网络出版功能来看,网络学习社区出版内容在选题策划上应精心策划考虑用户行为偏好和基于用户兴趣的主题内容。
网络学习社区品牌能带给社区溢价、产生增值,与学习社区相关的产品也会备受关注,社会化媒体环境下品牌效应会不断被放大。学习社区的知名度、可信度、口碑、定位决定了网站的转化率。对学习社区内容的结构化整理和系统性筛选,将高质量的内容以网络出版物形式呈现给用户,使用户获取知识的花费成本和耗费时间都降低。同时,当网络出版物通过其他媒介平台传播时,内容的质量、社区的品牌都会影响“社区外”的信息流转。
以《知乎周刊》为例,周刊的内页会有“查看知乎讨论”的选项,已经安装知乎App的设备会自动跳至应用内的相关页面,未安装的则会打开网页版社区讨论,而要进一步实现诸如添加评论、进行回答、关注问题等则需要下载App。然而只有保证推送内容品质,用户才有进一步使用App的意向。保证内容格调的相符,也才更有可能吸引目标用户下载。网络出版物的内容也反映学习社区的内容竞争优势,不同的社区在出版物类型上有所区别,以雪球为例,定位于投资行业的应用工具,作为投资领域的社交网络平台,其在亚马逊出版的电子书几乎均是与财经、证券、股票资讯等相关,当该领域读者阅览众多相关书籍均是由雪球出版,就会对雪球社区产生“专业”的印象,从而巩固社区品牌。
3 网络学习社区的出版主题选择模型
信息采集是编辑工作的起点[4],借助大数据分析处理方法,对出版内容选题进行采集,这有别于传统的内容选题策划方式,除了对网络媒介数据的搜集与整理,同时利用文本语义挖掘和处理手段,多样化地展示选题内容,将高质量的信息呈现出来。对于出版编辑而言,为了获取较为全面完整的主题信息,需充分发挥创新性思维,拓展并延伸网络媒介数据所反映的价值。因此,如何有效辨识网络学习社区中话题内容的来源,再造网络出版选题内容组织流程,实现计算机辅助的选题信息采集,对网络学习社区出版有着重要意义。在本研究中,结合对网络学习社区用户的行为数据挖掘以及各社交媒体、门户等平台中话题内容挖掘和再组织,以此实现网络学习社区出版选题策划,建立网络学习社区出版主题选择模型。
3.1 热门话题(Topic)
网络热门话题是网络社会中引起公众网民关注或参与讨论的各类事件的总括,它源于大众网民对社会各类现象和事物的看法。网络热门话题牵动着用户的情感波动,话题性强的出版物更能引起大众的兴趣,有助于出版物的销售和传播。如新浪微博平台,其公共传播属性明显,新浪热门话题常常及时反映社会热点,并呈现“先情后理”的话题演化趋势。热门话题热度值升降快速,能引起大众情感共鸣的微话题更容易成为热门话题,在一定程度上满足受众的心理需求。心理需求相似的受众会逐渐形成一个群体,并实现向群体心理的转变,形成某一类型的热门话题。本研究提出获取具有网络出版价值的热门话题的步骤和途径。
3.1.1 通过微博、门户了解话题走向
微博和新闻门户平台的热门内容反映了网络话题的走向,话题在社交平台的进一步扩散,也促进了话题的热度上升。社会化媒体环境下,热门话题的活跃程度主要表现在话题的传播深度和广度两个方面。基于对主流社交媒体平台(如微博、微信、短视频、直播及专业领域的交流平台等)的信息内容发掘及热点主题词分析以发掘新的话题。如2014年的马航失联事件在各大社交平台备受关注,成为最热门的话题,虽然是负能量事件,但因为关乎社会公共安全且当时没有及时给出定论,十分吸引用户关注。在事件发生后的各个时段,各新闻媒体有了大量关于马航的专题报道。图书出版领域也有了相关的书籍,例如中信出版社推出的《马航MH370失联十七天》等。
3.1.2 跟踪热门检索词发掘用户关注热点
检索是用户主动发现内容的重要方式。聚合用户的热搜词语,以及海量用户的搜索行为数据,以此发掘某一段时间大众用户群体的主要信息需求,如基于标题的热点挖掘也能够有效抓住一段时间内网站的话题趋势[5]。另外百度热搜和谷歌趋势均提供热搜词语榜单,且支持查看一年甚至多年热门话题的用户关注度和媒体关注的具体数值变化表。除此之外,谷歌趋势对不同城市、国家、语言的热搜关键字的搜索量以及相关主要新闻进行统计。而新浪微博首页每十分钟就会刷新微博的热搜词和热门话题。通过对这些热门检索词的抓取,基本上可以做到网络热点追踪的无延迟。
3.1.3 提取热门内容主题词
网络热点、焦点会对网民的观点看法产生较大影响并起到导向性作用。对于网络编辑而言,这都是反映读者需求的重要信息。基于正则表达式、PAT-Tree等网页文本抽取技术,对用户的搜索热点和新闻热点进行抓取。并结合词频统计分析对热门内容的主题词进行频次计数和排序,对频率较高的词语进行统计。词频统计方法操作简便易行,成本较低,但也存在一些问题,词语从热门文章中提取分离出来,缺乏语境要素,可能导致对主题词理解偏差,因此也需结合编辑的主观判断。
3.2 过滤分类(Classify)
由于热门话题的采集过程中,文本内容可能包含大量重复信息和广告信息以及其他无效数据,增加了后期的判断筛选工作,因而对采集内容进行过滤是非常必要的。以新浪微博为例,其推广营销掺杂在订阅流之中。针对社交媒体平台或门户网站的文本信息进行过滤,采用布隆过滤算法和朴素贝叶斯算法对重复无效的数据进行处理[6],过滤清洗热词的原始数据,以减少信息噪音。
另外通过对文本信息分类也可进一步筛选热词。将相似度高、类别属性相同的词语和内容进行聚类,以区分热门话题和内容的主题种类。基于话题有效性、品牌定位等条件进行分类设置,也能使话题范围进一步缩小,减少人工方式的信息标注,以有效简化流程并提高编辑在后期的处理效率。
3.3 备用选题(Aggregation)
经话题分类和筛选阶段,將热门主题词置于网络学习社区的资源库中进行检索和配对,对社区中内容进行评估,以判断相关选题是否有足够的内容资源来组稿。网络学习社区中用户和内容是体现价值的两大部分,因而针对不同选题的资源匹配不仅是内容层面的,而且要依据选题与用户兴趣偏好进行匹配,形成面向用户的推荐,这样有利于编辑在内容组织后期锁定目标作者,节约组稿时间成本。
在对选题相关信息的采集和处理基础上,形成系统的、有一定规格的候选选题库。这些候选选题来源于用户的关注焦点,紧跟时代热点,并且通过聚合社区内相关信息资源,能够避免网络编辑海底捞针式的全网搜索,通过对社区中结构化数据的处理也可有效降低网络编辑被其他冗杂信息干扰的程度、缩短有效获取时间,实现新环境下的信息辨识工作。
建立网络学习社区的出版候选选题库,一方面是为了通过筛选和加工社区内的信息资源使之成为企业数字资产的一部分,也可转化为编辑人员自身的知识储备[7];另一方面提高资源二次利用的效率,盘活社区中隐匿沉积的丰富知识资源。与纸质档案不同,以数字化信息保存的候选选题库从不同应用角度出发,对其进行二次深度加工,以新的内容形态呈现仍具有利用价值。
3.4 人工辨识(Selection)
基于网络文本挖掘等技术实现建立以热门主题词为基础的候选选题库,是大数据分析技术在网络出版选题上的实现。选题作为一种融合网络编辑创造性思维的活动,人力因素仍不可或缺。因而为实现精准的选题策划,还需编辑人工在候选选题库的基础上进行再次构思与挖掘,形成明确的、具有可操作性的、创新性的选题。
分别以传播、编辑、出版利润、读者等为主导的出版模式,选题策划必然不同,其选题策划所依据的评估要素必然呈现差异。网络学习社区出版流程中编辑与用户均是信息节点,基于以读者需求为出版中心的认识,编辑置身于读者阅读圈子之中,将满足读者价值体验的精神元素融入选题,凸显网络出版物的人格化特征[8]。
据以上认识,结合网络学习社区网络出版选题策划的特殊性,从选题的实际可操性出发,从候选选题到正式选题形成这一过程需从以下几个方面进行选题评估。
3.4.1 具有匹配的出版资源
出版资源是与网络出版物直接关联的各种资源集合,包括编辑人力资源、宣传推广资源、渠道资源、网络学习社区内部的内容资源、作者资源等。网络学习社区的网络出版最重要的资源评估要素是有没有相应的内容资源和作者资源。如果组不到稿或很难组到稿,或组到了稿却很难得到专业领域人士及读者的认同,这样的选题就会有违选题初衷。因而选题对内容和作者资源的评估十分重要,要对资源的可获得性进行预判,对内容质量、表达质量和效用质量有概略性的预估。网络学习社区的出版资源处于动态变化的过程,其内容资源常常呈迅猛增长的状态,对于资源的评估一方面取决于经验丰富的编辑的判断;另一方面也要求编辑自身实时跟进学习社区内的信息内容。明确各类话题下,有哪些活跃用户,其他用户对他的评价如何;有没有作者用户已经出版过图书,或者出版社已经向用户约稿;哪些用户有较多粉丝和人气,在某领域有较大话语权;站内什么话题的内容最丰富、讨论最多,哪些话题下优质回答的比例较高等。
3.4.2 推进电子书系列化品牌化
根据电子书品牌和企业的品牌方向,开展多个选题计划,从策划单一型的选题向系列化选题发展,加强推广品牌形象,以实现经济效益的最大化。在传统图书出版行业,许多出版社都已意识到全面开花的图书发行并不利于企业优势的形成且易造成内耗。因此垂直型战略被广泛采用,利用自身优势力量纵深发展,着力于某一方向上的系列出版物,有益于形成相对固定的读者群体并提升品牌影响力。
3.4.3 优先开发空白品类
在各图书销售平台的电子书成千上万,从中比对寻找图书市场种类的空白并不容易。将候选选题库中的选题与图书销售平台数据进行匹配,开发新的热点话题下图书策划的空间。网络出版组稿快、环节少、出版效率高等,这些优势能够帮助网络出版物以更快的速度跟进新的读者需求点。且网络出版的成本较低,一些纸质图书未能涉猎的小众选题和方向,对于网络学习社区在有相应内容资源的情况下,都可以尝试。借助大数据分析技术,对小众图书的用户画像分析描写,结合多渠道营销,让小众图书的推广渠道触达真正需要的读者面前,小众市场将不再小众。
3.4.4 符合市场发展趋势
基于对社交媒体、新闻门户等平台热点主题的数据监测,结合对网络学习社区的网络出版物在各对外传播渠道的情况进行剖析,更多了解网络出版物市场及其他相关因素,对其未来的发展趋势予以预测。以亚马逊中国图书分类的热门关键词为例[9],通过对图书榜单的长期观测,可以掌握用户的阅读需求变化,通过热门搜索词,能够迅速抓住读者用户在不同时间段的兴趣偏好和需求,以此开发选题上架新书,可以更容易被读者发现,并充分利用长尾效应以积累读者用户。如据《冰与火之歌》小说改编的电视剧《权力的游戏》受到全球粉丝的热烈追捧,若能结合热门讨论主题,推出 “权力的游戏”专题,极有可能获得不错的市场反响。
要了解网络出版市场的发展趋势,需对网络出版物有充分的市场调研。首先应密切关注阅读类App、社交媒体、其他学习社区上的最新专业信息,抓住市场热点,善于联想,跟进读者的潜在需求。其次利用好网络出版图书榜单。各大电商凭借独特优势,推出一系列有影响的排行榜,如亚馬逊中国每年发布“年度图书销售排行榜”“年度畅销图书作家榜”等,这些官方平台提供的阅读榜单有着可靠的数据支撑,有助于选题策划者对市场建立起理性把握。
4 结 论
用户生产内容数量急剧上升,网络学习社区的内容出版跨入“大规模业余生产”的时代,对于网络出版行业和编辑来说,通过对读者生成内容进行有效数据分析和挖掘,有利于获取更多可利用的内容资源,也有了更多发现作者的机会[10]。网络学习社区的内容出版与传统出版和纸质内容的网络化最明显的不同在于,面对和处理的信息来源不同,以往过度依赖编辑人工的手动搜索和发现,极大地拉低了信息处理效率,这种生产方式与网络信息更迭速率呈现出严重不匹配。
本研究提出网络学习社区的出版主题选择模型,通过热点词语、话题的语义挖掘和过滤分类技术,结合编辑的深度辨识来实现社区出版选题策划。综合数据分析和主观经验判断,能帮助编辑在内容组织上有系统地指导和依据,节省内容的检索时间,并避免对主观思维的过度依赖,提高网络出版的开发效率。在未来网络学习社区出版生态演变背景下,目前由编辑承担的选题策划组织工作是否能够由用户来完成,形成信息内容来源于用户,且选题内容策划组织由用户完成,使得内容聚合形式、模式和应用得以扩展,这值得我们深入研究。
注 释
[1]方卿. 资源、技术与共享:数字出版的三种基本模式[J]. 出版科学,2011(1):28-32
[2]周永斌. 浅析大数据时代研究型策划编辑的六项选题信息能力建设[J].科技与出版,2016(2):46-49
[3]王巧林. 对数字出版选题策划的哲学思考[J].中国编辑,2014(3):28-29
[4]刘丽平. 选题信息的收集、发掘与处理[J].科技与出版,2013(1):32-34
[5]刘骅,朱庆华. 基于标题的BBS热点话题挖掘:以南京大学小百合BBS为例[J]. 现代情报,2013(1):162-165
[6]唐蓉青.基于微博热词挖掘的新闻话题提取研究[D].长沙:湖南大学,2014
[7]程建霞,吕雪梅,张大勇,等.论科技期刊选题策划中的信息整合[J].编辑学报,2011(2):99-100
[8]段维,严定友.“互联网+”时代出版选题策划新思路[J].中国出版,2016(1):14-17
[9]https://www.amazon.cn/%E5%9B%BE%E4%B9%A6/b/ref=sa_menu_top_books_l1?ie=UTF8&node=658390051
[10]闫伟华.大数据分析与畅销书选题的精准策划[J]. 编辑之友,2015(6):5-9