王天琪,郝嘉树
(中国国家图书馆,北京 100081)
我国图书商业机构主要是指以商业模式经营图书及提供相关服务的机构。目前,图书商业机构主要经营方式分为线上和线下两种,线上以网络书店为主,线下则为实体书店、商业超市等。图书线上服务市场相对集中,其书目推荐多以各大网络书店的书目推荐为主;图书线下服务因多渠道、数据分布零散等特点,其书目推荐多以图书运营和数据统计机构的书目推荐为主。
图书商业机构书目推荐多从图书消费者角度出发,关注从图书挑选、购买过程、阅读体验到评价交流的全流程感官。对图书商业机构书目推荐的研究不仅是对当前读者图书阅读及阅读消费关注点的研究,也是对当前我国商业模式下图书市场经营真实状态的调研。
2020年第46次《中国互联网络发展状况统计报告》显示,截至2020年6月,我国网民规模达到9.40亿,网络购物用户为7.49亿[1],网民约占全国总人口的67%[2],网络购物用户约占全国总人口的53.5%。得益于快速发达的物流和网络购物的便捷性,越来越多的消费者将线下购物转移到线上,线上购买图书就是其中之一。根据参考观天下发布的《2018年中国书店连锁市场分析报告——行业深度分析与发展前景研究》数据显示,2012~2017年我国网络书店销售量逐年递增,且从2016年开始网络书店的销售额超过实体书店的销售额。
我国网络书店较早占领市场的是亚马孙、当当网和京东网站。随着时间的推移,我国网络书店逐渐壮大,不同类型的网络书店不断出现。目前,电商平台和网络书店的业务类型可分为:(1)主营或兼营业务为图书,包含其他线上产品销售;(2)由电商机构开办或依托实体书店开办;(3)主营、兼营或不售卖电子书。表1为目前影响力和销售量较大的部分网络书店的详情。
表1 部分网络书店详情
电商平台和网络书店的书目推荐是其影响力竞争的重要体现之一。通常,电商平台和网络书店的书目推荐判断指标有销量、评价、专业出版机构评审等。与其他非营利性文化机构、专业出版机构及行政管理机构相比较,电商平台和网络书店的书目推荐虽然专业性有所欠缺,但更加贴近消费者不同时段和不同状态下的个体需求,能够做到阅读与消费兼顾,并且对图书销售有一定影响。
京东、亚马孙和当当作为成立最早、最具特点的网络书店,它们图书零售量在全国网络书店图书零售量中占比较大,售卖包括各种实体图书、电子图书在内的全国出版社出版的图书。这三家机构的书目推荐有相似之处却也各有特点,因此本文在调研电商平台及网络书店时以此三家为例。
在图书线上销售未出现之前,图书商业机构书目推荐以图书经销和发行机构为代表的实体机构的书目推荐为主。随着数字技术的发展,在线上图书销售和线下图书销售并行过渡时代,图书资讯和数据统计开始逐步走向商业化,出现了集线上、线下和各类图书数据为一体的专业图书数据服务机构。进入阅读个性化需求时代,还涌现出一些符合某类特定需求或特定风格的阅读及书目推荐机构。商业图书运营及服务机构的发展见证了大众对于图书需求的变迁,由普通实体图书阅读到便捷阅读和阅读细分向个性化阅读发展。
目前,商业图书运营及服务机构主要有三种类型:(1)专业图书数据调查咨询机构,专门搜集、整理和监测全国图书市场的销售数据,并以此为依据为各种用户提供查询和咨询服务。该类型的典型代表机构为北京开卷信息技术有限公司,其推出的书目推荐为开卷畅销书排行榜。(2)图书经销和发行机构,在各省、市建有分销渠道或开有分店来发行和销售图书。该类型的典型代表机构为全国新华书店,其推出的书目推荐为各月全国畅销书榜。(3)图书独立经营机构,具有独立形态的零售状态,并有自己独特风格。该类型的典型代表机构为各种独立书店,其推出的书目推荐为联合推荐各期图书目录。
商业图书运营及服务机构的书目推荐特点主要有:(1)书目推荐名单受读者购买消费及其对图书的评价影响较大,因此相关运营机构书目推荐相对于销售平台,更贴近读者和消费市场,具有量化可衡量和客观性等特点。(2)不同运营机构对图书归类和统计标准不同,因此各家运营机构的书目推荐榜单会呈现出多维度、有交叉,但无法覆盖全市场的情况。(3)部分运营机构对图书的评价受其所在行业和经营风格影响,因此适用于不同类型和需求的受众。
图书排行榜是线上和线下进行书目推荐的主要方式之一。图书排行榜的主要目的是为图书销售和书目推荐提供服务。图书排行榜划分方式包括图书类型与时间交叉排行榜,图书销售量、评论量、搜索量等指标与时间交叉排行榜,图书载体与时间交叉排行榜等。目前,主要推荐排行榜有电商平台和网络书店书目推荐排行榜和商业图书运营及服务机构书目推荐排行榜。
京东图书排行榜的特点为排行榜包含图书数据量大、推荐和统计实行“一品多商”标准,对于图书在作品层面的推荐更具有说服力。其排行榜可根据图书类型和时间频率(日、周、月、年)进行交叉筛选。具体情况见表2。
表2 京东图书各类排行榜详情
亚马孙图书排行榜仅有电子图书排行榜。相较于其他排行榜,亚马逊排行榜特点为:划分维度更多元,划分更具体,大类榜单下根据不同来源还分二级榜单,部分还有三级榜单,推出时间速度快。具体情况见表3。
表3 亚马逊图书各类排行榜详情
当当网为我国较早出现的专业网上书店典型,其图书排行榜的特点为:与其他后续线上兼营零售商相比,其读者用户的忠诚度、认可度和使用时长更具优势,推荐图书种数更多。具体情况见表4。
表4 当当网图书各类排行榜详情
开卷图书排行榜是数据运营机构基于线上和线下图书零售数据监测开展的书目推荐。其榜单数据收集覆盖全国1 400余个城市、1万余家实体书店和网上书店、累计品种490余万图书的零售量[3],并且监测范围和监测地域还在不断扩展。因其独立于图书交易市场,所以其图书排行榜具有很强的连续性、客观性、权威性和代表性。在各类榜单的使用和参考中,因开卷图书畅销周排行榜和月排行榜的时效性最强而使用参考范围较广。
根据《中国统计年鉴2020》和《2019年全国新闻出版业基本情况》中的数据显示,新华书店为全国最大图书自办发行经销系统。新华书店书目排行榜是基于全国发行经销机构图书销售数据的排行。其排行榜[4]具体情况详见表5。
表5 新华书店图书各类排行榜详情
图书网络评价主要为电商平台和网络书店图书对消费者购物评价的数据统计,电商平台和网络书店进行图书书目推荐的重要途径之一。网络评价主要有以下两种类型:
(1)图书评价方面。京东、当当均采用公开的星级评价标准,星级越高代表对某维度的评价越高,评价维度主要有商品包装、物流速度和快递员满意度等,此外还根据网络评论数量构建了图书热评榜,各类型图书的评价分数统计构建好评书榜,从而进一步对图书进行推荐和筛选。亚马逊图书评价采取半公开评价原则,每一星级后会展示该星级累计评分占比,占比统计时不使用简单的平均值,而是系统考虑评论的时间远近、评论者信誉等。这两种评价方式主要区别在于:京东、当当公开星级评价数据量更大,包含实体图书和电子书,并将评价进行进一步归类,缺点在于无法排除无效评价和恶意评价;亚马逊图书评价数据仅针对电子书,排除了无效和恶意评价数据以及结合营销策略的数据,数据量有限,但有效度和针对性较高。
(2)用户文字描述和数据标签方面。京东、当当和亚马孙对于文字、图片描述和数据标签均未规定具体维度,用户可根据图书各维度情况进行具体评论,数据标签可自创或由系统根据文字评论内容进行归纳抽取,此两项为非强制性。与京东和当当不同的是,亚马孙还在图书页面上展示出关于该图书最有帮助的好评与差评两项,并添加了“有帮助”和“报告滥用情况”按钮,进一步作为图书评价和推荐的参考。
随着全民阅读的兴起,电商平台及网络书店纷纷根据自身图书销售大数据联合调研机构,尝试对消费者的阅读及图书销售量情况进行分析,推出年度阅读报告,为书目推荐和阅读服务提供参考。京东、当当和亚马逊等网络书店推出的阅读报告主要是对消费者按年龄、地区、性别等因素划分归纳后,对群体购买及阅读特征进行分析;对图书售卖量进行统计与分析后,列举出推荐书单和畅销作者。有些阅读报告还对读者阅读、购买和评价行为进行进一步分析,并给出读者阅读建议。
目前,使用图书口碑方法进行书目推荐的主要机构为商业图书运营及服务机构中的独立书店。国内影响力较大、特色风格明显的独立书店包括三联韬奋书店、生活·读书·新知三联书店、豆瓣书店等。全国独立书店联合推荐书目从2018年开始发起,由出版类杂志主导,联合全国20余家知名书店,以荐书人的身份定期推荐图书。独立书店书目推荐依据是结合图书评价、网络口碑、书店风格及推荐人自身对图书的理解,进行推荐并列出理由。每家独立书店每月推荐1种图书,列入全国独立书店推荐书目。
4.1.1 销售量法的定义和情况
笔者在调研过程中发现,京东、当当、亚马孙等网络书店,以及开卷、新华书店、独立书店等商业机构,均采取图书排行榜方式进行书目推荐。经过调研还发现,图书排行榜大都是基于不同渠道、不同角度的图书销售数据而制定的。
销售量法是当前书目推荐方法中定量分析最常用的方法之一,它以图书销售量作为用户对各类图书的需求和认可程度的衡量指标,通过排行榜的方式进行书目推荐[5]。销售量法进行图书推荐具有以下优势:一是推荐标准可以量化,结果具有客观性,展现方式直接,易于读者选择;二是能及时更新,能够快速给读者提供个性化需求;三是在书目推荐中能够真实反映读者对图书市场的需求。
4.1.2 销售量法的计算及应用
图书销售量推荐法在统计时多以册为单位,售出一册,销售量累加一次。从单个售卖机构来看,对于同一图书品种不区分卖家来源,即对于同一品种图书的不同卖家累计计算销售册数。但对于同一品种不同出版社的销售量按不同出版社区分累计销售册书。目前,单册图书的销售量多以单位时间内各发行机构、销售平台和图书市场数据监测商的统计数据为准。销售量推荐法个性化应用主要有以下几个方面:(1)为个性化群体阅读需求提供推荐书目。从时间、渠道、性别、年龄等不同维度对图书的销售量进行统计时,维度的划分代表着阅读需求的差异化,销售量的多少则代表着差异化需求程度的强弱,如此可以为个性化群体阅读需求提供书目推荐和参考,这也是各出版和销售机构经常会推出个性化图书销量榜的意义所在。(2)加强不同图书商业机构对阅读市场的把握与分析。从综合、学科、单册等方面对各分类图书销售量进行统计,除了能为读者提供个性化需求的书目推荐外,还为图书机构从宏观到微观层面提供阅读市场的现状和趋势。图书整体和综合销售量反映了国民对于图书的需求和图书市场的发展与兴衰;各学科图书的销售量能反映该学科研究前沿和出版热点以及读者对图书专业性的需求;图书单册在地区乃至全国范围内的发行销售数据的分析,不仅是对不同地区阅读市场行情的把握,更是各出版、发行和销售机构策划选题、举办活动的重要依据。
4.2.1 网络评价推荐法原理及定义
网络评价推荐法是随着网络书店和网络阅读社区的兴起而发展起来的书目推荐评价方法。网络评价推荐法是对图书的网络舆情数据进行定性与定量分析相结合的典型推荐方法。调研中网络评价推荐法在图书商品评价、图书口碑推荐及各类阅读报告等方式中均有涉猎。该方法主要依赖于图书购买者和阅读使用者的购物和阅读体验,读者会根据其他阅读过图书的读者的评价来选择图书。相较于其他书目推荐评价方法,其发展时间较短,目前还没形成较为成熟的体系和标准。相对于销售量、阅读量等单一指标评价法,图书网络评论推荐法属于多维度评价法。
网络评价推荐法的意义在于:一是将定性分析与定量分析相结合,并且评价的维度多元化;二是网络评价推荐法推荐的书单特色鲜明,风格多样,为不同阅读风格的读者提供更宽泛的选择空间;三是网络评价推荐法暗含交流属性,读者在购买者或推荐者评价过程中有一定互动和参与,让读者在选择时对书目有更多的了解及参考内容。
4.2.2 网络评价法的计算与应用
笔者在调研各种网络书店的基础上归纳出网络评价的场景来源与具体指标。图书网络评价主要来源于两种类型的场景:一是图书作为商品,在各大销售网点被购买后的商品评价数据;二是图书作为文化产品,在发行与被阅读后的在线口碑与内容评价。经过进一步的研究和细化,总结出图书网络评价指标通常包括以下几个方面:文字评论内容及图片、评论者购物及信用等级、评论的回复及点赞数、评论时间和复评时间、综合好评数、综合中评数、综合差评数。上述指标在图书购物平台和阅读社区交流平台的书目推荐中均有涉及。基于以上评价指标,图书网络评价推荐法最常用的计算方式主要有以下几种:(1)多维度评价赋权计算法。网络书店图书评价一般分为总评价、商品评价、评价内容撰写、物流评价等几个维度,每个维度以五星为满分并赋予不同权重进行综合计算。各平台具体权重分配及计算方法不同,为其数据机密。但基本原理是依据各维度的星级打分划分出好评、中评和差评,并统计数量,最后按权重计算百分比。为免除其他因素干扰,一般评价权限设定为购买过此图书的用户在限定时间内的评价。多维度评价赋权计算法的优点在于各平台可针对自身用户阅读、消费习惯来调整各评价维度的权重和算法,而不受其他平台和规范的影响,可根据需求进行实时优化计算,呈现出该平台的最佳计算结果。多维度评价赋权计算法在推荐不同侧重方向的书目时,能够兼顾侧重方向与整体评价结果进行综合推荐,如折扣好书优选榜单等。(2)图文情感分析法。图文情感分析法通常用在图书商品图片文字评价的归纳和图书阅读交流社区的图书评论分析中。其方法主要是将文字和图片评价通过图文识别技术、敏感词抽取、肯定和否定语气词和长尾词定位等方法,判断其评价内容并对文字和情感进行分析,最后形成标签。目前,购物网站中的图书商品图片文字评价和阅读交流社区的书评均涉及该分析方法。例如,京东、当当和亚马逊等网络书店,在每本图书的商品评论部分,就是用该方法计算和抽取出所有购买此图书的读者评论中频率高、又有代表性的评论标签展示给读者。使用基于图文情感分析的网络评价法能方便有需求的读者可直接通过标签进行查找、搜索和定位,查看其关注方向上的图书网络评价情况,获取个性化需求的书目推荐。
大数据关联分析的兴起是建立在智能云计算技术的基础之上的。目前,采用大数据关联分析法进行书目推荐主要是针对个人用户的基础信息、消费信息、浏览信息和搜索习惯等数据进行计算,得出个性化关联和推荐。此类方法多用于消费者对图书有特定需求和具有一定图书偏好的基础之上,多针对个体用户;对于群体用户,图书商业机构书目推荐则多采用销售量法、网络评价法。亚马孙书目推荐的有用评论显示、当当和京东的数据标签推荐等均是在网络评价法基础之上的大数据关联应用。
大数据关联法会按照图书网络评价中不同因素的重要性进行排序,统计各因素的评价值,再对各因素的评价值进行对比分析最终得出推荐。计算中需明确序列产生的原因、目的及各因素标准度量的统一。如京东图书热评榜就是将读者购买后的评论率作为最重要的因素,按评论率高低为标准进行书目选取。当当的热搜榜是将读者的搜索量作为最重要的因素,按搜索频率高低作为标准来选择书目。此外,像好评排序、按回复数排序、回头客评论排序等均为大数据关联法的具体应用。
数据源的可信度和信息质量是影响大数据关联分析推荐法是否准确、客观的重要因素。因此多采用自有数据或影响力较大的平台数据,例如京东图书、当当、开卷等进行筛选或清洗后再利用推荐。另外在分析推荐过程通常会采用一种或多种方法并用的情况。
通过对网络书店、图书运营和数据机构书目推荐的调查和研究,笔者发现目前图书商业机构最常用的书目推荐方法分别为销售量推荐法和网络评价法,而大数据推荐法正在不断发展完善过程中,将来也将成为图书个性化推荐方法的主流。商业机构书目推荐的优点在于既以图书商业机构的营利性特点为基础,又能满足图书阅读和购买个体的个性化需要,可适用于不同读者在不同阅读环境下的各类需求。如何将商业机构书目推荐与图书馆书目推荐更好地结合,让其在图书馆书目服务中更好发挥作用,也是当下图书馆界值得思考的一个重要问题。
5.1.1 基于网络评价与大数据关联法的图书馆个性化书目推荐
个性化、精准的书目推荐是数字时代图书馆书目推荐的重要发展方向。个性化、精准的书目推荐需对读者大量的历史行为信息与阅读偏好进行数据分析,当前图书馆掌握的数据仅限于读者在馆内的借阅、浏览和使用记录,对读者在日常生活中的阅读偏好并无掌握,因此在个性化阅读书目推荐过程中可用数据和分析方法有限。
商业机构书目推荐中的网络评价法是基于大众阅读消费偏好的多维度分析法。由于当前商业机构用户及图书馆用户均实行实名制,因此图书馆在个性化、精准化书目推荐时可与商业机构进行数据对接与共享,借鉴商业机构网络评价法中多维度评价赋权计算法的计算框架和赋权因子,结合图书馆现有用户信息与数据进行分析。同时,由于图书馆相关数据可信度和信息质量较高,因此在去除商业机构用户数据中价格和消费习惯等干扰因子后,可进一步增加用户图书借阅和使用时长、阅读类型和阅读频率等相关数据,利用大数据关联分析法,最终得出适用于不同读者的个性化阅读书目推荐序列。
5.1.2 基于商业机构阅读报告与排行榜的图书馆数字阅读书目推荐
图书馆进入智慧化时代后,数字阅读书目推荐是图书馆阅读推广过程中必不可少的组成。根据《第十五次全民阅读调查报告》显示,全民数字化阅读方式(网络在线阅读、手机阅读、电子阅读器阅读、Pad阅读等)的接触率为73.0%,2017年我国成年国民人均纸质图书阅读量为4.66本,人均电子书阅读量为3.12本。数字阅读已经逐步成为大众进行阅读的重要方式,但目前图书馆在数字阅读书目推荐方面仍处于建设阶段。
图书商业机构联合调研推出的阅读报告对大众的阅读方式、阅读习惯及阅读书目细分等都进行了详细的统计与分析。图书馆在制定数字阅读推荐书目时可在自身数据分析的基础上,进一步借鉴商业阅读报告中读者细分维度、各类型书目阅读情况及非实体书目推荐等相关数据,同时还可参考商业图书排行榜中非实体图书的二级或三级细分排行榜,结合读者阅读需求逐步构建图书馆数字阅读书目推荐体系。
5.1.3 基于图书口碑推荐和图书馆特色资源的书目推荐互动
泛在知识环境下,全媒体时代的到来打破了阅读交流的空间和地域限制,阅读的互动属性逐渐增强,图书馆作为重要的文化推广和社会阅读机构,其书目推荐也应非一家之言,在基于专业书目推荐的基础上增加互动属性也是未来书目推荐发展方向。
互动是阅读过程中阅读价值体现和阅读情感交流的重要属性,这也是为什么各大商业机构对于图书评价和交流越来越重视的原因,图书口碑推荐和互动网络评价就是具体体现。图书馆阅读书目推荐互动可借鉴图书口碑推荐方法,将大众图书评价、网络口碑等与图书馆自身特色资源相结合,划分形成特色书目推荐互动版块。让图书馆书目推荐能更好地与读者、机构和社会阅读文化相融合。
5.1.4 基于商业机构数据标签和读者数据的图书馆分类书目推荐
目前,图书馆分类书目推荐多是基于图书馆分类法的各学科和领域的图书推荐。读者作为图书使用对象而非研究对象,对于图书的使用及分类则多基于日常语言和逻辑划分习惯,因此,图书馆在进行分类图书推荐时可逐步将读者语言和逻辑习惯纳入考虑因素。
商业机构图书网络评价法中的数据标签是由读者自创或由系统根据读者图书评价内容而进行归纳抽取,更加符合读者语言习惯,因此,在图书馆进行分类书目推荐时可考虑借鉴网络评价中数据标签的创建维度和机制,将读者对于图书的评价进行抽取归纳,创建相关标签,逐步推行多维度的分类书目推荐。
随着个性化时代的来临,图书馆读者个性化阅读需求与有限的采购经费之间的矛盾也逐渐产生,怎样在有限范围内兼顾多数阅读需求并满足个性化阅读成为许多图书馆面临的问题。将商业机构书目推荐与图书馆采编工作的有机结合,也是商业书目推荐未来应用的重要方向之一。
创建图书馆、读者和商业书目推荐机构三方大采编一体化体系,既能让读者看到其他阅读消费者的推荐与倾向,为自身阅读选择困难提供有效选项,又能让图书馆在图书采选过程中利用阅读消费大数据分析,兼顾共性和个性阅读需求,同时还能为商业书目推荐机构带来一定销售量。图书馆、读者和商业书目推荐机构采编一体化平台可将多个商业推荐机构数据共享,由读者提出阅读需求,图书馆则结合共享数据和读者需求,制定图书采选策略,最终达到三方共赢。同时,商业机构共享数据、读者需求的客观性和真实性是大采编一体化的基础。因此,在创建采编一体化平台过程中需要经验丰富的图书馆采编人员进行把控和甄别。
如果说销售量法包含了商家营销影响因素、读者阅读预期和跟风购买,那么网络评价法则是在图书使用后对其内容、质量等方面的评价,大数据关联分析法则是在前两种基础之上对个体信息和需求进一步的分析和应用。图书馆在借鉴销售量法进行书目推荐时如何去除商业营销等非图书相关因素影响,可考虑在一定时间频率内综合多个平台排行销量,进行加权计算;针对网络评价法中无实质内容文字评价等干扰因素,可考虑进一步开展内容甄别、分类剔除错误数据和冗余等操作。在网络高速发展的当下,任何固定、单一的图书推荐方法都无法完全适应读者需求,因此在不断拓展数据渠道的前提下,需要对各类方法进行进一步融合与智能化。
由于不同图书商业机构进行书目推荐的目的不同,因此图书馆在书目推荐借鉴和实践过程中如何选择与其需求和理念相一致的方法,并加以改善和使用还需不断的探索与试验,同时对商业机构书目推荐结果,图书馆在借鉴过程中也需进行个性化甄别,找到符合自身需求的最优选择。