摘 要 在大数据技术的发展趋势下,引领全民阅读的两个服务主体——图书馆和出版社正迎来深刻变革,前者提出的“智慧图书馆”方向与后者的“融合发展”战略,均是基于大数据技术确定的发展战略。图书馆与出版社在数据资源上各有所长,新技术背景下的大数据合作于二者而言是一种共赢。本文阐述了图书馆与出版社进行大数据合作的基础,分析了合作面临的问题并提出了解决之道。
关键词 图书馆 出版社 大数据 跨界合作
分类号 G250.73
DOI 10.16810/j.cnki.1672-514X.2016.08.013
Cross Border Cooperation Between Libraries and Publishers Based on Big Data
Zhang Yumei
Abstract Under the tendency of large data advancement, the two main service-part of leading nationwide reading, library and publisher are facing profound revolution. The former applied wisdom library theory, and the latter advocated convergence strategy, both of them were based on the large data technology. Library and publisher, each of them has its merits. However, facts have been proved that to cooperate with each other are mutually beneficial and win-win. This paper first describes the large data basis of library and publisher, then proposes solutions to the forthcoming setbacks of cooperation.
Keywords Library. Publisher. Big data. Cross border cooperatioa.
图书馆推进全民阅读与出版社的出版战略,都服务于社会大众的知识需求。在大数据技术驱动的知识经济时代,图书馆的服务和出版社的经营都处在传统模式向精细管理升级变革的阶段,两者之间的数据开放与共享,有助于各自优化资源配置,提高服务效能,降低运行成本。本文拟就图书馆与出版社的跨界合作展开分析与探讨。
1 馆社大数据合作的变革需求
图书馆作为服务读者的公益机构,出版社作为阅读产品的生产企业,推进全民阅读是其共同愿景。对于出版社而言,传统的图书出版流程,基本上止步于出版物的出售;对于图书馆而言,传统的借阅服务停留于图书的借与还。虽然在数字阅读需求的市场倒逼机制下,出版界普遍提出了数字出版的概念,但数字出版的现状主要是出版社将纸质图书内容进行数字格式的转化,交予数字传播平台来获得利润分成,或者加大网络销售的投入,在人才、平台、机制上并没有形成成熟的数字模式。而图书馆受馆藏资源的限制,也不能有效满足目前移动化、碎片化、信息化的实时阅读需求,服务模式偏于单一,服务人群集中于学生、老年人等,影响力有限。图书馆、出版社的传统运行模式,仍然以经验式的感性判断为主,读者的阅读需求与图书馆的藏书、出版社的图书不能实现精准匹配。如出版社在图书的印数、定价等决策上,主要依靠同类书市场销量、同一作者前期作品销量等初级数据信息和编发人员的经验、专家意见等感性经验,整个出版流程对用户信息缺乏精确把握,加剧了出版行业品种多、精品少,库存量大、重印率低的现象。基于此,在传统行业的互联网发展热潮中,图书馆的读者服务和出版社的业务经营都必须应对数字化转型升级的趋势,改变传统的形式单一的合作方式,从传统合作模式向互联网模式转型升级。
大数据时代,公共决策最重要的依据是系统数据,而不是个人经验和长官意志。过去深入群众、实地考察的工作方法虽然仍然有效,但对决策而言,系统采集的数据、科学分析的结果更为重要[1]252。图书馆和出版社的数据资源,如图书馆管理系统中的读者社会信息、文献类型、借阅信息、预约信息,出版社ERP管理系统中的订单信息、发货数量、销售数据等,不能仅仅是一种停留于信息表层、浅显粗糙的初级静态信息,用来满足于一般化的统计需求,而是要从中挖掘读者多元的信息服务需求。
图书馆和出版社面对大数据技术带来的挑战与机遇,不仅要发挥服务全民阅读的社会功能,而且需具有更多地互联网思维。政策层面提出的“互联网+”战略和融合发展战略,为两者基于各自数据资源实现合作创造了外部条件。数据的跨界流通,提高决策效益则是内部条件。大数据技术为馆社合作提供了互联共享、迭代创新、跨界合作的理念指导,并且在数据挖掘、数据分析、数据转化过程中形成技术支撑。图书馆与出版社将在大数据的技术支撑背景下,共建共享以文献资料和版权资源为形式的数据内容资源库和借阅数据、销售数据整合的数据资源库等合作项目。
商业领域的数据开放,将减少市场运行中的信息不对称,鼓励正面的市场竞争,优化社会资源配置,降低社会运行成本[1]250。因此,图书馆与出版社在馆配、阅读推广等传统的合作基础上,实现数据资源的合作利用,有利于促进图书馆向智慧图书馆转型,也有助于出版社加快融合发展的步伐,对两者来说是一种符合社会发展潮流的双赢合作。
2 馆社大数据的合作模式
除了丰富的纸质馆藏,图书馆通过购买和自建等途径普遍拥有较为丰富的数字资源,内容包罗万象,各具特色。而出版社的数字出版,主要模式还是内容资源的数字转化,尽管拥有大量的数字版权资源,却停留于纸质图书的备份。如何发现数据规律,打通“数据孤岛”的连接,从中提炼知识,进而形成知识体系,是图书馆与出版社共同支持智慧型政府、满足社会知识需求的合作基础。
全民阅读的推进,出版的融合发展,关键在于综合运用大数据、云计算、移动互联网、物联网等技术,有机融合于从出版到阅读的社会化流程,贯穿整个流程的核心理念是为社会提供知识服务,这也是出版社与图书馆在大数据时代合作的内在逻辑(具体内容见表1)。两者在出版流程和馆藏借阅中的数据资源的挖掘和使用亟待增强,在大数据计算和服务功能上的深度合作符合两者转型发展的需要。大数据分析统揽所有大数据,包括新的数据源,来理解这些复杂的、进化的、互相关联的情况,从而产出更精准的洞察力[2]。
图书馆应大力挖掘自身数据资源,这对面向读者提供更广泛的知识服务和对出版社探索大数据出版都具有应用价值。如:上海图书馆创建的手机图书馆,实现了上图信息、书目检索、读者服务、微博分享、移动阅读、你问我读和分馆导航等功能整合;国家图书馆推出的“国图公开课”依托国图的馆藏资源,采取线上线下相结合的互动模式,推送多种形态的学习资源;国内首家“智慧图书馆”深圳盐田区图书馆的“图书馆智慧平台的研究与示范”于2015年4月通过文化部验收,该项目立足于“文化+科技”的结合,以物联网技术、大数据技术、云计算技术、移动互联网等手段,基于当前成熟的行业自动化、数字化、智能化系统应用之上,研制出符合当今技术发展趋势的智慧平台,率先探索实施了图书馆服务模式的创新转变[3]。
移动互联网的快速发展和广泛应用,在各个社会领域为人际连接提供了新的平台,在商业领域更是实现了商业资源的跨界整合和商业模式的创新。出版社通过对图书馆读者借阅数据、搜索数据以及社会人口数据、消费数据进行大数据集合分析,可以有效提高出版选题与目标读者之间的连接匹配,实现人与人、人与书、书与书的关系连接。如知乎网站推出的图书《创业时,我们在知乎聊些什么》,就是精选知乎三年知识问答的内容,在这些非机构数据中挖掘出读者的需求,将知乎中的人际连接转化为知识性的图书。对大数据的及时有效的挖掘处理,将为图书馆、出版社这样的传统阅读服务机构,带来更为优质的产品和显著提升的效益。
大数据专家涂子沛指出,单个个体学习行为的数据似乎是杂乱无章的,但当数据累计到一定程度时,群体行为就会在数据上呈现一种秩序和规律[1]292。对与读者阅读相关的庞大数据及动态数据进行大数据挖掘的联机分析,可以分析出不同读者的阅读规律,与其社会行为进行对比,可以把握其潜在的阅读需求,并对其阅读需求进行提示和导航,从而使目标读者的阅读需求和出版社的图书出版达到连接,进而提供系统性的知识服务,实现针对性的有效出版,满足不同人群和个体的个性化信息需求。如果我们出版者真正理解内容,不断地深入挖掘各种用户和读者研究和学习的需求,把出版看成是对读者提供知识服务的过程,出版大数据是有可能的[4]。
出版社信息化程度不高,标准化工作不到位,而图书馆标准化程度相对较高,却没有第一手信息源,在这样的现实背景下,从数据采集阶段开始,图书馆与出版社就应通力合作。在数据采集阶段,出版社掌握的已有版权资源和不断获取的新增内容资源,是其提供知识服务的数据基础。图书馆的信息分类技术,为数据资源提供索引,为数据计算提供基础,实现统一、实时的数据管理。大数据挖掘技术中的联机分析,“把分立的数据库相联成关系型数据库,并进行多维度的分析”[5]。最后,在大数据服务阶段,通过特定领域的大数据建模,综合采用数据共享、数据租赁、数据定制等多种商业模式,形成用户所需的大数据知识服务。
3 馆社大数据合作所面临的问题
对于图书馆和出版社而言,大数据合作虽具备技术上的实现可能,但面临着合作机制、数据平台建设、数据资源权益保护等诸多有待解决的问题。
(1)产业重构问题。现阶段以移动互联网为主流技术的智能通讯革命,深度嵌入社会运行和个人生活,图书馆和出版社在满足新的阅读方式的同时,同时也面临价值坚守、产业重构、功能重新定位等一系列问题。如果仅仅通过单纯的数据计算,据此提供阅读内容,则是对文化品位和精神价值的放弃。
(2)权益保护问题。大数据分析与预测的目的是精准判断用户的个体行为,而用户信息泄露的风险在大数据技术中将会放大。大数据为图书馆和出版社提供技术支持的同时,也可能引发侵犯隐私、数据滥用等法律上的问题,特别是其中涉及的个体隐私。图书馆的公共服务职能和出版社的商业利益追求,对数据资源的利用边界并不统一。出版社将图书馆的数据资源作为商业资源使用,对数据的权益保护又涉及权益问题,需要政策法规的明确界定与保护。
(3)人才培养问题。无论是图书馆还是传统出版社,核心业务主要基于初级数据分析作出经验判断,决策依据及预测带有明显的模糊性,从业人员普遍对大数据技术缺乏了解,数据分析类的技术人才和分析策划类的复合人才匮乏。图书馆和出版社在实现“智慧图书馆”和“融合发展”战略的过程中,都面临人才缺乏的问题。对读者的大数据分析,不仅仅是浏览、借阅、搜索、购买数据的分析,更要具有对阅读产品的经验理解和对读者认知心理的科学理解。因此,短期来看,图书馆和出版社推进大数据战略的人才瓶颈在于计算型大数据人才,长期则在于具有人文知识和现代技术背景的复合人才。
4 馆社大数据合作的实施路径
4.1 管理层面的资源整合
在现有管理体制下,图书馆与出版社之间跨行业与跨所有制的技术合作,有待社会管理的大数据战略落地,才有望充分挖掘和发挥大数据的效能,提供社会化的知识服务。图书馆与出版社作为推进全民阅读的两个主体,积极融入各级政府文化产业的“互联网+”战略,以政策为纽带,以项目为平台,有助于图书馆与出版社跨越体制,实现管理层面的大数据资源整合。大数据技术对数据资源的关键影响是存储和分析方式的变革,将人类对结构化数据的观察升级为对几何级增长的非结构化数据的智能理解和应用,馆社的大数据知识服务使读者通过以出版物为载体的数据端口来完成信息的归集、检索、分析,建构可扩展、连接的信息环境和知识体系。
当前,国家对数字出版项目的扶持,是图书馆与出版社探索大数据合作应予优先考虑的实施路径,符合政府部门在社会管理和宏观调控上的主导职能。依靠政府资助的工程项目,推动出版社向融合发展转型、图书馆向全民阅读战略执行努力的同时,利用大数据技术为社会数据资源管理和知识服务探索协同发展,有望促进图书馆与出版社在数据资源上的互联共享,通过大数据技术有效服务于全民阅读和文化建设。
4.2 数据应用的馆社合作
由于我国出版社的核心业务在于选题的创意策划和出版物的编辑制作,图书馆则与阅读人群的直接接触上具有明显优势。馆社的大数据合作,促使出版社在选题的策划上超越个人经验和内部决策的经验限制,通过馆社合作的大数据资源,将出版物选题的策划和编辑设计交由更广泛的决策者——出版物的需求者和使用者,将他们的需求信息、使用信息与编辑出版、馆藏借阅实现同步实时交互。
作为全民阅读的重要推广平台,图书馆需要实施基于“大数据出版”的读者决策采购模式,降低图书馆服务对象与出版商之间的信息不对称,提高馆藏质量[6]。公共图书馆与出版机构共建大数据阅读平台势在必行,大数据阅读平台对接图书馆的馆藏资源和出版社的内容资源,可以有效突破图书馆在馆藏条件、出版社在库存周转上的限制,发挥大数据出版、阅读平台在资源集聚、数据分析预测上的功能,既能够适应新的阅读方式和需求,又能发挥出版社作为内容把关者、图书馆作为公共信息服务者的功能。
图书的出版和阅读消费具有复杂的社会属性和个性特点,知识生成和知识服务不是自动化的机械生产过程,因此大数据在构建按需出版和智慧图书馆过程中的成功应用,有赖于出版社和图书馆结合数据分析的技术优势与行业经验的人文优势,对数据分析和使用的效果进行决策和评估。一个成功的商业决策系统应该是商业经验与数据分析的健康结合——两者对成功的数据分析应用贡献相当[2]。在馆社大数据合作模式中,依靠从业人员和数据分析技术的配合,形成出版与阅读的大数据循环,吸纳源源不断的新数据,在丰富读者知识体系的同时激发读者潜在的阅读需求,实现对阅读人群的有效服务。
图书馆与出版社在大数据合作过程中,还须明确数据权益问题。图书馆与出版社之间的数据合作应共同确定数据的权属和使用权限,明确数据资源与资产的界定和保护方式,确保服务于全民阅读的公共利益。在选择合作对象时,应根据行业信息管理标准实行信用评估管理,强化社会效益导向。
4.3 馆社合作的人才培养
图书馆与出版社大数据合作的知识服务是一种复杂的智能服务,技术与人才的科学配置方能发挥其最佳效能,由于文化产品内在价值的精神属性,图书馆与出版社的大数据人才培养可从高度与广度两个层面去规划。在高度方面,可利用平台或者项目,向外借助专业的大数据分析人才,同时寻求与数据企业、高校的合作,加强信息管理、编辑出版等相关专业的大数据人才的培养。在广度方面,大数据出版和大数据信息服务将成为出版社与图书馆的日常运行模式,要求内部人才掌握大数据的基础技术,这是两者在大数据人才培养上的重点。图书馆与出版社基于各自资源优势、知识服务的宗旨与平台,可以采用定向交流、项目合作的方式,在图书馆馆藏数据库资源和出版社的版权资源基础上共建数据库资源,建立“联合承建、共同开发和成果共享的机制”[7],培养出兼具自然科学专业知识与社会人文科学知识,掌握情报工作理论、方法与创意设计、编辑策划技能,熟悉图书情报资源体系与内容消费者心理的复合型知识服务人才。
参考文献:
[ 1 ] 涂子沛.数据之巅[M].北京:中信出版社,2014.
[ 2 ] MINELLI M, CHAMBERS M, DHIRAI A.大数据分析:决胜互联网金融时代[M].阿里巴巴商家业务事业部,译.北京:人民邮电出版社,2014.
[ 3 ] 阳荔,张甲.国内首个“智慧图书馆”盐田诞生9月对外开放[N].广州日报,2015-04-21(SZA20).
[ 4 ] 王明亮.关于“大数据出版”的一些体会和猜想[N].中国新闻出版报,2013-08-29(5).
[ 5 ] 张振宇,周莉.“大数据出版”的理念、方法及发展路径[J].出版发行研究,2015(1):14-17.
[ 6 ] 许晶晶.“大数据出版”对图书馆知识服务的机遇与挑战[J].出版发行研究,2015(7):97-100.
[ 7 ] 程桂练,仲超生.知识服务环境下图书馆特色数据库建设:以“凹土资源特色数据库”建设为例[J].陕西学前师范学院学报,2015(8):8-10.
张钰梅 湖南图书馆馆员。湖南长沙,410011。
(收稿日期:2015-07-29 编校:曹晓文)