□文│孟庆麟 刘 巍
大数据背景下,传统出版业将面临巨大的变革。出版业应该抓住机遇,利用大数据技术推动整个行业发展。
国家的“十三五”规划提出了文化产业的新目标,这些目标描绘了出版业发展的前景和方向。运用大数据推动国家经济发展正在成为一种必然趋势。
大数据技术在为出版业提供技术方面的支持的同时,也为出版业的发展模式转变提供了很好的思路。大数据可以改变传统出版业对出版素材的搜集、整理、编辑模式。大数据技术非常有利于新时代背景下出版业的结构重组。[1]在大数据环境下,如果用户的偏好数据能被合理地利用,那么出版业不仅会产生巨大的发展潜力,也会在很大程度上惠及人们的工作生活。因此在新时代下,出版企业需要精准把握出版市场的大数据。
目前,数字化生产和出版已经成为出版业的发展潮流和必然趋势,西方发达国家在数字出版领域已经取得很大的进展,完成了数字出版的基础性工作并且利用技术优势做大做强,提高了行业的综合实力。[2]与此相比,我国的数字出版也取得了一定的成绩,但是仍有许多方面需要不断加强。一方面要加快数字出版核心技术的研发,另一方面也要加大对数字出版企业的支持力度。不久的将来,出版业的国际竞争不仅是内容上的竞争,更是技术上的竞争,没有核心技术的产业难以成为战略产业,没有核心技术的企业也难以成为战略企业。[3]
基于大数据的出版业应该以客户需求为中心,通过大数据挖掘实现目标消费者的精准营销,为读者提供精准个性化内容,强化大数据平台的经营和管理,促进大数据商业模式的不断创新。[4]
大数据的应用环境主要有政策环境、数据环境和技术环境。国家近年来出台了一系列促进大数据发展的政策,但是这些政策还没有形成合力,也没有形成国家级的大数据战略。互联网技术的发展使得出版业拥有了大量的数据资源。随着大数据技术的发展,现在已经有大量的以提供大数据技术服务为主要业务的第三方公司。
政策环境分析。目前我国集数据采集、存储、处理、分析和服务为一体的出版产业体系已趋于成熟,但大数据的发展仍面临诸多挑战。如我国政府大数据应用水平落后,数据管理意识有待进一步提高。一项调查结果的分析发现许多部门对大数据技术应用非常少,应用大数据提升自身的工作效率,挖掘数据潜在价值的意识十分薄弱。[5]国家对大数据发展战略缺乏统一规划,每个地区的相关部门都在以自己的方式寻找和建立大数据发展模式,在这种发展方式下大数据产业很难形成合力。国家应从整个大数据的行业层面着手分析大数据发展趋势,从国家层面制定大数据发展战略,为政府、企业、个人提供大数据技术发展的战略依据,联合社会各界的力量共同发展大数据战略。基于各种客观因素,我国的数据信息公开度较低,在政府数据信息开放工作方面应该增加信息的公开数量和种类,一些重要信息也应根据需要列入信息公开的范围之内。提高数据的更新速度。改变数据的公开形式,数据的采集与分析过程也要及时公布,便于企业对数据的深入分析并且挖掘数据的价值。
数据环境分析。各种社交媒体的出现和电子商务的发展为出版企业提供了大量的用户数据。按功能大致可以分为交流类、娱乐类、信息发布类、及时通讯类等。点对面交流的论坛主要包括天涯、猫扑等,以休闲娱乐为主的社交网络主要有开心网、人人网等,以微信息的发布、评论为主的新浪微博、腾讯微博、微博客,基于兴趣爱好的社群网站如豆瓣、时光网等,及时通讯软件如微信、QQ等。人们在电商平台购物时产生了大量的历史交易数据,这些数据为出版企业提供了丰富的数据资源。出版企业可以从电商平台将这些交易数据和用户评论数据获取出来并加以分析,更好地了解客户的需求,提高出版物的销量。
我国社交媒体的迅速发展使其渗透到生活的各个方面。人们在使用这些工具的过程中时时刻刻都在产生数据。出版企业如果能够掌握数据技术,充分利用这些数据将会对数字出版工作产生巨大的推动作用。
技术环境分析。为适应大数据发展的需求,近年来出现了许多以数据分析为主要业务的公司。例如阿里巴巴的阿里数据超市、淘宝量子恒道等可以为用户提供大数据资源。阿里巴巴的阿里云、腾讯的数据云提供大数据分析的服务。[6]在出版业也形成了一批以数据的存储、分析,整合内容并出版的大数据服务商。这些数据服务商提供的各式各样服务基本涵盖了出版业的整个出版流程所需的数据服务。利用这些第三方数据服务平台,可以推进大数据技术在出版业的应用。
我国已经发展起来的这些大数据服务商,不仅仅可以为出版业提供简单的数据存储和分析服务,而且能够帮助出版企业完成产品研发和内容整合等工作。目前我国出版业的大数据应用还存在许多问题:基础数据的搜集工作还有待进一步提高,数据挖掘技术有待进一步提高。目前出版业的数据分析工作仅仅停留在出版流程优化,出版物质量提升,没有深入了解用户需求。出版企业缺乏数据共享意识。出版业的大数据服务工作也存在许多不足,具体体现在以下几个方面:首先,数据服务商的服务主要是基于企业内部数据,对企业外部数据的分析不足;其次,数据服务商挖掘用户需求和服务模式创新的能力薄弱;最后,各个数据服务商的信息标准不统一,存在数据的重复录入、重复加工,数据分析标准不统一也会导致结果差异化。
从国家、出版行业、出版企业三个层面对大数据应用战略进行分析。在国家层面上,国家级大数据战略及相关企业战略需要及时跟进,许多相关机制需要进一步完善,政府数据开放程度进一步提高。在出版行业层面上,整个行业要转变观念、加快人才培养,改变原有的企业组织形式。在出版企业层面上,企业应该结合自身的实际,选择恰当的数据分析与获取模式和发展大数据的策略。
我国对大数据的研究大多数是在理论层面上,国家相关部门将学界和企业界联合起来从宏观到微观进行综合研究,制定详细发展规划,涵盖政府、教育、企事业单位等领域的国家大数据战略是抢占大数据先机的前提。
从国家层面来分析,当前我国的企业上市机制和数据市场化机制需要进一步改进和完善。近年来从全世界范围来看,大数据市场处于刚刚起步的阶段,许多与大数据相关的行业为了抓住时机取得更大的市场份额,不惜以牺牲企业自身的利润为代价,换取较大的营业规模。由于我国的企业要上市必须连续三年盈利,这一制度严重制约了企业的融资,不利于企业规模的扩大,进而削弱了企业抢占大数据的能力。在数据市场化机制方面,我国的能源、通讯、交通等行业处于垄断地位,其数据资源的分离利用项目都是在保留数据版权的基础上外包给数据公司,这样一来,对数据资源也会形成一定程度的垄断。因此调整企业上市机制,健全数据市场化机制等相关工作对我国的大数据行业发展具有十分重要的意义。
越来越多的出版企业认识到数据是企业的重要资产并且开始重视自己企业数据的收集工作,对其进行存储、规划和分析利用。虽然出版业已经认识到数据资源的重要性,但是由于出版业长期形成只重视内容的经营理念导致其对数据技术重视度不足,缺乏深入的了解。
大数据时代,出版业需要完成身份的转变。出版业不应该是出版物的制造者,而应该是提供信息的信息服务者。根据不同客户的不同需求提供多元的服务,为客户创造价值。在此基础上消费者的地位逐渐提升,已然成为了市场的主导者。消费者实现了从读者到用户的身份转变。在传统出版业中读者处于信息流的最底层,信息的流通模式是作者-编者-读者;而大数据时代用户则可以全程参与出版产品的生产、供应过程,在这个过程中用户是信息的主导者。由此可知,在大数据时代出版业用户已经成为核心,为了出版业更好地发展,必须树立服务用户、服务读者的意识。[7]
培养懂得数据分析的出版业人才。在大数据时代,出版业的从业人员除了具备编写、控制出版内容以及与读者沟通了解需求的能力之外,还需要结合大数据战略,学习大数据相关技术,成为一个既有专业编辑能力,又具有从众多企业数据中提取有价值数据的能力。最后做到能够将企业发展与大数据技术发展相融合,为出版业的发展做出科学规划。目前数据分析的人才缺口很大,美国的纽约大学等一些高等学府的出版专业增设了数据分析等与大数据相关的课程,为了满足市场数据人才需求,利用现有教育资源加快培养。与此同时,国外的一些出版企业也在组织出版从业人员定期或不定期地参加大数据培训,提升企业的数据分析能力。我国国内的教育界和业界可以借鉴国外的成功经验,培养懂得大数据技术的出版业人才。
大数据时代的出版企业组织形式应该重新调整,数据部门的职责应该进一步扩展,不能局限于基础数据的存储整理等基础性工作。出版业的数据部门应该利用自身的数据分析技术为企业的决策提供帮助。数据部门利用其数据平台上读者反馈的对出版物内容的意见,对提供服务的满意度进行分析,并且根据读者的需求为出版物编辑部门提供出版意见。数据部门对出版企业的作用将进一步提升,其在企业的地位应该进一步提升。[8]
出版企业的编辑部门与数据部门应该加强合作。为了加强出版业两大核心部门编辑部门和数据部门之间的联系,各个出版企业可以考虑打破原来部门之间的界限,使得出版人才与数据人才在同一部门下工作,数据技术人才对数据分析得出的结论及时与出版物编辑人员沟通交流,为出版决策提供技术支持。英国一些先进的出版企业已经将技术团队与编辑团队融为一体,使得出版工作与大数据技术结合得更紧密。
数据的获取与分析能力是大数据技术应用的关键也是基础。出版企业实现数字化出版,并且将大数据技术应用到自身的出版工作中,首先要做的工作是建立自己的数据库,选择恰当的数据分析模式。
构建出版企业数据库。出版企业发展大数据技术的基础是拥有数据资源,企业的数据资源主要包括企业的日常生产经营数据,出版物读者的意见、建议等读者数据。这些数据具有潜在价值。出版企业要对这些数据进行收集和筛选,整理出内容开发数据、供应链数据、读者反馈数据。这些数据对将来出版企业整个供应链系统,出版物的质量改进,出版业服务质量的提升提供重要的参考。
不同的数据分析模式其分析成本不同,与互联网等一些新兴企业相比,我国的出版业属于传统行业,在与大数据结合的行业转型过程中,本来就要承担巨大的成本。所以一定要结合企业自身规模,选择适合自己企业的数据分析模式。[9]不同的出版企业可以按照自身的规模、人力、财力、物力、经验、技术的状况做出不同的抉择。例如:大型的出版集团可以利用集团的优势,搭建自己的数据平台,成立专门的数据机构,为企业的整体发展提供决策依据。中小型出版企业由于自身资源有限,可以选择专业的数据分析公司,将数据分析工作外包。
近年来,大数据技术迅速发展,数据的规模也呈现出爆炸式增长的趋势。大数据时代,信息的开放性进一步扩大,由此也带来一系列问题,个人隐私数据和一些敏感信息泄露的事件经常发生。大数据具有数据量大、类型多样、能够产生价值的特点。各种智能终端以及各种社交网络平台,已经渗透到人们生活的方方面面,在方便人们的同时也搜集了大量个人数据,为个人隐私数据的保护工作带来许多问题。
面对这些问题,出版企业可以从技术和管理两个方面分别采取措施,具体如下:首先出版企业在技术层面上应该对用户访问权限进行控制,根据数据的保密等级和用户的需求,将访问用户设置为不同的权限和等级。在管理层面上,整个出版行业要规范建设大数据安全策略。建立规范化的体制机制有利于保护数据安全的工作。建立以数据为中心的安全系统,使得大数据拥有者对大数据的使用过程进行有效的监督和控制。
大数据时代个人数据的泄露主要有以下原因:一是利益驱动,在市场经济条件下,个人信息已经成为一种市场资源,有信息需求就会有信息的窃取。许多不法分子在利益的驱动下,利用各种手段非法获取个人数据。二是道德缺失,有些网络运营机构在职业操守上缺乏道德底线,对客户的数据安全认识重视度不够,有时基于成本考虑,人为地降低数据安全防护等级。针对以上原因可以采用以下对策来加强个人信息的保护。首先要加快个人信息保护的相关立法并且加大执行和监管力度。一些发达国家已经拥有很多成功经验,我们可以选择性借鉴。其次,各个行业应该加强自律。良好的行业自律是一个行业发展的关键,任何企业只有自觉维护客户个人数据安全,才能赢得客户的信任,取得更长远的利益。最后,可以提高大数据安全防护技术,将大数据技术与安全融合,及时发现数据安全隐患。
出版业在运用大数据技术带来益处的同时,也存在一些安全风险。大数据的应用在巨大的商业价值之下也存在一定的弊端:数据的开放性为用户的隐私和出版企业的数据安全保护工作带来巨大挑战。解决这些问题需要国家法律制度的建设和完善,也需要出版业从业者的自律以及各方面的共同合作。
大数据技术的广泛应用在很大程度上推动了整个社会的发展,使我们更好地了解这个世界,及时获取我们想要的信息。我们在享受这些益处的同时,也应该将这些利益最大化,避免这些技术为我们带来不利影响。保证数据的安全不仅仅是国家相关部门的责任,更是我们每一个人的责任,因此我们每一个人都应该积极地参与到这个过程中。