基于大数据哲学视域的精准出版探析

2019-07-05 06:55张弛

出版科学 2019年3期

张弛

[摘要] 构建因应工业4.0的精准出版，既需要大数据技术支持，也需要大数据哲学视域。精准出版所表现的“量身定做”和“私人定制”是基于数字人类学和文化组学的“量子人性”概念，大数据“一切皆可量化”的价值功能通过数据挖掘与量化分析进行用户画像，使精准出版进入“图书基因组计划”的文化基因量化分析层面。精准出版对读者用户群中“可能读者”或“潜在读者”的关注和开发是基于大数据“第四范式”的“一切皆可预测”的价值功能，依据大数据分析为读者推荐产品，使出版能为读者用户提供更加贴身的个性化服务。精准出版所依据的全媒体阅读方式是基于语义分析意义上的“超文本”原理，全媒体的移动化、社交化、互动式、网络化的趋势给精准出版创造了个性化、定制化的机遇。

[关键词]精准出版大数据大数据哲学

[中图分类号] G237[文献标识码] A[文章编号] 1009-5853 （2019） 03-0091-06

[Abstract] In response to industry 4.0， lean publishing demands big data technology support as well as big data philosophy field of vision. The private ordering of the lean publishing is based on digital anthropology and culture comics. Every thing can be measured in big data， which can create lean publishing personas by data mining and quantitative analysis. Thus， the lean publishing is at the level of quantitative analyse of Book Genome Projects culture comics.The lean publishing can recommend products to potential readers according to personas based on big data analysis，which can guide the ordering. The readers can get more comfortable personalized service. The Omani media reading realizes that the lean publishing does semantic analysis by hyper-text. Hence，the lean publishing expects the trend to the mobilization，socialization，interaction and networking.

[Key words] Lean publishing Big data Big data philosophy

目前，對于中国出版业来说，因应工业4.0和大数据潮流尽快构建基于大数据的满足用户个性化需求的精准出版服务新业态已是大势所趋。所谓精准出版是粗放出版的对称，是指针对不同读者对象量身定制精确营销的出版模式。作为出版业发展的新业态和新模式，基于大数据的精准出版既是一种技术应用，也是一种思想方法和哲学方法。只有充分理解精准出版的哲学思想方法，才能高屋建瓴地加快推进精准出版新业态建设。精准出版的大数据哲学向度主要有以下几个方面：在主体论意义上“量化人性”的“数字人类学”和“文化组学”;在科学认识论意义上“一切皆可预测”的“第四范式”;在语义分析意义上“一切可连接”的“超文本”和非结构性数据分析。

1 基于“数字人类学”和“文化组学”的精准出版

英国当代数学家及人类学家托马斯·克伦普（Thomas Crump）在《数字人类学》一书中指出：“数字的本质是人，数据挖掘就是在分析人类族群自身”;处于一定时间、地点条件下的人类族群活动是一个动态系统，“所有特定的聚居人群的经济、社会和政治都是一些动态系统”。而数字人类学就是关于“这种系统是如何运作的假设”。从这个意义上说，“人人都是建模者（modeller）”[1]。按照托马斯·克伦普的观点，数字本质上是人的行为和客观世界运动的记录，是人类行为和客观世界的数字符号化或者定量化。只是在小数据时代，人类行为数字化只限于处理具有严格逻辑性的结构化数据，难以量化处理杂乱无章瞬息万变的人的情感和心理行为数据，而大数据改变了人类掌控数据的能力，大数据MapReduce和Hadoop等非关系数据分析技术，使人们分析处理海量的杂乱无章的非结构性数据的能力发生了质的飞跃。大数据“一切皆可量化”的功能和价值使“量化人性”成为现实。被称为大数据预测专家的埃里克·西格尔（Eric Seagal ）因此提出了“量子人性”概念[2]。他认为，在大数据时代，人们对人性的认识已经由传统定性分析的经验层面进入到精准量化分析的量子层面。

基于“数字人类学”的精准出版不仅是一种业态模式，更是一个洞悉分析人性的逻辑过程。离开人来讨论精准出版，其结论肯定缺乏精准性。精准出版是一个全程出版概念，既包括出版选题策划环节的“量身定做”和“私人订制”，也包括出版印制环节的“按需印刷”，还包括销售环节的“精准营销”和“精准服务”。云南出版集团曾开展为期一年的“精准出版年”活动，提出 “十个精准”：定位精准、导向精准、策划精准、作者精准、读者精准、编辑精准、校稿精准、印刷精准、发行精准、效益精准”[3]。在这十个精准中，最重要的是读者精准，其他的精准都是围绕读者精准展开的，而读者精准是基于大数据的用户画像。“用户画像是用户数据的标签化，是真实用户的虚拟代表，是建立在一系列数据之上的目标用户模型”[4]。用户画像要求洞悉读者行为轨迹和读者心智，通过数据挖掘实现读者数据标签化。由此可见，实现精准出版必须对读者进行用户画像，读者用户画像必须运用大数据进行数据挖掘，数据挖掘的背后一定要还原为人，这就是“数字人类学”之于精准出版的哲学意义所在。

“数字人类学”强调“数据挖掘就是在分析人类族群自身”，而“文化组学”（cultureomics）可以说是“分析人类族群自身”的具体体现。

“文化组学” [5]从产生开始就与图书出版存在着天然联系，其创始人艾略兹·利波曼·埃顿（Erez Liebeman Aiden）在2007年3月访问谷歌研究部主任彼特·诺维格（Peter Norvig）时，其初始目的是能进入谷歌图书系统以获得一些数据，而谷歌图书正雄心勃勃地试图扫描人类出版的每一本书的每一页。通过与谷歌合作，对1000多万种图书进行数据挖掘，埃顿发现几个世纪以来，文字或单词在出版物上的增长和减少，反映了人类文化的演变。2010年，埃顿与其助手米歇尔联合设计出“n-grams”软件，并由谷歌推出。这种研究方法用类似基因组分析的方法研究图书数据库，他们将这种方法称为“文化组学”。“通过对世界各类书籍的数据挖掘，艾略兹·利波曼·埃顿正尝试实现绝大多数的人文研究的自动化”[6]。可见，“文化组学”是将文字或单词等关键词作为文化基因，利用大数据挖掘整理出随时间推移文化如何发生改变的量化指标。例如，通过数据挖掘发现，在19世纪，技术进步平均需要66年才能被主流文化所接受容纳，而在1880年至1920年间，这一过程只需要27年。

“文化组学”通过数据挖掘和量化分析来揭示人类心理行为和文化发展趋势，这是在原有的纯逻辑模式下难以实现的。一直以来，阅读作为一种文化体验，个人读书时的心境状态和思考过程具有很强的个体性，这种私密性是外人无从体会的。在全媒体时代，出版商和作者不仅可以通过信息互动掌握出版物的销售额，而且可以一窥读者的阅读强度。交互创作出版公司交互创作出版公司的联合创始人丽莎·卢瑟福（Lisa Rutherford）坚信“书籍应该可以是互动的”这一观念。她和亚马逊“Kindle互动型内容开发者计划”合作，在交互创作出版公司出版的网络版电子书中允许读者自己设计人物角色和情节线索，经数据分析，让作家调整故事以迎合大众口味”。 “文化组学”在图书出版中的具体运用案例是苹果公司收购书灯（Booklamp）的“图书基因组计划”（Book Genome Project）[7]。该计划根据不同读者阅读兴趣和购书记录的大数据分析，对每个读者进行“智能分组”，对每个读者进行基于“图书基因组计划”的“量身定做”和“私人定制”。“图书基因组计划”根据不同人群的文化属性进行用户画像和智能分组，具有鲜明的“文化组学”基因。

“文化组学”和“图书基因组计划”都聚焦人的文化属性，把洞悉人性放在中心位置，正如图灵奖获得者理查德·卫斯里·汉明（Richard Wesley Hamming）所说，计算的目的不在于数据，而在于洞察人和事物。同样，“出版的目的也不在于‘出版，因为更为广阔的利益回馈是通过出版衍生更多的关系和交流”[8]。互联网巨头之一的腾讯一直把洞悉人性作为关注焦点，从关注广告，到关注人与人脉，关注人群背后的数据与需求，并通过腾讯强大的用户平台、关系链及营销工具，为生产提供高效的社会化营销解决方案。围绕人脉这一核心要素，在大数据时代，腾讯社会化营销平台提供打通的用户产品、数据库的营销工具;而腾讯MIND 3.0则通过对用户行为数据的洞察、分析和挖掘，深描每一个用户族群，通过差异化标签在品牌和受众之间建立社会化的营销关联[9]。对于出版业来说，“通过精确的数据分析、方便快捷的个性化服务，去锁定用户、增强忠诚感，对于学术出版、专业出版，尤其赋予意义”[10]。因此，精准出版不是传统的经验式的抽样调查分析，而是建立在“数字人类学”和“文化组学”基础上的量化分析和人性洞悉。

2 基于“第四范式”的精准出版

“范式”一词最早出现在科学哲学家托马斯·库恩（Thomas Kuhn）的《科学革命的结构》一书中，哲学意义上的范式通常是指关于科学研究的一系列基本观念和实践规范。这些基本观念和规范包括3方面内容：“（1）共同的基本理论、观点和方法;（2）共同的信念;（3）某种自然观（包括形而上学假定）。”[11]由此可见，范式涉及哲学本体论、认识论和方法论问题。作为本体论的范式回答研究对象的本质为何以及其真实性何在的问题;作为认识论的范式回答认识者与被认识者的相互关系问题;作为方法论的范式回答认识者如何获得知识及研究方法的理论体系问题。库恩认为：“常规科学即解难题（puzzle）”[12];研究范式对科学家共同体起规范的作用，规范他们共同的思想观念和研究方法，科学共同体的任务是在范式的规范下开展研究，进而推动科学发展。

“第四范式”是已故图灵奖得主吉姆·格雷提出的，2007年1月他在《科学方法的一次革命》中提出：“用于这种数据密集型科学的技术和方法是如此迥然不同，所以，从计算科学中把数据密集型科学区分出来作为一个新的、科学探索的第四种范式颇有价值。”[13]吉姆·格雷之所以将大数据密集型范式作为独立的第四范式与实验型第一范式、理论型第二范式、计算型第三范式区别开来，是因为以前三种范式的共同特点是研究需要模型和假设，而第四范式处理PB级以上大数据的能力使人们能做到没有模型和假设也可以分析处理数据。中国工程院倪光南院士指出，科学研究的实践型范式、理论型范式、计算型范式都是在已知规律的情况下发现新的规律，而大数据“则是在未知规律的情况下，运用计算机能力从大数据中发现规律并发挥规律的作用”[14]。能够基于“未知”来探求“未知”进而发现规律，这是大数据第四范式的方法论革命，其意义在于从“未知”中发现问题和规律，进而精准预测。而公认的大数据的核心价值就是精准预测。埃里克·西格尔指出：“有若干因素将会推动预测技术的不断发展：爆炸式的数据增长、功能更加强大的计算机、更加广泛深入的理解以及科学的发展。组织与个人之间越来越多的交互行为将受到预测的驱动。”[15]

基于大数据的精准预测导致两个重要的认识论转变：第一，从小数据时代的经验式预测到大数据时代的精准性预测转变。在小数据时代，因为缺乏海量的、全面的、准确的数据作为支撑。人们对事物发展趋势的认识往往是以经验为基础的，日常表现为“大概”性的猜测。胡适曾将这种习惯“大概”的中国人称为“差不多先生”[16]。显然，“大概”“差不多”是与小数据时代相联系的。在大数据时代，海量、实时、准确的数据收集及其挖掘技术转变了人类认识事物的路径，即涂子沛在他的著作《大数据》提到的“将计算机运用于数据，而不是数据用于计算”。大数据挖掘中“Hadoop处理数据是以数据为中心，而不是传统的以程序为中心”[17]。因此，“大数据的洪流也在改变着人们对数据及其作用的认识”。“数据不再仅仅是科学研究的结果，而且变成科学研究的活的基础和工具”[18]。大数据的实时性、整体性、高效性、相关性成为精准预测的主要科学基础。第二，社会科学认识方式从“非科学”到“科学”的轉变。在小数据时代，量化人性和定量人的行为是困难的，而大数据时代赋予“定量人性”以现实可行性。“无尺度网络”概念的提出者艾伯特·拉斯洛·巴拉巴西（Albert-LászlóBarabási）指出，“人类行为93%是可以预测的”，“人类大部分行为都受制于规律、模型以及原理法则，而且它们的可重现性和可预测性与自然科学不相上下”[19]。巴拉巴西由此提出人类社会发展呈现幂律式周期爆发运动。雅虎的首席科学家沃茨（Watts）更进一步指出，由于大数据出现，社会科学将脱下“准科学”的外衣，真正走进科学的殿堂[20]。从哲学意义上讲，大数据第四范式从“未知”发现“未知”的认知方式改变了传统哲学关于“可能与现实”的关系，大数据的核心价值在于发现潜在价值和防范潜在风险，大数据 “一切皆可预测”的功能和价值大大提高了人类行为的前瞻性和防范风险的能力。

从精准出版的意义上讲，“一切皆可预测”和“可能与现实”关系的改变要求我们改变关注点，即从关注“现实读者用户”转变为同时要关注“可能读者用户”或“潜在读者用户”，过去我们通常强调“读者是上帝”，但关注的只是存在着现实买卖关系的“读者”，而不关注对“潜在读者用戶”的挖掘。主要原因是缺乏对读者用户数据的挖掘。在出版领域，将可能的“潜在用户”挖掘、发展成“现实用户”的常见措施是基于智能分组的出版物推荐系统，读者用户只要在淘宝、京东、拼多多、当当和亚马逊有过购买出版物或者浏览过出版物的记录，都会同时伴随出现相关出版物的推荐。运用这种推荐系统的成功案例是2013年推出新版《纸牌屋》的奈飞公司（Netflix），它改变了过去单纯依靠算法来优化推荐系统的传统模式，而是通过模拟人的大脑活动建构更接近人的个性化需要的智能化出版物推荐系统。埃里克·西格尔指出：“Netflix是预测分析应用的先行者，它租借出去的70%的影碟都通过预测分析在网络得到推荐。推荐对于零售业来说越来越重要。这不仅仅是商家单方面的销售指数，如果能精准地为客户推荐产品，那也是为消费者提供的贴身化和个性化服务。”[21]满足读者用户个性化需要的精准出版本质上也是智能出版，而智能出版是大数据时代的必然产物。从人类精神生产和智能活动的进步来看，数据是信息的基础，信息是知识的基础，知识是智能的基础。人类的智力活动，就是将数据转化为信息，将信息转化为知识，将知识转化为智能的逻辑过程。

3 基于“超文本”的精准出版

“超文本”一词最早由美国学者特德·纳尔逊（Ted Nelsom）在1965年提出，虽然在他之前，范尼瓦·布什（Vannevar Bush）在1930年代就提出了存储扩充器（memory extender，Memex）的想法，他设想了文本的一种非线性结构，但第一次正式使用“超文本”一词的是特德·纳尔逊。“超文本”既是一种超链接的，将不同空间和不同格式的信息数据组织起来的网状文本，更是一种用户界面范式。网状非线性是其结构特点，多通道并行传输是其传播特点。

从哲学意义上研究“超文本”的主要是罗兰·巴特（Roland Barthes）和德里达（Derrida）等解构主义语言学家，他们从语义分析角度出发，指出语言表达过程中言语所表达的意义既不是线性的，也不是单一的，其原因在于语言中能指与所指之间的对应关系会受到“第三者”的干扰，或者由于语境变化而产生意义分裂，能指会滑向另一层所指，所指也会滑向另一层能指。语言的意义由此会从原来的线性单一结构演变成非线性的、复杂的、无边的网状结构。罗兰·巴特在《S/Z》一书中指出：当读者阅读文本时，意识中“理性的逻辑方式与象征的逻辑扭作一团。这象征的逻辑不是演绎的，而是联合的：它与另外的观念、另外的意象、另外的意指作用具体之文联合起来我们被告知唯一的文本不存在”[22]。罗兰·巴将对文本阅读的设计只是“理想文本”。但其“理想文本”概念一直被视为超文本的理论基础。而真正意义上“超文本”是直到计算机和网络普及，特别是大数据、云计算、新一代人工智能蓬勃发展起来以后才得以实现的。在泛互联和大数据条件下，读者的阅读已经由以往单一的文本阅读扩展为文字、图片、音频、视频等多媒体甚至全媒体交互式阅读，阅读介质也由以往的平面媒介扩展为立体媒介阅读，以至于“媒介不再是讯息，它是讯息本身”[23]。

从哲学方法论意义上说，基于大数据的“超文本”改变了科学主义的决定论观点。科学主义认为只有自然界是决定论的，只有自然现象是遵循必然规律并可以预测的;而人类社会是非决定论的，是杂乱无章，无规律可循的。显然，这种决定论观点是与小数据时代相联系的。在小数据时代，人们的社会活动错综复杂，人的社会活动数据变动不居，千头万绪;特别是个人情感数据、人群社会交往数据等，大都是非结构性数据，既难以收集，更难以分析整理。正如中国工程院院士李国杰所说：“人们日常生活中所产生和获取的数据85%以上是非结构化和半结构化数据，传统的关系数据库无法胜任这些数据的处理，因为关系数据库系统的出发点是追求高度的数据一致性和容错性。”[24]在大数据条件下，以Hadoop和MapRduce为代表的非关系数据分析技术，使人类获得了处理非结构性数据的强大能力。通过社交网络服务（SNS）获取人们的网聊记录，通过在线支付获得人们的消费记录，通过LBS获得地理位置信息，通过视频监控、电子邮件获取人们的言谈举止数据。这些“超文本”数据大大扩展了对人的认知范围和认知深度。出版作为符号信息的社会化工作，“随着符号的精细化、准确化、形象化，同时也伴随着人类精神的自我认知与发展，人类精神活动得以在其中直观展开”[25]。

从精准出版的意义上讲，“超文本”对传统出版有两个重要改变：一是“超文本”的网络全媒体结构改变了人们传统的、单一的、线性阅读方式，交互式、体验式阅读大大提高了人的阅读参与性和阅读兴趣。由于全媒体阅读的发展，中国三大电信运营商都投入巨资进入图书阅读市场，中国移动推出“和阅读”，中国电信推出“天翼阅读”，中国联通则推出“沃·读者”。还有一些网络文学运营商不断拓展阅读体验新空间，如塔读文学推出“富媒体互动阅读计划”，其网上运营的“阅space”客户端，围绕互动阅读提供图文并茂、音频视频交互、页面多样套用的阅读内容。时代出版传媒推出“时光流影TimeFace”阅读社交化计划，“QQ阅读”把阅读和社交结合起来，其精彩内容可以在朋友圈链接、传递、分享。这种阅读方式移动化、社交化、互动式、网络化的趋势是“超文本”带给出版精准化、个性化、定制化的机遇。二是“超文本”的网络无边、即时特性改变了传统单一的学习方式，在线学习大大提高了人们学习的便捷性和选择性。中央电视台曾以“慕课来了”作过专题报道，“慕课”作为一种基于互联网和大数据的教学模式，其“线上+线下”的资源整合模式比传统单一线下教学更有优势。“慕课”的迅猛发展使得课程教材出版也出现了“纸质版教材+光电网络教材”的价值构造。美国高等教育在线学习公司Sipx副总裁海瑟·鲁兰·斯特图斯（Heather Rez Stratus）指出，“ 慕课对于出版产业拓展出版空间具有重要价值。‘慕课需要内容，学术出版商应该抓住这一机会为‘慕课提供内容，从而拓展新的市场”[26]。从体量上说，慕课是面向亿万人的超大课堂;从个人需求来说，慕课又是私人定制、按需组合的精准课堂。可以说，“慕课”既拓展了传统的课堂学习方式，也拓展了传统的线下出版方式。

当然，“超文本”不仅仅只是改变了传统的出版格式和格局，更重要的是改变了出版传播的理念和思考方式。事实上，基于罗兰·巴特的“理想文本”理念和计算机网络技术的发展，全球出版业在几十年前就已经开始从纸媒体时代向多媒体时代的转型。中国很多出版机构不仅拥有纸质出版物的出版权，还拥有电子音像和网络出版物的出版权，在出版传统纸质图书基础上，不少出版机构还推出电子版、手机版、网络版以及应用程序（App）等多种媒体出版物。但是，几十年过去后，多媒体出版的效果并不尽如人意。分析其原因主要有两个。

第一，只转变媒体方式而没有转变出版理念。很多出版机构还是沿用老式的出版理念来运营新媒体，像搬家一样将老的、纸质的内容拷贝到新媒体上，而并不在意这些内容的简单搬家式移植是否符合读者用户的个性化需要，这种用老思维嫁接新技术的做法本质上是没有理解新媒体的价值和意义。其实，新媒体之新，不仅仅表现在技术上和形式上将文字、图表、音频、视频等多种格式的文本集于一身，更重要的是它从传播学意义上消解了传播者和接受者主客二分的二元身份，使传播者能变成接受者，使接受者能变成传播者。同时，新媒体特别是网络媒体的应用还改变了传统传播的时空特性。而在线阅读、移动阅读打破了以往传播时间和传播空间的局限性，使阅读成为可以实时、实地进行的个性化选择。显然，新媒体突破了传统媒体的主客二分和时空局限性，具有个性化、互动性、精准性、及时性、移动性、开放性、海量性、低成本等特点，而其中精准传播和互动传播是新媒体最本质的特征。美国《在线》（OnLine）杂志在对新媒体进行定义时指出：“新媒体是所有人对所有人的传播。从这个意义上说，传播受众不再是单纯的、被动的信息接受者，受众同时也是转播主体。”美国学者J·A·巴伦（J.A.Barron）在20世纪60年代提出的受众参与理论在互联网、移动互联时代日益变成日常传播实践。正因为如此，新闻传播学界有人提出以“用户”概念替代“受众”概念[27]。

第二，缺乏大数据思维，不注重读者用户的数据收集、数据挖掘和数据利用，只是把新媒体当做简单的传播工具。目前，很多纸媒出版的App都不注意分析用户行为数据，很少有运用“用户网络行为画像”的成功运作案例。用户画像是一种能将定性与定量方法很好地结合在一起的载体，定性的方法通过对用户的生活情境、使用场景、用户心智进行分析，对用户的性质和特征做出抽象与概括;定量的方法可以对特征做精细的统计分析与计算，获得对于用户较为精准的认识，便于在数值排序的基础上实现核心用户的发掘与突出[28]。但遗憾的是，出版行业目前在运用“用户画像”实现精准出版方面还没有真正起步。最突出的表现是，移动用户的阅读高峰一般出现在晚上十点至凌晨一点这一时间段，这一时间段很多出版媒体的App反而不再更新内容，因为体制原因，这一高峰段传统媒体员工都下班了。媒体既然面对的是读者和用户，就要知己知彼，读懂用户的消费需求。为了精准了解用户行为，美国创业公司海马（Hiptype）推出一套专门的电子阅读分析工具，既能统计读者的试读次数和购买次数，还能统计读者的年龄、职业、性别、收入、居住地址及阅读爱好，并通过对数据分析绘制“读者图谱”。当今的社会化阅读，早已将大众传播的内容移植到人际交往平台上，社交平台产生的大量“超文本”非结构性数据，一般都是通过音频、视频、网络日志、图片、聊天记录等非逻辑形式表现出来的。过去由于缺乏大数据技术，这些非结构性数据大都被当做“数据垃圾”和“数据废气”舍弃。在大数据时代，处理“黑暗数据”和“数据废气”已不是太大的技术难题，出版行业要真正建立基于读者用户个性化需要的精准出版新业态，亟需进行出版理念和思维方式的革命。

注释

[1] [美]托马斯·克伦普.数字人类学[M].北京：中央编译出版社，2007：110-111

[2] [15] [21][美]埃里克·西格尔（Eric Siegel）著;周昕译.大数据预测[M].北京：中信出版社，2014：259，235，149

[3] 孙海悦.云南出版集团开展“精准出版年”活动[N].中国新闻出版广电报，2016-03-29

[4] 曾鸿，吴苏倪.基于微博的大数据用户画像与精准营销[J]现代经济信息，2016（16）：306-308

[5] [美]艾略兹，利波曼，埃顿.数字化图书的定量文化分析[J].科学，2011（1）：176-182

[6]杨鑫倢.终有一天，大数据会“颠覆”出版业[N].IT时报，2013-08-16

[7]爱德华·诺沃特卡.极具创意的图书基因组计划[EB/OL].[2018-06-11].http：//www.bookdao.com/article/27706/.htm

[8] 白志如.国内众筹出版项目的内容分析与发展建议[J].出版科学，2014（5）：74

[9] 麻震敏.大数据时代：营销智慧的进化论[J].成功营销，2012（7）：82-83

[10]蔡翔.传统出版融合发展：进程、规律、模式与路径[J].出版科学，2019（2）：10

[11] 邓仲华，李志芳.科学研究范式的演化：大数据时代的科学研究第四范式[J].情报资料工作，2013（4）：19-23

[12]T.S.库恩著;李宝恒，纪树立译.科学革命的结构[M].上海：上海科学出版社，1980：29

[13]Tony Hey Stewart Tansley Kristin Tolle著;潘教峰，张晓林译.第四范式：数据密集型科学发现[M].北京：科学出版社，2012：11

[14]黄晓艳，单晓钊.关于大数据：访中国工程院院士倪光南[J].高科技与产业化，2013（5）：40-45

[16]涂子沛.大数据[M].桂林：广西师范大学出版社，2013：329

[17]陈明.数据密集型科研第四范式[J].计算机教育，2013（9）：103-106

[18]梁娜，曾燕.推进数据密集科学发现提升科技创新能力：新模式、新方法、新挑战：《第四范式：数据密集型科学发现》译著出版[J].中国科学院院刊，2013（1）：115-121

[19][美]艾伯特·拉斯洛·巴拉巴西著;马慧译.爆发：大数据时代预见未来的新思维[M].北京：中国人民大学出版社出版，2012：Ⅲ

[20]D.J.Watts.“A twenty-first century science”[J].Nature，2007，volune445：489

[22][法]羅兰·巴特著;屠友祥译. S/Z[M].上海：人民出版社，2000：136

[23][美]尼葛洛庞帝著;胡泳，范海燕译.数字化生存[M].海口：海南出版社，1996：68

[24]李国杰.大数据研究的科学价值[J].中国计算机学会通讯，2012（9）：10

[25]侯亚丁.媒介产业的价值生态[J].出版科学，2015（1）：53

[26]孙牧. 大数据推动学术出版革新[N]. 中国出版传媒商报，2013-10-08

[27]曹疆.从内容为王到用户至上[N]，中国产经新闻报，2013-04-14

[28]牛温佳，刘吉强，石川，等.用户网络行为画像：大数据中的用户网络行为画像分析与内容推荐应用[M].北京：电子工业出版社，2016：3

（收稿日期： 2019-04-04）