摘 要:出版数据要素“是什么”“有何特征”“有何功能”是认知和理解出版数据要素的基础问题。出版数据要素是指以比特形式被计算机存储和处理,并被投入出版生产经营过程中的数据资源。作为关键生产要素,出版数据要素成本低、大规模易获取、用途广泛,还具备虚拟性、非竞争性、部分排他性、规模报酬递增及智能即时性特征。出版数据要素的挖掘、建设和应用,有助于丰富出版要素体系,提升出版要素体系质量;有利于创新数据出版新业态,完善出版业价值体系;能够有效打通融合出版数据底座,强化全媒体出版传播体系构建;有益于完善出版治理方式,推动出版治理体系现代化;最终实现生产要素体系底座的创新,推动出版业高质量发展。
关键词:出版数据要素;数据出版;全媒体出版传播体系;出版深度融合发展;出版高质量发展
DOI: 10.3969/j.issn.2097-1869.2024.04.001 文献标识码:A
著录格式:张新新,游恒飞.出版数据要素的概念、特征与作用机制[J].数字出版研究,2024,3(4):2-10.
随着数字化的不断深入及数字经济、数字政府、数字社会、数字文化建设的推进,数据日益成为战略性资源和关键生产要素。2017年12月8日,习近平总书记在中共中央政治局第二次集体学习时明确指出“在互联网经济时代,数据是新的生产要素,是基础性资源和战略性资源,也是重要生产力”;2019年10月,《中共中央关于坚持和完善中国特色社会主义制度 推进国家治理体系和治理能力现代化若干重大问题的决定》指出“健全劳动、资本、土地、知识、技术、管理、数据等生产要素由市场评价贡献、按贡献决定报酬的机制”;2020年3月,中共中央、国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》,指出构建更加完善的要素市场化配置体制机制,并就政府数据开放共享的推进、社会数据资源价值的提升及数据资源整合和安全保护提出了明确的指导意见;2022年12月,中共中央、国务院发布《关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称《数据二十条》),指出“充分发挥我国海量数据规模和丰富应用场景优势,激活数据要素潜能,做强做优做大数字经济,增强经济发展新动能,构筑国家竞争新优势”;2023年12月,《“数据要素×”三年行动计划(2024—2026年)》进一步提出要发挥数据要素的放大、叠加、倍增作用,构建以数据为关键要素的数字经济,并提出开展“数据要素×”行动计划。综上所述,数据作为新生产要素、关键生产要素将深刻影响各行各业。如何激活出版数据要素潜能、释放出版数据要素价值,将成为未来十年甚至更长时间内出版高质量发展的核心议题,要解决这些问题,首先就要明确界定出版数据要素的概念、特征及作用机理。
出版数据属于“数据要素×文化”范畴,在出版业数字化转型升级、出版融合发展、出版深度融合发展的各阶段,都是贯穿于出版数字化发展的一条主线。笔者的相关研究成果也有所涉及,如2015年,撰文指出“数据出版,是指以数据作为生产要素,把文字、图片、音视频、游戏、动漫都当作数据的一种表现形式,围绕着数据的挖掘、采集、标引、存储、计算开展出版工作,通过数据模型的建构,最终上升到数据应用和数据服务的层面”[1];2016年,指出出版业大数据应用的内容前提是数据价值体系,提出出版业的“直接价值、数字化价值和数据化价值”[2],并就出版数据的采集、标引、计算、建模和服务等问题进行分析;2017年,提出数据是智能时代出版业的能源和生产要素[3],最终趋势是建成跨学科、跨领域、跨媒体的出版业超级大数据;2023年,撰文分析出版业的传统生产要素和数据、技术两种新要素在出版业高质量发展进程中的作用机制[4]。
出版数据是衔接传统出版和新兴出版发展的“黏合剂”、关键点和联结点。出版深度融合发展的内容建设、先进技术、创新管理要求都可以在出版数据要素中汇聚和交融。出版数据要素是数据要素的重要组成部分。那么,出版数据要素究竟是什么?有哪些特征?为何重要?出版数据要素与传统要素有何区别与联系?本文将对上述问题作出思考和分析。
1 出版数据要素的内涵界定与解析
生产要素,作为经济学的基本范畴,是生产经营活动所需要的各种资源,是生产经营过程必备的基本因素。进一步而言,生产要素是为“生产和服务活动而投入的各种经济资源”[5],是“投入生产过程的投入品,其本身就是上一生产阶段或过程的产品”[6],包括有形的土地、资本、劳动力要素,也包括无形的管理、技术、数据等要素。
从人们对生产要素的认知历程来看,在农业经济时代,土地和劳动力是关键生产要素;至工业经济时代,资本打破了自然资源有限性的约束,成为关键生产要素,知识、技术、企业家精神等作用日渐凸显;再至数字经济时代,数据继土地、劳动力、资本、知识、技术、管理之后,成为新的关键生产要素。因此,也有人称数据为数字经济时代的“新石油”“新能源”“新货币”。每一次科技革命催生了新的关键生产要素,而识别它们的标志在于具有广泛的用途及可低成本、大规模获取。
广义而言,数据是指“基于测度或统计产生的可用于计算、讨论和决策的事实或信息”[7];狭义而言,数据在新生产要素意义上,是指“被编码为二进制‘0’‘1’字符串,以比特形式被计算机设备进行存储和处理的信息”[8]。新生产要素意义上的数据是计算机和现代信息通信技术的产物,是载体和内容的有机统一,其载体是“0”“1”字符串,其内容是比特形式所承载的信息或事实。就出版业而言,对数据承载内容的重视、挖掘和建设,则成为激活出版数据要素潜能、实现出版数据要素价值的关键所在。综上,出版数据要素是指以比特形式被计算机存储和处理,并被投入到出版生产经营过程中的数据资源。
首先,出版数据要素体现为数字形式,即以比特形式被计算机存储和处理。前述广义的数据,并非出版数据要素,尽管其是可用于计算、讨论或决策的事实、信息。事实上,出版业存在着为数更多、规模更大的广义数据或原始数据,只不过它们都“沉睡”在库房里,以纸质图书、期刊、报纸等纸质媒介形态出现。这并非新生产要素意义上的数据。从关键生产要素来看,出版业数据须以数字形式出现,即主要采取二进制(理论上还包括三进制或多进制)代码进行创建、存储、传输、呈现和处理。
其次,出版数据要素是指被投入到出版生产经营过程中的出版数据资源。前述以纸质形态或以数字形式出现而未经加工的排版文件、大小样文件等原始数据,其“只有经过数据的采集、存储、处理、分析”[9],才能成为动态可用的数据资源,但距离它们成为出版数据要素还差一步,即要被投入到出版生产经营过程——只有用于生产经营的出版数据资源,才是出版数据要素。数据资源被投入到出版生产经营过程有多种形式:(1)内容数据资源被投入到电子书、数字图书馆、专题数据库中,用于制作专门的出版数据产品;(2)用户数据资源经多层次、多类别、多角度挖掘、计算、统计、分析后,辅助出版选题策划和营销决策;(3)交互数据资源经采集、存储、处理后,吸收和采纳合理的建议,用于改进出版数字化产品及提升出版社品牌影响力;(4)出版治理数据被用于优化出版决策、提升出版管理效能,作为出版管理辅助参考等。
最后,出版数据承载的内容具有特殊性,担负着意识形态维护与弘扬、文化传播与传承、科技成果传播等特殊使命。激活出版数据要素潜能、实现出版数据要素价值的关键在于识别、挖掘和建设蕴含在出版数据中的内容,这一点和构建全媒体出版传播体系所要求的“以内容建设为根本”不谋而合。在新质生产力的赋能下,全媒体出版传播体系由出版数据要素供给,促进出版数据的分类分级,推动出版内容、用户、交互、治理数据体系构建,从而丰富了内容形式和载体,使得出版“从以知识为主要劳动对象,走向以知识、数据为主要劳动对象”[10],从而催生数据出版的颠覆性创新业态。但关于什么是“内容”,仍需要进一步明确。《关于推动出版深度融合发展的实施意见》(2022)强调“内容建设”,并在“内容供给”“内容呈现”“内容精品”三方面提出具体举措。
就出版数据所承载的意识形态功能而言,出版数据资源蕴含着丰富的党的创新理论内容、社会主义现代化建设伟大成就等内容,出版数据是坚持和维护主流意识形态、推动社会主义核心价值观传播的重要载体和微观载体。出版数据所承载的文化内容包括表达和反映中华优秀传统文化的内容,表达和呈现革命文化的内容,表达和反映社会主义先进文化的内容。具体而言,包括弘扬中华民族精神、重要文化典籍、人文社科领域精品、重大科技创新和科技攻关成果、科学普及类精品、文学艺术精品、网络出版类精品等内容。0a74f7d713b81dc3187f7b0fe7652d16eb5c82b0fc2f11a19d304567e2b9ca61
综上,数据成为出版业关键生产要素,是对知识生成方式的革新与重塑,能够从要素底层实现出版业的产业创新,催生数据出版新业态。“数据价值潜力需要通过转化为信息、知识才能实现和释放”[11],而出版业恰恰是生产和传播知识的行业。数据要素在出版业的要素潜能释放、要素价值实现方面具有得天独厚的优势和潜力。一方面,出版活动的实质是“编辑基于作品素材进行社会化知识生产和传播的过程”[12],只不过以往知识生成的主体是人类(无论是作为个体的人类抑或是作为群体的大学、机构等);另一方面,知识生产方式已经由个体、群体的智慧驱动转向数据驱动,人工智能生成知识与人类生成知识形成了人机协作生成知识的新格局。由此,数据要素和知识要素在出版业实现了合流。数据成为出版业关键生产要素,实现了出版业要素体系的进一步丰富和健全。值得深思的是,不似数字出版是数字技术赋能的出版新业态,数据出版是以数据为关键要素的出版新形态,前者是出版业科技创新的产物,后者则是出版业产业创新的结果。从科技创新走向产业创新,将是破解出版业一系列发展不平衡、不充分问题的关键所在。
2 出版数据要素的多维“技术—经济”特征
在界定出版数据要素的概念后,可进一步分析出版数据要素的特征。除成本低、大规模易获取性及用途广泛外,作为关键生产要素,出版数据要素还具有虚拟性、非竞争性、部分排他性、规模报酬递增及智能即时性等基本特征。
2.1 虚拟性
出版数据要素的虚拟性,是指出版数据以虚拟的、数字的、非实体的形式存在,以二进制编码形式存在于数据库、数字图书馆、互联网等数字空间。虚拟性包含以下几层含义:
第一,存在形式的数字化。出版数据以数字化——主要以二进制“0”“1”字符串的形式存在于虚拟空间。这是数据、知识、技术、管理等新兴生产要素和土地、资本、劳动力等传统生产要素的主要差异,后者往往以有形、实体的形式存在于实体空间。
第二,与数字技术的融合性。出版数据要素的虚拟性,意味着其常与信息和通信技术(ICT)有机结合、深度融合,催生出数字图书馆、专题数据库、AR出版物、VR出版物等数据出版产品,这是实现出版数据要素向出版数据产品演进升级的关键,也是对出版数据要素价值实现至关重要的一步。
第三,与实体要素的渗透融合性。“数据要素虚拟性的存在意味着必须以其他要素作为载体才能发挥作用”[13]。换言之,出版数据要素作用的发挥,需要与其他生产要素进行渗透融合。例如,出版数据要素渗透劳动要素并与劳动要素融合,对内能够强化编辑数据理念,提升编辑数据素养和技能,对外则有助于丰富数据编辑类型,推动首席数据官、数据分析师、数据工程师等出版业编辑新岗位的设立。再如,出版数据要素与资本要素的渗透融合,形成出版数据资本,而这也是当下数据要素价值评估、认定、入表等热门研讨之事宜。
2.2 非竞争性
出版数据要素的非竞争性,是指出版数据要素一旦形成,则不因其他用户对其消费而减少供给、减损功能。在供给数量方面,理论上讲,原始数据转变为数据资源后,作为要素投入到生产经营过程的数据可以反复多次甚至无数次重复使用;在功能减损方面,数据出版产品的多主体、同时段、大规模共享共用性质,使得其不会减少其他用户的使用功能。如纸质图书一旦被购买,则该本图书就无法被第二个用户购买,而电子书等数据出版产品可同时被众多用户阅读、消费、检索、查询等。另外,出版数据要素的使用范围越大、使用频次越高,则其价值越大、价值增值性越强。例如,某数字图书被10~100万名消费者购买、阅读的过程中,其社会效益和经济效益会不断实现倍增,版权价值也会不断实现乘数效应的提升。
2.3 部分排他性
排他性,是指排斥他人消费的可能性,即某主体完全拥有物品的所有权或使用权时,其他主体不同时拥有;非排他性,多针对公共产品,是指某人消费时无法排除其他人同时消费的特性[7]。出版数据既不是排他性的生产要素,也不是完全非排他性的生产要素,而是部分排他性的生产要素,体现为:首先,出版数据资源的权利主体是多元而非一元主体。出版物作品的著作权、专有出版权、数据资源加工权、数据产品运营权分属于不同的权利主体。正如《数据二十条》指出要根据数据来源、生成的特征,分别界定数据生产、流通、使用中各方享有的权利,“建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制”,从而为激活数据要素价值创造、价值实现提供基础保障制度。其次,电子书、知识库、专题数据库等数据出版产品,在互联网、移动互联网传播的特征,扩大了出版数据资源的传播范围,客观上形成了出版数据要素使用中的非排他性。再次,对用户的部分排他性如出版社往往通过加密、数字版权管理(DRM)、数字水印等技术手段,将非授权用户排除在使用主体范围之外。最后,对其他竞争者的部分排他性如出版企业往往不会轻易公开自己采集、加工、整理、形成和拥有的出版数据资源,而是将其作为自身核心竞争力,由此形成了对其他出版单位的“排他”。在实践中,基于部分排他性而实现数据出版产品的盈利是出版企业的通行做法,如基于专业数据资源的内容优势,建设法律、医学、建筑、农业等领域的专题数据库并向第三方出售使用许可,利用排他性实现数字产品的出版收入。
2.4 规模报酬递增
生产要素规模报酬性质属于微观经济学的核心范畴,规模报酬性Jkhew2DSZjXnftuwgk/Ws8PcTIXTKbUhmWuAx9Gg/pY=质由边际报酬决定。出版数据要素报酬性质存在三种情况:当增加1单位数据要素投入使得收益以更大比例增加,即为数据要素报酬递增;当收益实现同比例增长,即为数据要素报酬不变;当收益增长比例低于投入增长比例,即为数据要素报酬递减。
数据要素报酬递增与以下因素相关:“数据质量高、数据参与生产规模大、数据参与生产的供给侧以及数据密集型产品的需求侧外部经济大、数据驱动的学习效应强”[11]等。具体而言:(1)拥有高质量的出版数据,体现为三个方面:一是数据加工成本低,对出版原始数据进行清洗、标引、整理从而形成真实、完整、及时、有效、一致的高质量出版数据资源,所花费的人力、物力、财力成本较低;二是数据折旧率低的出版数据资源,其易用性、耐用性更强,则数据质量更高;三是是否拥有经过专家标注的高质量语料数据,其在出版垂直大模型构建方面往往能够发挥重要价值。(2)出版数据大规模参与生产经营过程。就出版企业而言,数据规模越大、数据类型越丰富,出版数据与编辑融合的越多,数据资源投入到出版生产经营过程越多,则数据驱动的信息和知识就越多,从而呈现出规模报酬递增的特征。(3)外部经济性强。一方面,就供给侧外部经济性而言,出版数据是“元要素”“要素的要素”,能够给资本、劳动等带来外溢作用,渗透和融合有形要素,驱动优质知识要素的生成,与技术、管理等无形要素有机融合,从而促进规模报酬递增;另一方面,就需求侧外部性而言,对用户数据、交互数据的深度挖掘、统计、分析和应用,能够有效提升用户粘性,甚至提升用户对出版品牌的依赖程度,从而提升边际效益、促进规模报酬递增。(4)数据驱动的学习效应强。“学习效应是数据报酬递增的关键源泉”[11],出版业往往通过“传帮带”“干中学”来积累隐性的知识和经验,数据驱动知识生成的模式,是指“基于海量数据的知识生产原料,从中挖掘出新规律、新知识,实现数据、信息走向知识生成的使命”[14]。近年来,随着大数据技术不断应用于出版业,出版数据数量和质量不断提升,数据存储和计算成本不断下降,数据驱动学习的能力越来越强、时间越来越短、效率越来越高,数据生成知识的规模、速度、效益和质量均有了显著提升,从而推动出版初级要素实现报酬递增。
2.5 智能即时性
智能即时性,是指随着计算能力、深度学习、新一代人工智能技术的迅猛发展,出版业数据生成、传输、分析、处理的速度将得到大幅度提升。出版业数据智能性,是数字经济对出版业发展的要求,也是智能出版、生成式智能出版、数据出版等出版深度融合发展新业态的题中之义。智能选题策划、智能编校排、智能印刷、智能发行营销等环节,都离不开数据的智能化支撑和辅助决策。
出版业数据的即时性,是指出版数据资源的生成、传输、分析和处理的效率得到全面、系统、显著的提升。如“基于海量无标注的出版数据、高质量人工标注的出版数据以及基于人类反馈的强化学习算法”[15]可以无延迟地解答用户的问题,生成新的文本数据。
数据要素成本低、用途泛在、大规模易获取的特性是其与传统的土地、资本、劳动力等有形生产要素的根本区别之一,后者的成本、用途范围和获取难度明显更高。不过,就目前来说,出版数据成为关键生产要素,在这几个方面还存在着不同程度的问题,需要从理念、实践和制度方面努力攻克。首先,关于出版数据的成本,出版实践中的融合出版企业资源计划(ERP)缺位、传统出版和数字出版生产经营流程“两张皮”“两股道”,致使内容数据资源的生成仍然需要通过额外的数字化加工工序,重新投入人力、物力和财力资源,严重束缚了出版数据资源的生成、使用和处理。其次,出版数据用途的广泛性,在出版调治的各环节、各领域客观存在着不平衡、不充分问题。对出版治理数据的认知、挖掘、分析和应用,将数据要素用于辅助决策、管理和服务出版业,以及构建完善的出版数据分级分类治理机制,距离出版数据治理、敏捷治理均尚有一定差距。最后,关于出版数据的大规模易获取性,由于前述传统出版和数字出版流程、工具的割裂、分离,致使高质量、高水平的出版数据资源的制作、生成、采集的规模依然受限,尤其是在制资源的同步生产问题较为突出。
3 数据要素对出版业高质量发展的作用机制
将数据作为关键生产要素,是出版业适应数字经济发展、扩充价值体系、推动出版治理现代化、构建全媒体出版传播体系和推进出版业高质量发展的需要。
3.1 丰富出版生产要素体系,提升出版要素体系质量
出版业的资本要素包含纸张、油墨、印制设备、厂房等;劳动要素主要是指出版从业者,包括书报刊编辑、数字出版编辑等;技术要素是指投入到出版生产经营过程中的技术资源,目前主要体现为数字技术;知识要素则是投入到出版生产经营过程中的知识资源。而数据要素的加入,进一步丰富了出版业要素体系,使出版业对要素的认知由传统以有形要素体系为主转变为有形要素与无形要素相结合的复合型要素体系。
数据要素的引入有效提升了出版要素体系质量。第一,其新增了出版数据要素,健全了出版资源体系结构,有效提升了整个出版要素体系的抗风险能力。出版数据要素对发展出版业数字经济、迎接数字风险与挑战、弥补出版业数字鸿沟等具有至关重要的作用。第二,其改造提升了传统出版要素,赋能传统要素体系,提升传统要素质量。具体而言:(1)数据要素与资本要素的结合,能够在数据辅助、数据驱动决策、数据支撑下有效地组织出版机构资本要素的配置,解决信息不对称、配置不协调或不平衡等问题;(2)数据要素与劳动要素的融合,能够提升传统书报刊编辑、数字出版编辑的数据素养技能、智能素养技能及创新素养技能,进一步丰富数据编辑类型;(3)数据要素与技术要素的融合,能够推动数字技术产业化,使出版业的数字技术应用具备更扎实的数据基础,能够更快寻找应用场景,同时进一步围绕数据采集、分析、计算、处理等环节催生新的数据技术,促进数字技术体系的健全和完善。例如,出版垂直大模型的建设,除基于人类反馈的强化学习算法和超强算力外,更离不开海量的出版数据语料库和高质量的人类专家标注的数据;(4)数据要素与知识要素的融合,一方面能够驱动知识生产方式由智慧驱动走向数据驱动,提升知识生产的规模、效率和质量,满足大规模知识生产和消费的需要,另一方面,数据要素“强化知识要素的溢出效应”[16],推动知识溢出效应中的连锁、模仿、交流、竞争、带动和激励效应等环节行动更迅速、效果更突出。第三,数据要素与有形要素和其他无形要素的融合,形成出版业的复合资源体系,并以数据的超强渗透性、融合性形成新的出版资源,进而实现出版要素体系层面的质变。
3.2 创新数据出版新业态,完善出版业价值体系
出版数据要素的引入,进一步催生以数据要素为关键要素的数据出版新业态,推动出版业价值体系由直接价值、数字化价值走向数据化价值体系的扩充,形成纸质出版物、数字化出版物、数据化出版产品服务三位一体的价值体系。
出版业的价值体系目前主要是由纸质出版物和数字化出版物所创造,“种册件”所描绘的传统出版商业模式仍然是主流。纸质出版物创造的营收和利润构成了整个出版业的中流砥柱,直接价值仍然是目前出版业价值体系的关键所在。数字化出版产品服务所创造的价值,主要是指基于原版原式电子书或出版物所拆分出来的专题数据库、知识库所创造的价值,经过十余年的发展,该部分产值已逐步提升。数字化价值是纸质书报刊实现价值基础上的二次价值创造,部分头部出版机构数字化收入、利润甚至达到总收入、利润的50%以上,如人民法院出版社、知识产权出版社等。而数据化价值,是纸质书报刊价值基础之上的三次价值创造,指数据作为新生产要素贡献的价值,是在知识资源数字化、碎片化的基础上,进行多维度、立体化标引,经过知识关联、计算,通过数据模型构建及提供数据服务所产生和输出的二次数据所创造的价值。数据化价值是未来出版业数据化转型的重点和关键所在,也是实现整个出版业产业创新的关键所在。
3.3 打通融合出版数据底座,强化全媒体出版传播体系构建
全媒体出版传播体系,即“以内容建设为根本、先进技术为支撑、创新管理为保障的新型出版传播体系”[17]。出版深度融合发展是走向全媒体出版传播体系的必由之路和必经阶段,其中的“深度”体现在理念融合、调节融合、治理融合等范畴,而能够实现理念、调节和治理融合的凝结点、关键点则是出版数据要素。
从微观视角看,每1单位“出版内容数据”1的内部构成要素都分为两个方面,一方面是传统出版的内容要素,另一方面则是新兴出版的数字技术要素。每1单位出版数据都是“传统出版的内容+数字技术应用”的结果。出版数据所负荷的内容,是传统出版内容的再现;出版数据应用的技术隶属于数字技术、数据技术的范畴。因此,每1单位出版内容数据,都是“内容建设”和“先进技术”二者有机融合的结果。同理可知,每1单位治理数据则是“内容建设”“先进技术”“创新管理”三者有机结合、深度融合的结果。
从宏观视角看,出版数据要素是衔接传统出版和新兴出版的纽带。出版数据要素尤其是内容数据,本就是传统出版内容数据化的产物,是对传统出版内容进行清洗、标注、加工、处理后得到的高质量内容数据资源。同时,出版数据要素又是新兴出版的战略资源和核心资源,是数字出版、数据出版、智能出版等融合出版新业态的战略基础资源。几乎每一种融合出版新业态都是出版数据要素结合新兴数字技术的结果,如内容数据和AR/VR技术的融合形成了AR/VR出版物,内容数据和生成式人工智能技术的融合则形成了生成式智能出版产品服务。
综上,新兴出版是以数据要素为底座和基质的出版新形态,传统出版和新兴出版的融合,源起是数据资源的联通、共享和归一。数据是衔接传统出版和新兴出版发展的关键点、联结点和结晶点。
3.4 完善出版治理方式,推动出版治理体系现代化
数据创造价值的本质是“数据驱动的决策优化过程”[11]。“出版数据驱动的决策与管理,是出版数据要素价值实现的重要保障”[18]。出版治理的关键是解决信息不对称和条件不确定问题,唯有解决这一问题,作出的决策方有可能是科学的、合理的。
就出版机构微观治理而言,数据要素被引入出版经营管理过程,能够有效减少信息不对称问题,推动决策主体尽可能作出科学、民主、合理的决策。机构内部选题数据集的建立和完善,可优化选题策划,基于以往的选题数据对新策划的选题进行论证和预测,可提升选题策划环节的质量和效率;出版机构内部专业出版语料库的建设,可嵌入智能编校排系统,提升出版编校工作质量和效率;出版物销售数据的采集、分析、计算和处理,能够有效预测和指导出版物的印制数量和营销工作,提升印制发行环节的质量和效率;数字出版治理本就依托数据资源进行经营和管理,因此具备数据驱动经营管理优化的天然优势。
就出版行业宏观治理而言,数据要素引入出版治理,有利于创新数据治理新模式,推动敏捷治理模式的广泛应用。一方面,数据要素被引入出版常规治理体系,有助于解决信息、数据不对称问题,改进和提升传统治理质量和效率,推动意识形态治理、规划治理、法律治理、财税治理、标准治理体系的科学性和合理性提升。另一方面,数据资源被引入出版创新治理体系,是创新治理体系的内在要素和关键要素。融合出版等新兴出版业态的敏捷治理模式,由基于出版数据采集、存储、管理等情景捕捉阶段,基于数据分析、理解和应用感知阶段,以及基于可行性方案的灵活回应阶段这三个阶段构成,数据要素的采集、分析、计算、应用和处理贯穿于新兴出版敏捷治理的全过程和各阶段。
3.5 实现要素体系底座的创新,推动出版业高质量发展
创新是出版业高质量发展的根本特征,创新性决定和规制着出版业发展的协同性。出版业的创新是以内容创新为根本、以技术创新为支撑的出版全面创新体系,技术创新引领出版内容创新、产品创新、服务创新、业态创新、模式创新、管理创新。
在出版业创新体系中,生产要素的创新起根本性和决定性作用。数据要素的引入和应用,推动土地、资本、劳动力三位一体的有形要素体系向知识、技术、管理、数据四位一体的无形要素体系演进。而相较知识、技术、管理,数据是更为重要的关键生产要素,其与资本、劳动力、知识、技术、管理要素的结合,能够有效降低出版生产过程中的资本投入,提升出版收益和产业链环节质量;推动编辑数智素养和创新素养技能的不断提升;驱动知识生产方式由个体生产知识、群体生产知识走向人工智能生成知识、数据驱动知识生成;催生数字出版、数据出版、智能出版等融合出版新业态新模式;推动出版管理走向出版治理、出版敏捷治理,创新出版治理体系和治理能力。由此,数据要素推动着整个出版数据要素体系创造式发展、创新性提升,为整个出版产业创新奠定要素基础和资源基础,为出版业高质量发展奠定要素基础和数据基础。
4 结语
自《数据二十条》出台以来,数据要素的低成本、大规模易获取性和用途广泛性推动着数据成为数字经济时代的关键生产要素。出版学探讨数据要素、数据出版的成果仍有限,本文权且抛砖引玉,对出版数据要素的概念进行界定,并分析其虚拟性、非竞争性、部分排他性、规模报酬递增、智能即时性五个基本特征,最后就出版数据要素在出版业生产要素体系、出版业价值体系、全媒体出版传播体系、出版治理体系及出版高质量发展五个维度的意义和价值进行探讨。有关出版数据要素尚须系统、全面、深刻地研究,如出版数据的分级分类问题、出版数据资源产品化、出版数据资产化、出版数据交易、出版数据治理等。期待学界、业界同仁躬身于出版数据要素、数据出版领域的研究,真正产生“文章成系列、著作集大成”的出版科研效应。
作者简介
张新新,男,博士,上海理工大学出版学院三级教授、博士生导师,数字文明研究院院长。研究方向:数字出版、人工智能、文化管理与服务。
游恒飞,男,上海理工大学出版学院、数字文明研究院硕士研究生。研究方向:数字出版。
参考文献
廖文峰,张新新.数字出版发展三阶段论[J].科技与出版,2015(7):87-90.
张新新.新闻出版业大数据应用的思索与展望[J].科技与出版,2016(1):4-8.
张新新,刘华东.出版+人工智能: 未来出版的新模式与新形态:以《新一代人工智能发展规划》为视角[J]. 科技与出版,2017(12):38-43.
张新新,孙瑾.要素·结构·功能:出版业高质量发展经济维度分析:基于提高出版经济活动质量的视角[J]数字出版研究,2023,2(4):47-56.
徐斌,李燕芳,杨玉梅.论生产要素与生产力要素的差别[J].生产力研究,2006(3):91-93.
于立,王建林.生产要素理论新论:兼论数据要素的共性和特性[J].经济与管理研究,2020,41(4):62-73.
蔡跃洲,马文君.数据要素对高质量发展影响与数据流动制约[J].数量经济技术经济研究,2021,38(3):64-83.
FARBOODI M,VELDKAMP L. A growth model of the data economy [J]. NBER Working Paper Series,2021,3(4):28427.
李海舰,赵丽.数据成为生产要素:特征、机制与价值形态演进[J].上海经济研究,2021(8):48-59.
张新新,周姝伶.新质生产力推动全媒体出版传播体系构建:推动出版深度融合发展的新要素新动能新路径[J].中国编辑,2024(6):11-20.
王超贤,张伟东,颜蒙.数据越多越好吗:对数据要素报酬性质的跨学科分析[J].中国工业经济,2022(7):44-64.
陈少志,张新新.出版业文化质量的提升向度与路径探析:基于编辑工作的视角[J].中国编辑,2023(7):32-38.
徐翔,厉克奥博,田晓轩.数据生产要素研究进展[J].经济学动态,2021(4):142-158.
张新新.生成式智能出版:知识生成原理、沿革与启迪[J].编辑之友,2023(11):36-44.
张新新,黄如花.生成式智能出版的应用场景、风险挑战与调治路径[J].图书情报知识,2023,40(5):77-86,27.
白永秀,李嘉雯,王泽润.数据要素:特征、作用机理与高质量发展[J].电子政务,2022(6):23-36.
张新新.全媒体传播体系视域的融合出版自主知识体系框架分析[J].编辑之友,2024(5):5-13.
陈少志,李平.新质生产力推动出版深度融合发展三维路径[J].中国出版,2024(12):21-26.
Concepts, Characteristics and Mechanisms of Publishing Data Elements
ZHANG Xinxin1,2, YOU Hengfei1,2
1. College of Publishing, University of Shanghai for Science and Technology, 200093, Shanghai, China; 2. Institute of Digital Civilization, University of Shanghai for Science and Technology, 200093, Shanghai, China
Abstract: The concepts, characteristics and functions are the basic to recognize and understand publication data elements. Publishing data elements refer to the data resources stored and processed by computers in the form of bits and put into publishing production and operation. As key production factors, publishing data elements are characterized by low cost, large-scale accessibility and wide range of uses, as well as virtualization, non-competitiveness, partial exclusivity, incremental returns to scale, and intelligent immediacy. The excavation, construction and application of publishing data elements can help enrich publishing element system and improve system quality; can help innovate new data publishing industry and improve the value system of publishing industry; can effectively open up the database of convergent publishing and strengthen the construction of all-media publishing and dissemination system; can help improve publishing governance and modernize publishing governance system; can finally realize the innovation of the production element system base and promote the high-quality development of publishing industry.
Keywords: Publishing data element; Data publishing; All-media publishing and dissemination system; Development of deep publishing integration; High-quality development of publishing