人工智能与出版融合发展:内在机理、现实问题与路径选择

2019-01-28 12:46张海生吴朝平
中国科技期刊研究 2019年3期
关键词:人工智能融合资源

■张海生 吴朝平

1)重庆文理学院教育创新研究院,重庆市永川区红河大道319号 4021602)重庆文理学院期刊编辑部,重庆市永川区红河大道319号 402160

随着“大数据”“互联网+”等技术的兴起,沉寂多年的人工智能又迎来了新的春天。此次研发热潮中,人工智能走出实验室,开始与产业紧密结合,目前已在汽车、医疗卫生、教育等领域得到了应用。作为文化事业重要组成部分的出版业,也应主动迎接人工智能,通过高智能性的新兴技术不断创新出版形式,加快媒体融合进程。从出版与技术的关系来看,技术的智能性与出版的科学性高度相关,每一次技术的创新与颠覆都对出版的内容生产、传播和应用带来全新的变革,推动着出版走向民主、科学。人工智能是一种新兴科技,其依托的技术具有高智能性,能够将学术信息更加及时、高效地精准传播[1]。出版智能化是传统出版与新型出版融合的主要方向,因此探讨人工智能与出版的融合发展对出版业的未来至关重要,也十分紧迫。

近年来,国内一些学者纷纷开展人工智能与出版融合发展的相关研究。学者们普遍认为,学术和专业出版与人工智能技术结合具有先天优势[2],人工智能不仅可以加速学术传播,还可以大幅提升学术出版的知识服务能力[3]。“出版+人工智能”是未来出版的新模式和新形态,应积极运用人工智能再造智能化出版流程[4]。目前,人工智能技术在出版领域的应用(包括教育出版、专业出版和大众出版等[5]),也对出版行业从业者的知识结构和能力提出了新的挑战[6]。因此,必须再造出版生态系统,转变传统出版思维[7],由以经验为核心转向以算法为核心,实现人工智能驱动的出版模式创新[8]。推进人工智能与出版的深度融合发展,不仅要理解人工智能与出版融合发展的内在机理,还需明确影响人工智能发展的关键要素以及实现智能出版存在的问题,以此展望智能出版的发展方向。

1 人工智能与出版融合发展的内在机理

当前,人工智能发展的核心是深度学习,而深度学习主要涉及技术、数据和算法(软件)3个关键要素。其中,技术是人工智能的物质基础,主要指芯片技术、网络技术、神经网络技术;数据是人工智能的能源和养料,智能的实现需要海量数据;算法(软件)是人工智能的灵魂,即通过计算机的搜索和计算对海量数据进行快速处理[9]。

所谓人工智能与出版融合发展,就是出版业在人工智能时代应对新一轮科技革命、产业革命以及新媒体技术的战略设想与选择,旨在通过技术智能性的提升,推动出版的科学化发展,为我国出版业的发展以及新旧媒体的融合发展注入新动能。具体而言,人工智能发展的关键要素对传统出版业产生巨大影响——通过技术、数据和算法的重组,推动出版走向智能化,主要表现为出版技术的智能化、出版资源的数据化和出版供给的科学化(出版资源的有效供给和个性推送)。对照人工智能发展的3个关键要素,人工智能与出版融合发展的关键要素也有3个:人工智能技术(技术)、出版资源和内容生产(数据)、有效供给和个性化服务(算法或软件)。其中,人工智能技术是人工智能与出版融合发展的物质基础,主要包括大数据、云计算、虚拟现实(Virtual Reality,VR)技术等,利用这些新兴技术来辅助出版,再造出版流程,推进出版智能化,从而研发个性化的智能出版产品和服务;出版资源和内容生产是人工智能与出版融合发展的内容基础,主要由学术期刊、出版社和学者等构成的学术共同体提供;有效供给和个性化服务是人工智能与出版融合发展的目标,强调出版需求侧与供给侧的无缝对接,注重个性化出版和服务。

与传统出版(出版什么,用户接受什么)不同,人工智能与出版融合发展更加强调基于技术、数据、算法的有效出版和个性出版。如此,技术、数据和算法就构成了人工智能与出版融合发展的内在机理。

1.1 基于技术的创新驱动

随着物联网以及各种新兴科技的不断涌现,以技术创新与颠覆为核心驱动力的时代正在到来。技术的创新性和智能性为未来出版产业的发展提供了新动能,如人工智能在提高信息服务的效率与质量、增强用户的信息认知与感官体验方面确实有着绝对的优势[10],能够推动出版资源的多级生产、出版内容的多媒体(智能化)呈现、出版信息的个性化推送和传播效果的可视化等,其必然能成为出版产业发展的强劲引擎。因此,在未来媒体走向智能化的大势下,必须坚持以技术驱动融媒体内容创新[11-12],摒弃“出版什么,用户看什么”的传统思维,以用户思维重构出版新业态和新模式,瞄准技术最前沿,以人工智能技术推动新旧媒体融合,加快传统出版向智能化转型发展。

1.2 基于数据的出版资源内容生产

出版智能化的实现需要整合和融通各种类型的数据,包括传统出版资源的数据化、现代出版资源的数据化以及各出版单位和部门之间的数据联通与共享。随着“互联网+”,尤其是移动互联网信息技术的快速发展,我们所处的世界逐渐被数据化——一方面是传统出版资源、内容的再数字化和网络化;另一方面是现代出版资源、内容的多级生产和智能传播。事实上,智能出版的数据不应局限于出版业的资源和内容,还应涵盖出版业以外的资源,即应包括自人类产生至今所有的物质文明、精神文明资料和素材。如此,才能为智能出版提供各种各样的数据支持,打破数据垄断和数据鸿沟,真正实现出版资源内容生产的数据化,促使人类走向“大物移云智”的万物互联时代。

1.3 基于算法的有效供给和个性服务

人工智能与出版深度融合的目的在于实现出版的智能化和服务的个性化。如何才能实现出版服务的个性化?人工智能算法在其中发挥着至关重要的作用。根据“算法”“云计算”等新兴技术的操作原理和程序,对海量数据化的出版资源和内容进行统计分析,并结合用户的身份信息、使用场景和行为规律,提高出版资源的服务质量和效率,提升用户体验,增强用户黏度。事实上,人工智能算法的优势主要体现在传感器技术优化了学术信息的采集,智能机器人提高了学术信息的编辑制作效率,人工智能算法推送的内容更符合用户口味等方面。同时,融合了人工智能、大数据的出版业和传媒业不仅集采、编、排、发流程于一体,还会增加一个环节——反馈[13],促使出版向基于智能反馈的个性化发展模式转变。此外,随着新媒体、人工智能和智能终端(设备)的普及与应用,个性化定制服务的时代即将来临[14]。

2 人工智能与出版融合发展的现实问题

人工智能技术的局限性所导致的人工智能与出版深度融合发展的现实困境,集中体现在硬件、数据、算法和专业人才4个方面。

2.1 技术:智能性程度不高

人工智能技术本身存在的技术缺陷集中体现在以下两个方面。

(1)人工智能并不智慧。自从有了计算机,就有了人工智能。但就目前的人工智能而言,其智慧水平并未达到理想状态,与人类的智慧仍然相差甚远。作为技术创新成果,人工智能本质上是对人体机能的模仿与增强,即让机器和工具去完成繁重的体力劳动,以获得人类体力的解放。可见,人工智能解放的仅是人类的体力劳动,对于相对高级的人类智力活动而言,人工智能远逊于人类智能。用管理大师德鲁克的话来说:人工智能是“正确地做事”,而人类智能是“做正确的事”。人工智能技术尽管会在越来越多的可程序化领域成功应用,并产生巨大的经济、社会效益,但在人类高级别心智和认知方面仍然难以实现根本的突破。即人工智能(机器智能化)的发展和应用不会弱化人类的主体地位,反而更突显人类的主体地位[15]。因此,在人工智能并不智慧的现实条件下,智能出版也只是在某些方面具有智能性,要想全面提高出版的科学性程度,首先要解决的是人工智能与出版融合发展的技术成熟度问题。

(2)强人工智能时代前路漫漫。人工智能分为弱人工智能和强人工智能。弱人工智能集中表现为以深度学习为基础的弱人工智能技术在图像识别、机器翻译、自然语言处理、语音识别等方面的广泛应用[16];强人工智能则指的是超越工具型智能可实现第一人称主体世界内容的涌现,包括意向性、命题态度,乃至自由意志的发生。但是在人类意识问题没有得到解决之前,强人工智能的实现还有很长的路要走。当前,无论是在紧迫性上还是在终极可能性上,弱人工智能所呈现的各种渐进性问题均属于常规性问题[17],强人工智能时代依然离我们很遥远。可见,人工智能与出版行业的融合发展实际上刚刚开始。

2.2 数据:出版资源内容生产的数据化进程缓慢

信息是人类发展的重要载体,人类一切的传播内容都以信息的方式存在。随着互联网通信技术的发展,数字化、网络化和碎片化成为信息资源存储和获取的新趋向。由此,数据成为信息的代名词,即通过数据对信息进行客观记录,并加以数字化处理,从而不断将信息量化成数据集,形成大数据[18]。但在现实中,出版资源内容生产的数据化进程却不尽如人意。

2.2.1 传统出版资源的数据化进程缓慢

内容是传统出版业最大的资产,但放置到人工智能和大数据时代,就变为一堆默默无闻的存在。因为在人工智能时代,数据居于核心地位,谁拥有数据,谁就占领了制高点。事实上,早在2004年,谷歌就启动了数字图书馆计划,准备用扫描的方式将全世界1.2亿种图书转化成数字化资源。但这个计划很快就被移动互联网的快速发展所淘汰,因为在移动互联网时代,出版资源的数字化仅是第一步,更为关键的是要对数字化资源进行数据化处理,如此才能满足用户的碎片化和个性化需求。

在拉丁语中,Data的意思是“已知”和“现实”。所以,一切皆可数据化,一切皆可看成是数据的存在。在传统出版时代,出版成果是默默无闻的;在智能化时代,可以通过技术将传统出版成果进行再数据化,使之神通广大起来。实际上,我国出版业也对传统出版资源的数据化进行了尝试。例如,中版集团正形成多种专业数据库,如古籍、辞书、翻译、百科学术文化、音乐、美术、法律等专业数据库,目前已拥有20多万种资源;中华书局经过3年的开发,上线的古籍有1200余种,字数多达10亿[19]。但这些数据化内容仅是传统出版资源的冰山一角,且进程缓慢。此外,由于众多出版资源的不可公开性,出版资源的数据化普遍存在数据垄断和数据孤岛现象,传统出版资源的数据化进程依然任重道远。

2.2.2 现代出版资源的数据化进程缓慢

2017年,越来越多的出版巨头、创业公司和学术机构看到了学术出版数据化与智能化转型的趋势,都在积极布局,抢占先发优势[20]。但现代出版运用人工智能技术的意识依然相对淡薄,更多的是在观望、摇摆,尽管部分出版单位已经意识到人工智能出版和大数据出版的未来趋势,并进行了相应的尝试和努力,取得了一些成绩,但总体来看,敢于尝试的出版单位占比并不高,出版行业对智能出版发展浪潮的到来并没有做好充分准备。事实上,应对智能出版必须高度重视两个因素:人(编辑)与数据。此外,出版行业能快速适应大数据的潜在影响还取决于行业内各个部门(包括出版商、生产商、分销商、印刷商、出版代理商、书店、宣传部门、市场部门等)能准确感知大数据与本部门的关联性[21],但现实情况是,各利益主体“单兵作战”是常态,鲜有相互合作、协调发展的成功案例。

2.3 算法:出版资源的有效供给和个性化服务能力不足

改革开放40年来,我国的出版物虽然品种丰富、数量较多,出版能力和水平逐渐接近世界前沿,但出版质量和效用依旧存在问题,如出版内容的前瞻性、认知性、创新性不足,出版的一般化产品居多,精品稀少,精准服务欠缺[22],具体表现为出版资源的结构性问题与创新性问题,以及行业性数据缺陷。(1)出版资源的结构性问题。一是出版资源结构不合理,如在全国600余家出版机构中,约有90%的出版社涉足教材教辅出版领域[23]。二是出版供给侧与需求侧失衡,集中表现为出版选题同质化倾向严重。三是出版机构之间竞争激烈,甚至恶性竞争[23]。(2)出版资源的创新性问题。一是数字呈现形式单一,缺乏交互创新设计。许多书刊的数字化转型仅是将书刊的文字内容进行简单数字呈现[24],出版内容的多级开发和深度挖掘不足,未能实现声、视、文、图、动画等媒体格式的统一。二是出版资源的创新性不足,尤其是原创出版能力有待提高[25]。三是内容扩充困难,出版周期较长,数据出版迟滞。(3)行业性数据缺陷。一是行业性用户行为数据缺失。至今为止,我国尚未建立全国出版物流通平台、全国同类选题出版物归类分析平台等参考平台。二是行业性技术创新数据缺失。例如,对于新型数字出版技术的探索与实践缺乏全面的跟进和记录,而如何避免出版单位的重复投入、重复研发,实现行业性的技术共享,需要行业性的技术创新数据系统作为支撑[26]。正是出版资源存在的结构性、创新性和数据缺陷问题,导致出版资源的有效供给不足,无效供给冗余。再加上传统出版的单向传播方式(一对一、一对多)依然占据主导地位,忽略了用户的需求差异,用户思维淡薄,个性化服务意识和能力均有待提升。而造成出版资源有效供给和个性化服务能力不足的根本原因在于:出版资源数据垄断和数据孤岛现象的普遍存在,以及行业各主体进行出版资源数据共享与联动的意识不足。

2.4 人才:人工智能出版专业人才匮乏

人工智能得以发展和进步的关键条件是人才,尤其是人工智能高端人才。但现实情况却是全球人工智能人才分布极不均衡,人工智能高端人才出现全球性短缺危机。据统计,全球约有30万人工智能人才,大多集中于美国高校和企业,全球领军人才更是不足千名。在这30万人当中,学术及储备人才约占1/3,分散于全球367所高校中;产业人才约占2/3,集中分布于各国人工智能产业公司和科技巨头中[27]。反观我国人工智能人才的培养状况,最早培养人工智能人才的高校是北京大学。自2003年起,北京大学已经培养了智能科学方向本科生500多名、研究生上千名,但进入传统出版业领域的人工智能人才少之又少。有关报告显示,我国人工智能的人才缺口超过500万人[28]。如此,就形成了出版领域智能人才供需的严重失衡,人才培养成为当下亟待解决的问题。遗憾的是,中国人工智能教育还存在顶尖人才鸿沟、师资力量薄弱、教育体系不足3个主要问题[29]。因此,人工智能出版专业人才的匮乏,在很大程度上阻碍着人工智能与出版的深度融合发展。

3 人工智能与出版融合发展的路径选择

3.1 技术层面:加强人工智能与出版融合发展的技术研究

弱人工智能阶段,技术的成熟度和可靠性均有待加强。在人工智能技术尚不成熟的现实情境下,政府应加大对人工智能技术与出版融合发展的资金投入力度,加快破解人工智能与出版融合发展的限制性技术屏障;出版机构应主动探索人工智能技术驱动下的出版生态系统重构,加强与人工智能企业的交流与合作,探索适宜于自身发展的融合模式;出版单位之间应加强智能出版信息、技术、数据的共享与互联,做到互通有无,走集约化出版之路[30];出版部门之间应打破以往“单兵作战”的模式,走向合作;出版从业人员应主动转变传统出版思维,积极拥抱人工智能技术,不断在实践中应用人工智能技术。总之,人工智能技术与出版的深度融合发展需要政府、出版机构、出版部门、出版从业人员等相关利益主体的通力合作,协调推进。

3.2 数据层面:加快人工智能与出版融合发展所需的数据内容生产

数据尤其是知识数据,在人工智能与出版融合发展过程中起着举足轻重的作用。因此,必须重视出版资源的数据内容生产。做好内容是出版机构(单位)永恒的追求[31],出版机构(单位)应以出版资源的数据生产为依托,推进行业供给侧结构性改革。在此过程中,既要汇集生产出版数据和经营数据,又要汇集从内容资源核心层到形式外围层(包括产品、市场、用户)的数据,以及行业层级的元数据、知识数据和出版发行数据等[32]。

随着移动互联网信息技术的发展,人们的学习方式和阅读习惯在不断改变。而人工智能的发展尽管能够更加精准地为人们提供和推送学术信息,但原创、核心、高端的阅读内容依然是基础——这些数据内容的生产是人工智能所不能完成的,因为内容越专业、越精深的领域,只能由人的智能和智慧来完成。因此,在人工智能时代,出版机构应意识到人工智能只是进行出版生态重构的一种技术手段,其功能在于促使出版流程更加智能、便捷、高效,出版形式更加精美、完备,传播范围更加精准、有针对性,仅提供技术支持和服务,不支持基础内容生产。只有将知识转化成用户或读者需要的产品才是根本,而在这个转化的过程中,用户或读者的个人数据能够提供相关的决策建议。

此外,从数据的价值看,传统出版将每一本书作为一个数据单元进行销售的方式,实际上是数据资源的极大浪费。因为每本图书尤其是学术专著,一般约二三十万字,完全可以将其内容进行深入挖掘和多级开发,拆分为几十个甚至上百个数据单元,如此不仅能够大大提升这本图书的整体价值,而且能够满足移动互联网时代用户碎片化获取知识和信息的个性化需求。此外,出版机构还应重视用户数据和交互数据的搜集与分析,实现出版数据信息的共享、标准的统一和端口的兼容,以开放的姿态、包容的心态,加强出版单位数据的共商、共建、共享和共赢[32]。基于此,人工智能与出版的深度融合发展必须构筑一个以知识体系为基础,以知识计算和知识服务技术为关键的跨学科、跨领域、跨媒体的新闻出版业超级大数据[33]。

3.3 算法层面:创新人工智能与出版融合发展的有效供给方式

人工智能在很大程度上能够实现出版的有效供给和个性化服务,因此创新人工智能与出版融合发展的有效供给方式至关重要。笔者认为,除要在宏观上调整出版资源结构、优化选题设计外,还要不断增强出版资源的原创性、专业性和权威性,多出精品,实现出版社会效益和经济效益的统一。具体而言,就是要坚持以技术驱动创新出版内容呈现的交互模式,以数据单元形式、集约化交互平台实现与用户线上线下的即时交流与互动。其中,数据单元的内容呈现方式应多元化——既可以是文字,也可以是图片、声音、动画、视频,甚至还可以做成VR,使读者获取数据单元的途径多样化,增强用户对数据单元的黏性;集约化的交互平台既可以是出版单位自建的媒体生态,也可以充分利用成熟、集成、权威的第三方平台,但当下最有效的方式是自建媒体生态与第三方平台的有机结合,以此拓展宣传平台,扩大宣传范围,提高宣传效果。

此外,实现出版的有效供给还需要加强行业性数据的搜集、分析和整理。如上文所述,行业性数据包括行业性用户数据和行业性技术创新数据。行业性用户数据的搜集需要政府、第三方组织、出版单位的通力合作。即政府要加大对行业性数据平台的建设投入;第三方组织可以作为搜集、检测、分析和反馈行业性数据的机构,如中国编辑学会、中国出版协会等;出版单位应充分利用自身的媒体生态,通过软件和算法对自身用户信息进行搜集,建立用户数据资源库,为出版资源的内容生产和数据单元的定点推送、个性化服务提供数据支持。行业性技术创新数据的搜集需要政府发挥积极的作用,适时建立与之相关的数据采集、检测和反馈平台,为出版单位的选题策划、技术应用、实践探索提供技术支持与服务。

3.4 人才层面:建立支持人工智能与出版融合发展的人才培养体系

《新一代人工智能发展规划》明确提出要“加快培养聚集人工智能高端人才”。但人才培养周期长,具有一定的迟滞性。就现阶段而言,推进人工智能与出版深度融合发展,需要坚持培养和引进相结合,不断完善人工智能教育体系。对于出版业而言,加强人工智能出版人才培养似乎比引进人才更有现实意义。(1)鼓励高校拓宽人工智能、新闻出版等相关专业的教育内容,形成“人工智能+出版”复合专业培养模式。各大高校应凭借其在人工智能领域的研究基础和师资团队的天然优势,主动布局与人工智能相关的专业,加强人工智能与出版、新闻、计算机等学科专业的交叉融合,重构出版专业人才培养目标、培养方案、课程设置、评价标准等,以培养能够应用人工智能理论、方法、技术进行出版产品开发与应用的复合型人才。(2)加强产学研合作。目前,许多人工智能领域的高端人才均被科技巨头企业所延揽,因此高校应加强与企业等机构合作育人的意识,邀请企业高管和核心技术骨干人员共同参与人才培养计划的制定、课程的开发,通过产学研相结合的方式,推进人工智能与出版的深度融合。(3)逐步构建人工智能出版本硕博人才培养梯队,推动人工智能领域一级学科建设,增设人工智能出版方向的硕博士培养点。

此外,还要加强传统出版从业人员的人工智能技术运用意识和能力的培养。人工智能与出版的融合发展,在很大程度上能减轻编辑人员的重复作业负担,让编辑有更多的精力和时间来完成更具创造性的工作。可见,人工智能和人力在产业融合中的协同发展需要两者互相补充、分工合作,但这无疑对传统出版人员的知识结构和能力提出了新的挑战,主要有以下4点:(1)人机协同处理稿件需要全面的综合素质,如逻辑能力、判断能力、思辨能力和审美能力;(2)需要广泛的知识结构体系,如编辑学、新闻学、出版学、传播学等;(3)需要智能化的专业知识和能力,如人工智能的工作思维和使用技能等;(4)需要一定的创造性思维和创新能力[34]。

4 结语

在人工智能时代,每一个用户都是学术信息的生产者、传播者和消费者,而不同用户的阅读习惯、行为偏好、使用场景和身份信息构成了用户独有的数据库,这对传统出版业尤其是科技期刊提出了新的挑战——满足用户需求成为人工智能时代科技期刊信息传播的逻辑起点[35]。而依托人工智能的各种智能技术和算法具有以下功能:(1)整合各种类型的出版资源,包括图书资源、期刊资源、专家资源、用户资源和媒体资源等,构建多维度、全方面、多格局的内容生产平台和信息共享平台,实现不同用户之间的数据共享;(2)有效匹配用户所需的各种信息,为用户提供更加精准、有效的知识服务,即通过对用户数据的分析,明确用户关注的领域和重要议题,从而实现个性化定制服务和精准化信息推送;(3)根据用户信息的深度挖掘以及用户的信息反馈,反推出版主体的行为选择,包括出版资源的内容生产、信息传播以及数据的建设与共享等。实践证明,人工智能在推动出版资源的数字化处理、数字内容智能化和知识化组织方面具有强大的生命力,能有效提升科技期刊对信息内容的传播和运营能力[36]。因此,出版单位尤其是科技期刊出版单位应当主动迎接人工智能技术,积极运用人工智能技术和算法辅助出版模式创新,通过协同各出版机构共建、共享出版资源数据库,以技术的高智能性提高出版的科学性,推动新旧媒体向智能化方向融合发展。

猜你喜欢
人工智能融合资源
基础教育资源展示
村企党建联建融合共赢
融合菜
从创新出发,与高考数列相遇、融合
《融合》
一样的资源,不一样的收获
2019:人工智能
资源回收
人工智能与就业
数读人工智能