“出版+人工智能”:智能出版流程再造

2018-01-23 18:43刘华东马维娜张新新
出版广角 2018年1期
关键词:出版业选题智能化

刘华东?马维娜?张新新

【摘 要】群体智能理念指导下的出版流程再造,其最终目标是使出版企业拥有一套先进、完善的数字化、融合化、智能化的生产管理流程。可以说,智能化的出版流程,能够将智能选题策划、智能审校纠错、智能排版印制和智能营销推荐有机融合,以更加数字化、融合化、智能化的生产方式来推动新闻出版业的转型升级,实现新闻出版业的提质增效,它将是出版企业出版流程发展的必然方向。

【关 键 词】“出版+人工智能”;出版流程;群体智能

【作者单位】刘华东,易书科技(北京)有限公司;马维娜,北京应用物理与计算数学研究所;张新新,地质出版社。

【中图分类号】G230 【文献标识码】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2018.01.003

国务院《新一代人工智能发展规划》中提及未来人工智能的五大发展方向是大数据智能、跨媒体智能、自主智能、人机混合增强智能和群体智能。这五大发展方向均与新闻出版业有重要关联,其中,大数据智能、跨媒体智能、人机混合增强智能和群体智能与新闻出版业关联最为紧密。本文主要结合人工智能的原理,谈一下出版流程再造的若干设想和已有的部分实践。

实践表明,群体智能在数字出版相关领域已经得到了部分运用,比如基于群体编辑的维基百科、基于群体开发的开源软件、基于众问众答的知识共享、基于众智众筹的万众创新、基于众包众享的共享经济等[1]。就新闻出版业而言,智能出版将会成为其未来发展趋势,具体表现在以下两方面。对外不断提供智能化知识服务,优化完善数字产品和服务的供给;对内不断提高新闻出版业生产管理流程的高效化、融合化和智能化水平。

新闻出版业的数字化转型升级,主要包括三个方面:产品数字化转型升级、流程数字化转型升级和渠道数字化转型升级。其中,流程数字化转型升级的未来走向是智能出版流程再造,即以大数据、人工智能等技术为支撑,建立健全众智众创、协同创新的生产管理流程,提高数字内容生产、流程管控、发行传播的智能化水平,研发、应用和推广支持智能选题策划、智能审校、智能排版、智能印刷、智能发行等环节的技术工具集,研发支持战略研判、决策的智能化管理集成平台,研发面向用户提供智能化服务的集成平台,进而实现全面提升新闻出版业协同化、融合化、智能化水平的目标。

一、问题:两个流程的并行

长期以来,落后的生产方式、生产流程和管理方式,导致传统出版流程存在一系列制约、限制甚至阻碍数字出版业务发展的问题。第一,现有的出版ERP系统,绝大部分只支持传统出版流程,不支持数字出版流程。目前国内的出版ERP系统,大部分没有数字产品生产、制作和发行的解决方案,仅个别ERP系统有关于数字产品销售的相关流程。第二,传统排版软件大多属于闭源软件,开发者更多将软件视作公司的商业秘密和自有财产,不同的排版软件之间、排版软件和数字化加工制作软件之间,互相封闭、互不联通,这导致传统出版流程与数字出版流程之间的合作沟通不流畅、效率低,始终处于“肠梗阻”的状态。第三,大部分出版社的数字出版流程是将纸质内容直接转化为电子书,比如对排版文件进行数字化扫描、识别或对纸质图书进行扫描和加工,这种生产流程最大的问题是重复建设和资源浪费。第四,传统出版流程和数字出版流程“两张皮”“各自为政”状态长期存在,这不仅与新闻出版业数字化转型升级的目标背道而驰,而且严重影响了出版企业传统出版业务和新兴出版业务的协同发展和良性互动。

二、未来:智能出版流程的重塑

人工智能对出版流程的最大启迪在于,适时构建一套自动化、智能化、系统化的出版流程,以同时支撑传统出版业务和数字出版业务,做到让传统图书和数字产品的生产、制作、发行一体化、协同化和同步化。这是出版企业数字化转型升级题中应有之义,也是传统出版与新兴出版融合发展的必然要求。

1.智能策划与协同撰稿

出版企业要实现智能选题策划,必须依赖大数据技术。大数据是实现人工智能的基石,也是第三次人工智能掀起热潮的关键性因素。《新一代人工智能发展规划》对大数据智能做了精准的描述,包括大数据基础设施、智能理论、关键共性技术、智能服务平台和各个细分领域的大数据系统等。

目前,大数据概念已渗透各个层面。从政策资金扶持的层面看,文化产业资金项目2014年支持9个项目,2015年支持17个项目;贵州出版集团正在实施“国家出版业大数据应用服务重大工程”;国家新闻出版广电总局正在布局“新闻出版大数据应用重大工程”。从实践操作的层面看,企业级智能选题策划的实现,需要有一个具有超级数据规模的选题大数据系统作为支撑。随着国家级新闻出版大数据的建立和健全,经济、政治、哲学、法律、文艺、科技等各个细分领域选题数据库将能够逐步涵盖海量级的选题;出版企业可借助选题数據库,进行细分领域的选题查重、查缺补漏,降低组稿策划时的盲目性,提高针对性,进而达到辅助选题策划决策,提高选题策划含金量的预期效果。同时,新闻出版业相关领域的研发人员基于群体智能的“众智众创众筹”理念,优化运用智能蚁群算法、人工鱼群算法、烟花爆炸算法等群体智能的算法,探索研发可以实现众创撰稿、协同创作的工具系统,以达到通过众智众筹、集中专业领域智慧来提供个性化、定制化知识解决方案的目标。

2.智能审校系统

基于大数据智能、群体智能、自然语言处理等理论和技术,未来新闻出版业可研发一系列智能审校系统,以节约过程资源,提高流程效率,实现推动新闻出版业集约化、高质量发展的目标。

(1)自动纠错系统

基于海量词汇和机器学习构建自动纠错系统,能够自动发现和识别稿件中存在的问题,给读者和用户提供良好的阅读体验,同时提升图书质量。优化和完善自动纠错系统的关键在于精准识别专业细分领域的特定用语,避免将正确词汇误认为文字错误,这个技术的实现,必须依靠专业知识服务领域的大数据和海量词汇的集聚。endprint

(2)敏感词识别与排查系统

人工智能视角下的关键词识别与排查系统,要具有精准发现、准确排除敏感词的功能,以确保图书的导向正确和质量过硬。敏感词语数据库需要及时更新,要能够适应最新政策变化和时代发展需求,及时排除不合适的词汇,屏蔽新闻报道禁用词,这样方可确保系统的准确性和实用性。

(3)协同编纂系统

协同编纂系统并不是一个新词,只不过在人工智能的视角,被赋予了新内涵和新动能。未来的协同编纂系统,需要充分运用群体智能的理论和技术,进行两个方面的变革。一方面,推进机器撰稿、协同编辑和众智撰稿。比如协同编纂系统能够支持百科、科普领域的机器撰稿,也能够同时支持作者在线撰稿、编辑在线撰稿以及二者协同撰稿。另一方面,支持使用专业数字校对工具,进行数字化在线校对。比如协同编纂系统需具备内校、外校、作者校的协同校对功能,不过,这意味着现有校对模式的替换和校对方法的革新,意味着生产方式的变更和职业群体的更迭。

3.智能印制

智能印制发行系统的构建,其核心在于去库存和去产能。长久以来,我国图书出版业存在拍脑袋决定印制、同质化竞争、库存积压严重、仓储成本过高等问题,这些问题在采用传统的生产方式运营的过程中迟迟没有得到解决。

从印刷环节来看,自动化是数字化的前提,数字化是智能化的前提。在drupa2016展会上,海德堡公司提出了“Simply Smart”的口号,翻译成汉语就是“致简·智能”,其对数字化时代印刷业的智能生产提出了前瞻性的理念——“未来,印刷就像自主驾驶汽车一样简单,一键完成所有客户订单的生产”,这无疑对印刷业具有划时代的意义[2]。在中国制造2025规划中,我国印刷产业未来转型升级的方向是数字化、绿色化和智能化。其中,支撑智能化的重要环节包括耗材的绿色化、印前的数字化、设备的物联网化以及印制过程的自动化。笔者认为,要实现智能印刷,我们的认知理念、工业基础、核心技术和产业应用都还有很长一段路要走。

4.智能发行

智能发行的形态包括传统图书的智能发行和数字产品、服务的智能发行,其构成要素主要包括优化完善供给、降低退货率、统计分析、个性化推荐和精准投递推送等。从优化完善新闻出版产品供给的角度来看,能否优化图书产品结构、提高图书产品质量、多出精品力作,是当务之急。从需求侧角度看,能否掌握读者的数据信息,认知、了解并统计分析读者的阅读需求、偏好和消费能力等特征数据,进而实现精准用户画像,根据目标用户的消费需求,来确定印制规模和发行数量,是迫切需要解决的痛点。以大数据视角审视传统出版,最大的问题莫过于图书实现了销售,但无法实现对读者的精准画像,即“消费者是谁”“分布于哪些区域”“什么学历”“什么年龄段”“知识域怎么构成”“阅读的目的是什么”等,这些问题均无法回答。换言之,无法实现目标读者的数据回传,导致无法对目标读者进行精准画像,进而难以实现对目标读者的精准推送。为此,出版企业要构建自身的客户关系管理系统,包括对用户数据的采集、统计、分析和画像,以及对点赞、评论、留言等交互数据的统计分析。构架客户关系管理系统的目的是获取用户数据,进行统计分析,进而实现精准画像,最终实现纸质图书、数字产品的精准推送和精准营销。

值得关注的是,数字内容产业的智能发行展示了较强的市场潜力,并且已经在部分领域引起了资本界的关注。例如,内容智能发行商“魔窗”,它的用户包括人民日报、沪江、东方航空等,其分发的内容主要是信息资讯,分发渠道主要是腾讯企鹅号等平台,分发的支撑是基于用户画像的流量优化,实现工具是“魔窗”mLink。“魔窗”已于2017年5月获得华耀资本的A1轮融资,8月完成得厚资本A2轮融资,两轮融资合计数千万元[3]。

5.流程协同与再造

群体智能理念指导下的出版流程再造,最终目标是使出版企业拥有一套先进、完善的数字化、融合化、智能化的生产管理流程,这种生产管理流程能够同步支持纸质产品印制、数字图书上线和知识库的封装上市,从而大大提高新闻出版业的生产效率,有效避免“先纸质书,后数字化”的大量重复劳动和滞后工作。

(1)一体化

一体化是指传统出版流程与数字出版流程的一体化,该生产管理流程能够支持传统纸质图书生产管理,也能够支持数字图书、条目数据、数据库、知识库、视听库等数字产品的生产管理。目前大部分企业的现状是传统出版流程相对成熟,而数字出版流程不清晰、不完善,甚至处于缺位状态。

以智能化视角来审视流程一体化问题,未来的出版流程可能还会包括诸如AR出版物的生产、制作、加工和运营环节,包括VR出版类产品的生产、制作和销售等环节,甚至还包括承载智能内容服务机器人的资源库、交互性系统的支撑与对外运营等相关系统。

(2)协同化

2017年11月,国家新闻出版广电总局发布了《数字出版业务流程与管理规范》的行业标准。该标准的创新性在于系统构建了包括“数字出版的产品策划、资源组织、产品设计、内容审校、产品加工、产品发布、运营维护和售后服务”的业务全流程,同时对规划管理、项目管理和团队管理提出了与时俱进的建议和创新性设计构想。不足之处在于对数字出版流程与传统出版流程的衔接、协同问题没有做出回应。

流程的协同化,是指传统出版流程和新兴出版流程在人员和角色方面的协同,在内容制作、产品研发、技术应用和管理流程方面的协同。在内容制作和产品研发方面的协同,体现在以下几方面。第一,知识元库的建立和知识体系的研发,需要由传统策划编辑、数字编辑和作者队伍进行协同化研制和修订;第二,传统策划编辑需要全面了解所属出版领域的知识体系,并能够驾轻就熟地对每种图书的章节进行知识标引,以便后期进行基于同源图书的知识库和专题等数字产品的研发;第三,内部校对、外部校对和作者校对所产生的定稿,要能够协同用于传统图书产品印制和新兴数字产品的研发;第四,传统出版流程和新兴出版流程在考核办法、稿酬标准制定、利润分配等方面要建立健全协同化、统一化的机制。

(3)同步化

流程的同步化,是流程的一体化和协同化共同作用的结果,是指通过出版流程,能够同步化生产纸质图书、电子图书、数据库、专题库、视听产品、AR出版物、VR出版物等,能够实现传统产品和数字产品的同步制作、同步生产和同步上线。

从发展时间和未来趋势来看,传统纸质图书和新兴数字产品的同步上线,不是此消彼长的关系,而是相互促进、相互推动、相得益彰的此漲彼涨的关系。未来的编辑将转型为同时具备传统出版业务能力和新兴出版业务能力的现代型编辑,未来的出版是传统出版与新兴出版融合的出版,不再有传统和数字之分。

(4)智能化

同时具备一体化、协同化和同步化的出版生产管理流程,就是智能化的出版流程。智能化的出版流程,能够将智能选题策划、智能审校纠错、智能排版印制和智能营销推荐进行有机融合,以更加数字化、融合化、智能化的生产方式来推动新闻出版业的转型升级,实现新闻出版业的提质增效,它是出版企业出版流程发展的必然方向。

|参考文献|

[1]李未,吴文峻. 群体智能:新一代人工智能的重要方向[EB/OL]. (2017-08-03)[2017-11-21]. http://stdaily.com/index/kejixinwen/2017-08/03/content_564559.shtml.

[2]来海德堡,看懂未来的智能印刷工厂[EB/OL].(2017-05-12)[2017-12-20]. http://www.keyin.cn/news/cpjs/201705/12-1104472.shtml.

[3]内容智能发行商魔窗获数千万元A轮系列融资[EB/OL].(2017-11-13)[2017-12-21]. http://biz.jrj.com.cn/2017/11/13163523375707.shtml.endprint

猜你喜欢
出版业选题智能化
智能化战争多维透视
以按需出版为抓手,推动出版业数字化转型
印刷智能化,下一站……
基于“物联网+”的智能化站所初探
AR与VR技术在儿童出版业中的应用
对出版业供给侧改革的思考
南宋出版业考述