人工智能对学术出版流程的再造及知识服务提升

2018-11-28 02:33■向
中国科技期刊研究 2018年11期
关键词:学术智能化流程

■向 飒

1)郑州大学学报编辑部,河南省郑州市高新区科学大道100号 4500012)郑州大学新闻与传播学院, 河南省郑州市高新区科学大道100号 450001

“推动互联网、大数据、人工智能(Artificial Intelligence)和实体经济深度融合”已经被写入党的十九大报告中。而互联网技术、云计算技术、大数据技术和人工智能技术等所代表的新一代信息技术进一步更迭,成为数字经济发展的主要增长点和驱动力。2016年美国总统行政办公室发布了报告《为人工智能的未来做好准备》 和《美国国家人工智能研究与发展战略规划》,而2017年7月,中国国务院发布了《关于新一代人工智能发展规划的通知》。2017年以来,人工智能技术成为全球讨论的热点并呈现井喷状态。移动互联网、大数据、人工智能等所代表的互联网的发展历程,实际上是新技术与实体经济融合发展的过程。人工智能发展已经明确列入中国国家战略层面,人工智能技术包括大量数据、云计算和智能算法三大要素。现在主流的人工智能算法用的都是深度学习,而深度学习是结构化大数据驱动的人工智能方法论。也可以说,结构化的大数据中蕴含了知识,深度学习的作用就是从数据中把知识提取出来,即大数据+结构化+算法=人工智能。

就学术出版业而言,人工智能和学术出版系统的深度融合将会成为其未来发展趋势。学术出版系统包括内部生产流程维度和对外的知识服务维度,即终极目标是实现学术出版业出版流程的高效化、便捷化和智能化,提供智能化知识服务和多样化的数字产品。本研究采用综合调查法、文献分析法等对相关研究进行梳理。汤雪梅[1]认为在传媒领域,人工智能给新闻出版的生产、编辑、服务模式带来了全方位的变革,在思维与模式上创新应用,是出版产业赢取未来的保障。孙玉玲[2]指出人工智能逐渐渗透到数字出版的各个领域如产品形态、内容生产和智能连接,基于场景应用的智能连接模式、基于知识学习的个性化阅读服务模式和网络舆情分析报告智能生产模式是未来数字出版的模式。张新新等[3]论述新的出版流程将在群体智能理念的引导下得以建立和健全,提出出版的智能化升级将会推进知识计算引擎的研发和智能知识服务的提供并催化出各个行业的知识解决方案, 增强现实(Augmented Reality,AR)和虚拟实境(Virtual Reality, VR)智能出版将以智能建模作为新的突破口。王晓光[4]指出人工智能对出版内容的创作、编辑以及发行传播等环节都会产生潜在影响。武菲菲[5]探究了人工智能技术在图书出版的内容生产、编辑校对、营销发行、用户推广等环节的深度融合后的发展发向,并据此总结人工智能技术与出版行业融合应用需要解决出版人员和计算机技术人员协同工作问题。2017年5月,国际科学技术与医学出版商学会(International Association of Scientific, Technical and Medical Publishers,STM)发布《STM出版2021技术趋势》[6],该报告指出基于文本和数字挖掘技术的智能服务(包括自动化的同行评议、面向移动的优化以及论文自动检测等)、编辑流程的创新和基于用户大数据的个性化服务是未来科技出版的大趋势。

综上所述,大多数有关人工智能和出版相结合的研究主要是从统筹的视角出发,研究人工智能对未来出版模式和出版业态的改变,以及人工智能技术与出版教育、出版物生产和消费等领域的融合。这些研究没有细分涉及人工智能对学术出版系统内部出版流程的影响,以及对学术出版外部的知识服务能力提升。笔者根据学术出版的特点,研究了未来学术出版流程和知识服务与人工智能技术深度融合后的发展方向。

1 人工智能对学术出版流程和知识服务的影响

《2016—2017中国数字出版产业年度报告》指出:人工智能技术在出版发行、印刷物流、数据加工、数字阅读、数字教育等领域得以应用[7]。机器人写作、自动化的评审、语音识别录入、协同编校、智能生产印刷、用户沉浸式体验等创新应用使未来的出版流程更加智能化。随着人工智能时代的到来,科研方式发生重大转变,学术内容的生产方式和编辑出版模式都产生巨大变革,科研人员和专业人士所需求的知识服务模式也更加高效智能化。传统的出版模式已经不能满足日益增长的知识服务创新需求和学术出版发展需求,学术出版的专业性要求高,市场细分程度也高,作者和读者身份契合度更高。用户期望得到更加精准化和多元化的内容定制服务、信息推送服务以及技术服务,这种服务是更加高级智慧化的贯穿科研项目全生命周期的服务,也就是智能化知识服务。

人工智能技术也推动着学术出版系统的知识服务升级,知识服务的创新就是要满足读者、作者等从事科学研究以及向社会提供创新知识的需求。1994—2016年全球学术期刊在Sciforum开放学术平台发表文献37083088篇[8]。如何便捷快速地分享自己的研究发现并了解他人的研究成果?人工智能技术的深度参与使这种知识服务变得可能。知识服务智能化就是通过先进智能算法和强大硬件能力,实现专业和学术领域的文献内容和各种科研数据的分享,为科研用户提供学术研究或创新应用的智能化解决方案。人工智能技术深刻改变着科研人员阅读和获取信息的习惯,传统意义上的学术出版的“作者”和“用户”也被重新定义。云计算、大数据和人工智能的发力为学术出版开辟了新的业务增长点。AR与VR技术将用户带入虚拟的三维场景并使之获得全新体验。智能化的知识服务贯穿科研项目始终,为科研项目全生命周期的每一个环节提供智能化、数字化和精准化的服务。

2 人工智能与学术出版流程、知识服务的融合

人工智能技术延展大数据应用的深度和广度,通过对数据信息快速地获取、存储、管理、分析和应用实现学术出版中稿件的策划、编辑、出版、服务模式等全方位的变革。人工智能技术是通过机器学习、模式识别、数据挖掘技术及智能算法等进行数据采集、数据集分析和数据处理,实现智能感知、智能分析和智能服务,对学术出版的生产流程进行重塑,既丰富了内容产品的模态,增强了用户交互体验,提高了知识服务的能力,又降低了生产成本。人工智能下的学术出版流程和知识服务转型如图1所示。

人工智能技术加速了学术出版的流程再造,学术出版的业务流程(选题策划、编辑出版、生产印刷和营销发行)通过数据挖掘、语义分析、模式识别、机器学习等技术与方式得以再造。人工智能可协助出版商筛选热点研究方向、应对同行评审、检索内容、检测重复率、识别数据捏造;对海量数据进行较为精准的深度标引与分析,进而形成一系列知识成果,构建知识库等。因此,人工智能不仅可以加速学术传播,同时还可以减少人为偏倚,推动出版流程各个环节之间数据传递和支持,从而重构智能化的学术出版流程。笔者认为,大数据时代学术出版流程将在人工智能技术的引导下得以再造:选题策划便捷化、编辑出版自动化、生产印刷按需化、营销发行精准化以及知识服务智能化。

图1 人工智能下的学术出版流程和知识服务转型

3 学术出版系统内部的生产流程智能化再造

3.1 选题策划便捷化

通过大数据分析挖掘技术对自有数据、网站数据、平台数据和社交媒体数据进行多维度的挖掘分析,利用选题策划模型算法为出版物的选题工作提供精准的多维度决策。笔者认为,未来选题流程的便捷化主要表现在以下几个方面。(1)为学者的选题策划铺路。编辑可参与读者资料研究以及阅读趋势分析,找出最具有科研价值的热点选题,从而精准挖掘科研课题的全球学术研究热点和焦点,锁定学术研究者的研究方向、研究重点以及读者群的分布和市场。(2)识别论文抄袭和剽窃行为。为了弥补现行查重软件逐字匹配查询且无法识别同义词的缺陷,人工智能技术能够将简单的单词和短语识别,变成整句或部分段落的智能识别,从而更有效地识别学术论文内容的不端行为,打击写作剽窃行为。(3)智能发掘合适的审稿人。在过去的审稿过程中,编辑经常需要查找相关领域的多位外审专家进行审稿,这种方式耗时长、主观性强且效率较低。人工智能则能够根据论文主体内容自动提取关键审稿信息,并在海量的信息库中自主识别和锁定合适的论文审稿人。(4)完成评审工作的自动化。自动化同行评议系统可以在大数据环境下通过对学术出版单位的来稿内容进行数据分析和学术质量智能检测,自动生成反映稿件学术水平的评审报告,以评估科研成果创新性和特色性等。据弗罗斯特分析公司(Forrester)估计,2017年人工智能市场增长了3倍,人工智能技术催生了“增强型研究员”。爱思唯尔根据ScienceDirect数据库,分析出全球范围内哪些科学研究是当前的热点;根据Scopus数据库搜索热门科研领域的尖端研究者,并通过这些研究者出版热点专著[9]。而现在,爱思唯尔正在探索“人工智能神经科学”,研究用特征识别来解决复杂问题的深度学习,即创建工具来观察深度学习模型的“黑盒子”,机器学习可以解决匹配客户联系方式和地址,研究数据发展趋势的经典问题,并且可以解析个人决策是如何做出的问题[10]。

3.2 编辑出版自动化

人工智能可以通过大数据帮助编辑进行语料和素材的高效率搜集与初级加工工作,可利用图文模式识别技术、基于机器学习的勘误技术、智能联网搜索技术及数据文本挖掘处理技术等实现编辑和校对的自动化,数字化业态的内校、外校和作者校三位一体协同校对将会得到深度应用。(1)通过扫描文档对科研产出的元数据进行缺陷检测[11]。编辑在选题组稿的过程中利用人工智能技术能够快速扫描和检索文本,对论文的某些关键性信息,如实验样本大小、实验环境等缺失,进行重点检测,从而实现论文质量优劣的检验。(2)识别不恰当统计方法及公式错误。人工智能技术可以帮助编辑人员对实验数据的统计方法以及数学公式进行甄别,考察统计方法是否恰当准确以及实验结果是否可信可靠,减少数学公式编校的差错率。(3)检查论文格式和参考文献是否规范。严格遵从学术期刊规范化和标准化的要求,做到论文格式一致。参考文献标注按照国家标准查找缺漏项并自动给出建议。(4)自动生成编校结果。该结果包括编校处理结果、修改日志、错误数统计、处理建议及勘误信息等。

3.3 生产印刷按需化

智能化的生产印刷系统可以对海量知识数据进行深度标引与文本语义分析,借助可扩展标记语言(eXtensible Markup Language,XML)的语义碎片化技术,按照知识点对章节、段落、图表等进行XML的结构化排版和知识结构化标引,将已有的文献内容切分成多个知识元,实现知识的提纯、内容的关联、资料的拓展和链接,可以生成ePub、HTML、PDF等排版格式文件,动态重组成各类知识产品,生产出适用于不同阅读目的的多模态出版物。新增海量数据将转化为有效的结构型数据,完成元数据集、模型、图表及社交媒体等不同类型数据集成连接,实现对知识内容的碎片化识别和精准的知识体系构建。进而形成一系列能够横向扩展关联,纵向逐步深入的知识架构,满足各类行业出版单位的智能百科类知识库建设,完成知识数据资产内容定制与重组、自主出版等,实现内容资源的一次开发,多次使用,通过动态更新真正做到多种产品的同步上线和协同生产。并且,读者可以很方便地实现交互式索引、关联阅读和兴趣检索,最终实现自动纠错且高效率、高质量的按需印刷和按照不同出版物模态印刷。例如,英格拉姆闪电资源公司(Lightning Source Inc.,LSI)按需印刷就是通过管理自动化和机器的连续运转实现自动高效的印刷流程。LSI按需印刷的图书数据可以是一册到几十册。不同品种和印量的图书可以放在数码印刷生产线上的同一台设备上,实现连续不停的72 h高效印刷,彩色封面质量通过条形码实现自动检测,整个生产过程准确高效[12]。

3.4 营销发行精准化

通过运用客户细分模型来精准识别人群特征,识别高价值用户,辅助出版单位解决营销中的痛点,针对不同的用户群组采取不同的营销策略,并对营销效果进行智能评估。首先可以根据科学研究的热点词汇、传播频度和热度,通过分析受众阅读数据、评论数据、回复数据、转发数据,以及对科研热点的趋势预测等外部数据的深度挖掘,对选题进行智能分析。其次,结合数据库平台、门户网站、社交平台上用户行为数据(浏览足迹、订单信息和评论偏好)等,精准地洞察用户需求;出版商利用文本与数据挖掘(Text Data Mining,TDM)工具帮助学术出版企业进行量化和深入的内容挖掘,这些内容包括音频、图像、视频、文本、电子邮件等结构化和非结构化数据。最后,出版商根据用户需求开发多种数字化产品和服务。例如:英国的弗朗西斯出版集团利用技术追踪读者兴趣点,发现阅读趋势,深入研究读者从一篇文章的链接转到另一篇文章的规律、追踪读者每篇文章的阅读时间[13];德国新兴出版社Inkitt 则是利用人工智能技术使得营销流程更加精准化——演算趋势数据,判断用户使用模式,以及哪些作家及其作品和读者之间的互动流量特别大,通过收集读者偏好和意见来修改作品内容,形成作者和读者互动出版模式[14]。

4 学术出版系统对外知识服务能力提升

随着用户需求的多样化以及人工智能技术的发展,学术出版由大数据阶段进入了人工智能阶段,深刻地影响与改变着出版的生态。科研数据蕴藏着巨大的市场空间,数据将成为学术出版服务的核心单元,出版商、运营商、机构以及作者等将进一步开放其所拥有的各种数据。知识服务既然叫“服务”,就必须要跳出传统的出版概念,通过信息技术和知识经济来引导用户的需求,基于算法创新将出版流程、科研数据和知识内容深度融合,促进学术出版流程更高效的工作。目前,国内外多家学术出版公司通过精选数据内容资源并进行结构化、知识化深加工,打造多种产品形式和服务形态。例如Iris公司通过对用户输入的字段或论文摘要进行机器学习,从中提取出包含语义背景的关键词,并以此为基础帮助用户找到相关度较高的话题和资料[15]。此外,区别于谷歌学术(Google Scholar)的关键词搜索,使用人工智能技术的学术搜索引擎Semantic Scholar则可以通过评估论文内容的相关度来实现搜索结果的快速排序。因此,唯有智能化的知识服务才是开拓学术出版的新渠道、培育新用户的关键。

人工智能具有跨学科、跨语言、信息处理能力强、处理速度快、定制化能力强等优势。可以预想,未来人工智能环境下知识服务的行为、思维、场景、途径和传播将会发生改变,因此笔者认为,学术出版未来智能化知识服务的发展方向主要有以下几个方面。(1)知识服务的行为模式智能化,知识服务由传统的经验模式转化为数据驱动的强关联思维,通过学习用户数据的知识需求并进行强关联的知识点挖掘,预测用户未来的知识需求,自动为用户提供个性化推送方案。(2)知识服务的思维模式智慧化。借助部署到位的人工智能,企业与客户的互动将从直线式交易转变为多渠道和多维度的对话交流。运用仿生学、心理学、神经学等学科的知识和大数据技术进行跨领域结合,由数据驱动思维,指导人工智能的自我学习,使知识服务更加人性化。(3)知识服务的学习途径多元化。在图书馆文献资料的基础上新增加了数据库、微信公众号、社交化媒体、学术引擎、专业学术评论社区、二维码等新媒体形式。(4)知识服务的体验场景可视化。人工智能将成为出版企业的数字化代言人,AR和VR技术的运用增强了用户的虚拟仿真和可视化体验,是科技人员激发灵感和创意的孵化器,采用图像、音频、视频、动画和网页链接相互结合的场景化学习可促进想象力和科技创造力的迸发,它突破了传统的用户界面,使互动更加自然和个性化。(5)知识服务的传播模式生态化。以移动互联网和社交网络技术为基础,实现分享学习感悟、记录学习进度和激励持续学习的相互影响行为,从而达到共同进步的目的。

5 结论

在这个充满无限可能的大数据与人工智能时代,构建以数据为中心,以大数据和人工智能为手段的学术出版的选题策划便捷化、编辑出版自动化、生产印刷按需化、营销发行精准化以及知识服务智能化发展是学术出版的大势所趋。越来越便捷化的选题策划系统;自动化、数字化的智能编校系统,多终端、多形态内容生产印刷系统;满足不同用户的纸质产品、电子产品、多媒体图像、实验数据和试验流程营销系统是未来学术出版系统的基本框架,该系统的目标是实现知识服务的行为智能化、思维智慧化、场景可视化和途径多元化的传播生态。出版流程和知识服务与人工智能深度融合是学术出版未来的发展方向,是实现学术出版产业数字化转型升级的关键,也是学术出版系统从低层次传播到高层次服务的价值功能转型升级的必经之路。

猜你喜欢
学术智能化流程
智能化战争多维透视
学术是公器,不是公地
吃水果有套“清洗流程”
大型公共建筑智能化系统造价控制
如何理解“Curator”:一个由翻译引发的学术思考
对学术造假重拳出击
违反流程 致命误判
四川省高考志愿填报流程简图
基于“物联网+”的智能化站所初探
析OGSA-DAI工作流程