[摘要]ChatGPT的火爆问世引起了出版行业对自然语言处理技术的热切关注。文章在深入分析自然语言处理技术对学术期刊出版影响的基础上,进一步采用SWOT分析法对我国学术期刊出版的优势与劣势、面临的机遇与挑战进行剖析,提出学术期刊智能化转型发展的策略:紧抓机遇,深化体制改革和资源整合;加强技术合作,建设智能化综合出版平台;加速建立监管体系,保障智能出版健康发展;精准匹配供需,提供本土化服务模式;加强人才队伍建设,提高智能化发展竞争力。
[关键词]自然语言处理技术;ChatGPT;人工智能;学术期刊;智能出版
自然语言处理技术(Natural Language Processing,NLP)是人工智能(Artificial Intelligence,AI)的重
要技术手段之一,它基于机器学习算法对人类语言进行语言分析、理解、生成等。作为NLP技术的杰出代表,由美国OpenAI公司开发的智能聊天机器人ChatGPT(Chat Generative Pre-trained Transformer)
自2022年11月30日正式推出以来,便凭借出色的语言理解和生成能力在全球范围内引起了广泛关注和激烈讨论。随着信息时代的到来和人工智能技术的迅猛发展,国际出版行业巨头正在人工智能的赛道上积极谋篇布局,如何推动国内学术期刊出版的智能化转型并在新的赛道上实现追赶甚至超越,成为近年来出版研究的热点[1-2]。如今,ChatGPT取得了自然语言处理领域的颠覆性技术突破,作为与人类语言联系最密切的行业之一,出版业将面临怎样的变革和影响,以及我国学术期刊的智能化发展策略,成为业内人士关注的问题[3]。
文章针对NLP技术对学术期刊出版的影响展开分析,并采用SWOT分析法对我国学术期刊发展的优劣势以及外部环境的机会和挑战进行剖析,探索我国学术期刊出版的智能化发展策略,为学术出版在新技术背景下实现高质量创新发展提供参考。
一、NLP技术对学术期刊出版的影响
(一)优化学术内容生产的效率与质量
NLP技术能够识别词汇、理解语法、解释语义、推断逻辑关系等,学术期刊编辑不仅可以使用NLP技术根据论文内容生成摘要、标题和关键词,对语法、语义和篇章结构等进行多维度检查、质量评估和润色加工,为内容编校提供参考和建议,减少人工编校的工作量和错误,还可以根据不同的发行形式进行智能排版并协助处理各种常见的排版格式问题,大幅度提高学术内容生产的效率与质量,从而更多地关注学术内容价值的评估工作及创新性的出版工作。
(二)增强学术评价的科学性和有效性
随着学科分类的细化和专业领域的延伸,学术研究的专业化趋势日渐显著,不同研究方向之间壁垒分明。研究方向有偏差的审稿人提出的审稿意见可能会受到严谨性和专业性的质疑,审稿人也可能因专业偏差谢绝评审而耽误审稿周期。对此,学术期刊编辑可以采用NLP技术自动匹配科研方向吻合的审稿人,并为审稿人提供快速、优质的评审参考意见,从而增强论文评审的科学性和有效性。
(三)提高期刊传播能力和知识服务水平
学术期刊编辑可以利用NLP技术基于论文生成个性化的推送文本、宣传海报甚至视频,辅助新媒体内容创作和期刊宣传。同时,学术期刊编辑也可以利用NLP技术对学术论文进行高质量的多语种智能翻译,使非英语期刊也能达到国际传播的效果。此外,学术期刊编辑还可以利用NLP技术,根据读者历史阅读记录、阅读需求等进行个性化分析,有针对性地为读者提供文献推荐、学科前沿热点和问题解决方案等,帮助读者高效、准确地获取学术信息,随时向读者提供互动交流服务,提高期刊服务水平。
二、NLP技术背景下我国学术期刊发展SWOT
分析
NLP技术深入、广泛地嵌入学术期刊出版的各个环节已成为未来发展的重要趋势。在此背景下,对我国学术期刊发展的内外部竞争条件和竞争环境展开深入的态势分析并采取前瞻性的应对策略,是确保我国学术期刊在科技变革中实现创新发展的关键。
(一)优势
1.数据资源和基础设备
数据是人工智能应用的基础,学术期刊掌握数据资源才能占据人工智能技术的高地。我国具有科研大国的优势,丰富的科技论文资源为开展与人工智能出版相关的应用研究提供了丰富的数据和有利条件。同时,面对超大型模型所需要的庞大算力需求,国内已建立包括天津中心、广州中心、长沙中心等在内的10个国家超级计算中心以及多个人工智能计算中心,为我国人工智能自主创新发展提供了充分保障。
2.科研市场
2022年,我国研发人员总量超过600万人,连续多年保持世界第一。丰富的人才资源不仅为学术期刊智能化发展提供了可靠的人才基础,而且意味着产生庞大的学术论文发表和文献信息获取需求,这些都为我国学术出版智能化转型提供了巨大的市场潜力和广阔的发展空间。
(二)劣势
1.期刊体制问题
国内学术期刊呈现“散、小、弱”以及非市场化的特点。首先,小众、分散的期刊运营模式不利于AI数据的获取和处理。NLP等人工智能技术的进一步发展需要大量数据进行训练和迭代,而国内学术期刊之间的数据、规范等彼此独立,使人工智能对数据的获取和处理有一定的限制和难度,不利于人工智能技术在学术期刊出版中的使用。其次,发展智能出版对算力的要求很高,而我国学术期刊出版单位市场化和集约化程度相对较低,计算资源和经费支撑有限,进行学术研究和应用开发的困难较大。最后,国内部分学术期刊在运营体制、服务模式、人才队伍建设等方面的创新不足,缺乏期刊改革发展的内生动力和市场化竞争意识。这些劣势可能会加大我国学术期刊与国际一流期刊在智能化发展中的差距。
2.人才缺失
隨着人工智能技术在学术出版领域的不断深入应用,学术期刊出版单位需要一支有学术出版经验且具备人工智能信息技术素养的人才队伍,要求相关人员能够理解并利用人工智能技术实施与学术出版相关的算法应用,为学术出版流程提供技术支持。然而,国内的人工智能技术起步相对较晚,学术期刊编辑对AI技术的了解和应用较为缺乏。这可能导致他们无法全面了解AI技术的应用场景和优势,并将其有效应用于实际工作。
(三)机会
1.国家政策引导
2017年7月,国务院印发《新一代人工智能发展规划》,确定人工智能发展分三步走的战略目标;同年12月,工信部印发《促进新一代人工智能产业发展三年行动计划(2018—2020年)》,推动人工智能技术研发和产业化发展;2019年8月,科技部等六部门印发《关于促进文化和科技深度融合的指导意见》,为出版行业与人工智能的高度融合提供了良好的政策保障;同月,中国科协、中宣部、教育部、科技部联合印发《关于深化改革 培育世界一流科技期刊的意见》,明确提出我国科技期刊的发展目标是期刊综合实力进入世界第一方阵;2022年4月,中共中央宣传部印发了《关于推动出版深度融合发展的实施意见》,指出要立足扩大优质内容供给、创新内容呈现传播方式、打造重点领域内容精品……充分发挥技术对出版融合发展的支撑作用。一系列国家政策的出台表明,人工智能作为基础技术在文化出版等行业的开发应用备受重视,也从宏观层面为构建适用于中国的智能出版模式提供了良好的政策引导和社会环境。
2.市场需求驱动
随着我国科研人员数量的增加和研究水平的不断提高,研究人员需要获取更多、更全面的科研信息支持研究工作,面对海量的学术信息内容,科研成果的产出也越来越倚重文献信息资源的高效获取、传播与科学分析。NLP技术改变了文献信息资源的获取、传播与分析方式,科研人员可以从海量的学术文献数据中挖掘特定研究领域的学术信息,获得更加精准、高效和个性化的科研信息内容并加以分析整合。我国旺盛的科研市场需求为促进人工智能嵌入学术期刊发展提供了重要驱动。
3.行业技术推动
目前,我国互联网龙头企业已积极投入NLP技术的开发和应用,并取得一定进展。例如:2021年哈尔滨工业大学和科大讯飞联合研发的中文预训练语言模型BERT-wwm(whole word masking)[4]在多个中文测试集上表现优异,部分效果甚至超过了原版BERT模型,弥补了之前该研究模型在中文自然语言处理上的不足;百度公司开发的NLP项目“文心一言”(ERNIE Bot)于2023年3月面向公众开放,该模型将大数据预训练与多源知识相结合,通过持续学习不断提高模型的表现能力;华为、腾讯和阿里公司分别提出的“盘古”“混元”和“通义千问”三大NLP模型的参数规模均达到千亿甚至万亿级。国内企业在NLP领域的不断发展为AI技术在学术出版中的创新应用和深入发展提供了技术基础和保障。
(四)挑战
1.制度标准缺失
学术期刊使用NLP技术生成的内容可能存在不实、抄袭现象,由此产生的知识产权和责任风险的归属问题尚不明确,而在进行信息推送传播时,可能进一步构成对原作品人版权和传播权的侵权行为[5],因此包括《科学》《自然》等在内的部分學术期刊已明令禁止或限制其作者使用ChatGPT等NLP模型。目前,我国学术出版界还没有关于作者使用NLP等人工智能技术的明确规定或标准。可以预见的是,未来采用人工智能进行的研究或以人机结合的方式撰写的文本可能越来越常见,学术出版界应积极着手研究和制订人工智能在应用中可能引发的各种侵权和责任问题及相应的制度标准。此外,NLP模型需要的大量训练数据,不仅包括作者、读者等个人隐私,还可能涉及国家政策及基金专利等敏感信息,若数据被窃取或滥用,会对数据安全造成重大威胁。
2.科技出版竞争加剧
NLP技术作为备受关注的国际前沿技术,各个行业巨头对其正在争先筹措。例如:Springer Nature公司已利用该技术在SpringerLink平台上为用户提供文献推荐和搜索体验;Elsevier公司的Scopus数据库使用NPL技术进行文章的自动标记和分类,帮助用户更轻松地查找、筛选和评估学术文章。国外大型学术出版商在机器学习和自然语言处理技术方面的持续投入和开发应用,可能进一步扩大我国在知识传播和学术出版方面的现有差距,加剧出版行业的市场竞争及目前学术出版的不平等。
三、我国学术期刊智能化发展策略
为了贯彻落实建设世界一流学术期刊的规划要求,顺应出版行业与人工智能技术深度融合的发展趋势,根据以上SWOT分析,我国学术期刊可从以下方面高效推进智能化发展。
(一)紧抓机遇,深化体制改革和资源整合
我国现有的学术期刊体制模式在一定程度上与市场发展需求不相适应,且期刊数量多、资源散、市场化程度低、体制改革难度大[6]。人工智能为我国学术出版发展带来挑战的同时,也为其进行体制结构调整、出版资源整合、运营机制创新提供了新的契机。学术期刊要在挑战中抓机遇,在变局中开新局,将行业竞争压力转化为改革创新动力,牢牢把握好培育世界一流科技期刊、促进人工智能产业发展、推动出版深度融合发展等机会,充分发挥人工智能技术优势,创新编辑出版、学术评价、知识服务等模式。在人工智能新赛道上,学术期刊要加快落实转体改制的步伐,组建具有学术品牌影响力和综合发展实力的学术出版集团公司,依托优质学术资源或优势出版平台,通过合作办刊、平台加盟、全流程托管等多种办刊模式实现期刊集群化发展[7],改变各学术出版单位资源割裂和重复建设的状态,充分整合资源,实现互促发展。
(二)加强技术合作,建设智能化综合出版平台
学术期刊必须加强与人工智能技术企业的技术合作,通过引入第三方服务或其他技术服务商的服务产品或技术优势来解决自身人力和资金不足的问题,打造集组稿约稿、投稿审稿、内容加工、编校排版、发布传播、信息推送、知识服务于一体的综合智能学术出版平台,推动学术期刊智能化发展。例如:2022年,Springer Nature公司收购了Research Square公司,该公司的子公司AJE (美国期刊专家)可提供一流人工智能驱动的作者解决方案;2023年,该公司宣布收购创新的数字化写作辅助工具TooWrite,为研究人员提供写作引导和数字化解决方案。
(三)加速建立监管体系,保障智能出版健康发展
NLP技术给学术出版赋能的同时也带来风险与责任隐患。人工智能领域的标准化、制度化建设是AI嵌入学术出版亟待解决的问题。近年来,我国在加速建立AI监管法规方面取得一定进展:2019年5月,国内多所研究机构和高校联合发布了《人工智能北京共识》,提出人工智能研发、使用和治理方面的诸项社会意识导向性原则;2021年11月,《中华人民共和国个人信息保护法》正式实施,与《中华人民共和国网络安全法》《中华人民共和国数据安全法》一同奠定了我国人工智能监管法律体系的基础。此外,我国还要加快出台人工智能相关的法律法规,制定人工智能在出版领域的标准体系和制度规范,如专门的人工智能审核和监管机构、可区分原创与人工智能技术合成品的溯源系统,以及人工智能侵权行为责任认定等,保障我国学术期刊应用人工智能出版的健康有序发展。
(四)精准匹配供需,提供本土化服务模式
国际学术出版集团的人工智能应用,在我国科研市场可能存在不适应的问题。这是因为国外NLP技术的开发主要基于他国的语言数据库,对中文数据的训练和表达效果较弱。我国科研工作者数量庞大、专业研究范围广、对中文科研服务和学术出版的需求大,因此,学术期刊的智能化发展要从国内科研工作者需求出发,精准匹配供需,构建智能化、个性化、本土化的学术服务创新模式。学术期刊也要利用自然语言处理技术和数据挖掘技术,对国内学术资源内容进行抓取、分析和重建,并做好与国外重要期刊数据库、学术社交平台和学术搜索引擎的对接工作,竭力满足国内用户的个性化学术服务需求。
(五)加强人才队伍建设,提高智能化发展竞争力
虽然现在AI已基本胜任出版过程中校对、排版等创新性较低的工作,甚至可完成部分学术评估任务,如论文完整性审查、审稿人的选择等,但是基于已有数据的机械逻辑算法,其仍无法实现创新并对学术创新性进行前瞻性评估。因此,在科研学术的创造性发展及其评价活动中,人工智能无法完全替代人类的角色。对此,学术期刊编辑要做好知识把关人,在不断提高专业学术素养和出版业务能力的同时,也要具备较高的计算机信息素养、全媒体传播能力等。目前,人才尤其是复合型人才,仍是人工智能技术背景下学术期刊的核心竞争力。为此,学术期刊要重视对复合型编辑人才的引进和培养,创建尊重个体价值和贡献的工作环境,实行开放、积极的人才引进政策,以吸引高素质的复合型编辑人才助力学术期刊的智能化发展。同时,学术期刊也要积极制订切实可行的人才培养计划,如激励政策、畅通转型和晋升通道等,鼓励现有编辑主动提升智能化技术能力,帮助其成长为具备人工智能綜合素养的复合型编辑,从而提高我国学术期刊智能化发展的竞争力。
四、结语
NLP技术为学术期刊智能化发展提供了强大的技术支撑,同时引发了国际学术出版界的新一轮激烈竞争。我国学术期刊应采取一系列策略,包括紧抓机遇,深化体制改革和资源整合;加强技术合作,建设智能化综合出版平台;加速建立监管体系,保障智能出版健康发展;精准匹配供需,提供本土化服务模式;加强人才队伍建设,提高智能化发展竞争力,以推动我国学术期刊在人工智能技术变革中实现跨越式的新发展。
[参考文献]
[1]向飒.人工智能对学术期刊智能化转型与融合发展的赋能[J].出版广角,2022(18): 81-84.
[2]范军,陈川.人工智能在欧美学术出版领域的应用及其启示[J].河南大学学报(社会科学版),2020(01):144-149.
[3]沈锡宾,王立磊,刘红霞.人工智能生成内容时代学术期刊出版的机遇与挑战[J].数字出版研究,2023(02):27-33.
[4]CUI Yiming, CHE Wanxiang, LIU Ting, et al. Pre-Training with Whole Word Masking for Chinese BERT[J]. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2021(29): 3504-3514.
[5]邓婧,何婧.智能出版视域下学术期刊技术伦理风险与责任[J].中国编辑,2022(01):55-60.
[6]秦德继.建设世界一流科技期刊的路径研究[J].科技传播,2019(11):1-3.
[7]张维,冷怀明,王治,等.国内重点科技期刊群集约化管理和运营模式研究[J].出版发行研究,2022(12):52-57.
[基金项目]2023年度江苏高校哲学社会科学研究一般项目“学术期刊智能化转型发展策略研究” (项目编号:2023SJYB2071);扬州大学人文社会科学基金资助项目“高校综合性科技期刊与‘双一流’建设互促发展的意义和路径探讨”(项目编号:xjj2021-50);江苏省期刊协会立项课题“‘双一流’建设背景下高校科技期刊服务能力提升路径探析”(项目编号:2022JSQKB57)。
[作者简介]文采(1986—),女,贵州贵阳人,扬州大学学报编辑部编辑。