人工智能生成内容时代学术期刊出版的机遇与挑战

2023-04-29 00:44:03沈锡宾王立磊刘红霞
数字出版研究 2023年2期
关键词:机遇学术期刊挑战

沈锡宾 王立磊 刘红霞

摘 要:近年来,人工智能(AI)技术的飞速发展使得AI生成内容(AIGC)技术得到了极大的提升,其中最为著名的是OpenAI研发的ChatGPT模型。ChatGPT模型在智能问答、分类、摘要、翻译、综述等的成功应用,引发了学术期刊界的广泛热议,给我们带来了机遇和挑战:一方面,AI使学术论文在写作、编辑、生产、出版、传播、知识服务方面受益匪浅;另一方面,学界也面临着AI应用伴生的困惑,诸如作者贡献、论文造假、论文抄袭、版权保护和隐私保护等方面的问题。对此,笔者认为,学术期刊出版行业需要保持乐观态度,迎接AIGC时代的到来,深入探究AIGC技术的优势和局限性,成为AIGC技术的主宰者,加强对AIGC技术的监督和管理,建立相应的规范和标准,确保AI在学术期刊出版中的合法合规使用;并结合自身实际情况制订出个性化应用方案,以利用其优势,提高论文的质量和可读性,扩大论文的传播力,提升知识服务的广度和深度的同时注意避免其局限性和可能带来的问题。

关键词:人工智能;人工智能生成内容;学术期刊;机遇;挑战;ChatGPT

DOl: 10.3969/j.issn.2097-1869.2023.02.005

2017年,国务院发布《新一代人工智能发展规划》[1],该规划指明了人工智能(AI)在学术期刊发展中的应用方向,表明了深度融合AI是期刊发展的趋势。2018年,STM发布《科技出版的技术趋势2022》[2],该报告的主题为“Entering the AI Era Creative Humans & Smart Machines”(进入AI时代 创意人类&智能机器),恰在2022年底,OpenAI的大型语言生成模型 ChatGPT上线后火爆网络,它拥有流畅对话、编写代码、阅读文献、撰写报告等能力[3-4],将人机对话推向新的高度,深刻地影响了我们的生活和工作。近期,全球各大科技企业都在积极拥抱 AIGC,不断推出相关的技术、平台和应用[5]。这印证了STM 2018年的预测,同时也宣告学术期刊出版进入了一个新的时代——人工智能生成内容(AI-Generated Content,AIGC)时代。

AI作为一项极具前瞻性的技术,经过多年的发展创新,已经广泛应用于计算机、制造、交通、医疗、教育、安防等多个领域,也包括学术出版领域[6]。在全新的AIGC时代,AI广泛地、大规模地参与到学术期刊出版的方方面面已经成为不可逆转的发展趋势[7],对AI的利弊有更全面的认识和更充分的理解,也成为每一位出版行业同仁的“必修课”,只有掌握AIGC发展的客观规律,才能够制定相应的规范和措施,充分利用其优势,规避其弊端和风险,以促进学术期刊事业蓬勃健康发展。

1 AIGC技术为学术期刊带来机遇

AIGC技术已经渗透到学术期刊从内容生产到传播的各个阶段,可充分利用其能力发挥其优势。AI可以作为工作助手,辅助完成部分工作,提高工作人员的工作效率和工作质量;代替大量的枯燥的重复性劳动,从而解放编辑人员,使其将精力投入到创造性的工作当中;可以成为工作流程的一部分,与人共同完成复杂的工作,协同优化工作流程。以下是笔者整理的当前AI应用于科技期刊产业的主要场景。

1.1 科研实践阶段

学术知识图谱(Knowledge Graph, KG):AI可以将海量的学术文献进行知识图谱化,利用图神经网络、自然语言处理等方式,对KG进行深度挖掘和分析,实现知识的检索、推荐、发现和融合,有效地帮助研究者更好地理解学术领域的知识结构,从而提高其对于专业领域的发现和理解能力。

科研协作平台:AI可以基于云计算和大数据技术,提供一站式的科研协作平台,让不同领域的研究者轻松合作、共享资源,提高科研效率和质量。科研中会产生大量文本数据、图像数据、文图多模态等各类数据,利用深度学习技术可以对各类数据进行处理、解析与理解。据报道,AI可以为科研平台带来效率革命、模型强化、资源复用等特点,使工作效率提升约500倍[8]。

1.2 论文写作阶段

AI可以提供各种优秀的服务,让写作过程更加高效和智能化。除了大家熟知的自动摘要、关键词提取、文献综述、语言润色、英文检测和翻译等服务外,还有以下两个方面:

选题策划:通过学习用户的各种行为记录和科研属性,为用户形成画像及定位,为其进行各种个性化智能推荐,如感兴趣的期刊及论文,相匹配的研究领域和方向,合适的合作者/机构等,这些都可以辅助研究者提高论文写作的效率和质量。

AI作画(自动海报、视频生成):AI可以制作海报、视频来展示研究成果,通过自然语言理解学习论文内容和相关数据后,自动创作生成对应内容的海报甚至宣传视频,提高科研成果的展示效果和传播效率。

1.3 投稿和评审阶段

AI已经开始在科研论文的投稿和评审阶段[3]发挥了重要作用,辅助完成了许多重要的工作,如投稿智能推荐、研究完整性检查、同行评议推荐、作者与单位消歧、稿件自动提交与跟踪、原创性检查等多种工作。

1.4 生产阶段

自动结构化和预处理:借助eXtyles这样的自动化工具,可以帮助学术期刊完成文本排版和格式化,转换成标准的XML文档。AI可以协助自动处理各种常见的出版格式问题,例如作者与作者单位对应关系、文中与文后参考文献对应关系、文中和图表的对应关系,以及批量处理冗余符号和非标准标点字符等。

术语纠错、内容审查检测:自动检查、修正语法和拼写错误,特别是对专业术语进行纠错和翻译,辅助检查文章的语言、逻辑和文本结构,提高文章的可读性和条理性;辅助检测文章中可能存在的敏感词汇,以规避意识形态问题和伦理道德风险。

内容优化及增强:根据作者的意图和特定目标受众,对文章进行语言润色和文本优化,提高文章的可读性和吸引力;通过图像处理技术,检测和改善图片的分辨率和质量,提高论文中图片的清晰度和美观度等。

1.5 出版阶段

在出版环节中,AI的应用也是非常广泛的。将PDF文件、语音文件转换为可编辑文本格式,便于后期编辑和网络出版;自动提取元数据信息,进行分类和归一化,方便读者检索查找;对稿件数据进行分析和理解,帮助编辑发现潜在联系和规律,提高出版物质量和价值;对出版物内容进行分析,提取实体和关系,构建知识三元组,为未来的知识管理、推演、融合提供支持。

1.6 发现和传播阶段

AI在论文的发现与传播方面的应用包括个性化搜索与推荐、基于知识的搜索、自然语言问答、搜索引擎优化(SEO)、用户画像、个性化内容显示等服务。

搜索服务:首先,可通过对用户的历史搜索记录、阅读记录和行为数据等进行分析和挖掘,实现更加精准的搜索和推荐服务;其次,可实现知识搜索,更加准确地理解用户的查询意图,并且给出更加全面、精确的搜索结果;再者,自然语言技术可以将用户口语化的表达转化为机器可理解的语言形式,再通过自动推理和知识库的支持,为用户提供准确、快速、便捷的搜索服务,提升用户搜索的满意度和体验感[9]。最后,通过AI技术可以实现多种媒体内容的检索,包括图片、音频、视频数据。

SEO:通过分析和理解用户行为和兴趣,系统可以自动化地优化相关内容和排版,从而使得论文更容易被搜索引擎收录和排名,提高其曝光率和传播度。Atypon近些年推出了一些服务,例如一句话摘要、自动标题生成、非专业版本摘要,这些服务可以提升论文的可读性和可发现性,加快学术内容的传播。

全文翻译:笔者测试ChatGPT的翻译功能已经达到了相当高的水准,相比谷歌翻译更为出色,而且其翻译不受语种局限,可以实现多种语言的切换翻译。此项能力,对于非英文学术期刊的传播是重大利好,若在传播平台中植入机器翻译功能,可实现语言的无缝切换,达到全球传播的目标。

1.7 知识服务阶段

在数字化时代,知识服务已经成为一种重要的商业模式和服务方式,是融合出版转型的最高形态。在知识服务的过程中,运用AI、大数据等技术,对大量数据分析和学习,分析和挖掘出与用户需求相关的信息和知识,为用户提供更加精准、高效的解决方案和支持服务。

笔者团队对ChatGPT在医疗领域知识服务能力的测试结果显示[10],ChatGPT具备基本医学常识和多轮对话的能力,相当优秀的病例阅读、理解和纠错的能力,也具备了医学知识的推理能力,能够从现有的医学知识中发现新的规律和关联,从而提供更准确、更全面的医学建议。此外,ChatGPT具备信息抽取和术语标准化的能力,能够快速准确地提取和归纳医学知识,并将其整合到一个标准化的术语体系中。

在融合出版视域下,业界热衷于讨论专业知识库的建设,一些出版机构投入了大量的人力、物力和精力,在自身学术资源之上创建KG,以此向用户提供知识服务能力,但随着基于大型语言模型(Large Language Models, LLM)技术的飞跃式发展,笔者对于是否还采用KG路径去实施知识服务的信念产生了动摇。

尤其在2023年3月15日ChatGPT升级至4.0版本,提供了私域信息库检索的服务,可以将内部的文档乃至个人笔记,通过第三方插件进行调用,利用这些私域数据进行训练和学习,以提供完全个性化的服务。这一变革足以令笔者相信,在不远的将来,学术期刊出版机构可以利用AIGC技术对期刊文本内容进行训练,来创建专属的领域知识库,因为KG的构建过程需要大量的人工标注和整合,工作量比较大,且考虑到知识的更迭,很难做到可持续发展,而AIGC可以快速地处理大量的非结构化数据,虽然在处理复杂、深层次的知识和关系时,可能会出现一些误差和不准确性,但随着技术的进步、模型的完善,是可以达到应用水平的。所以,笔者团队也在规划如何利用中华医学会杂志社积累多年的临床诊疗指导类文献和病例报告类文献,训练成为临床医学领域的知识库,以提供基于解决方案的搜索服务,以辅助临床诊疗实践,从而提升医疗从业人员的诊疗水平。

2 AIGC技术给学术期刊带来新的问题和困扰

2023年,《科学》杂志主编Holden Thorp公开撰文称,在不到两个月的时间里,生成式AI软件ChatGPT已经成为一种“文化轰动”。“这在文学创作中可能会变得很有趣,但对科学界和学术界可能会造成严重的影响。”[11]一方面,AI可以提高期刊的质量、影响力和传播效率。但另一方面,AI也会被人利用,为学术期刊带来诸多问题,这些问题不仅可能损害学术期刊的公信力和声誉,也威胁科学研究的真实性和有效性[12]。目前学术期刊界普遍关心的困扰主要集中于以下几点:

2.1 作者、贡献者问题

随着研究人员不断利用AI获得生成流畅语言的能力,开始大量制造越来越难以与人类生成文本区分的内容。国内外的学术期刊在承认它们的合法用途外,也在制定明确的指导方针以避免滥用。譬如《自然》《科学》杂志制定了准则,规定AI程序不能成为作者[13-14]。这意味着,如果一篇论文或研究报告的内容是由AI程序生成的,那么该程序不能被列为该论文或报告的作者。国内的《暨南学报(哲学社会科学版)》《天津师范大学学报(基础教育版)》等部分高校的学术期刊也认为,使用ChatGPT等工具可能引发学术造假和道德问题,因此要求作者在提交论文时声明是否使用了这类工具,并提供详细的引用论证。违反这一政策将构成学术不端行为,与篡改图像或抄袭现有论文的行为没有差异。

2.2 内容抄袭和版权问题

目前法律界还不能明确解决由AI生产的文字、图片以及视频的版权归属问题。在美国,版权法通常要求版权归属于人类创作者,因此尚未确定由AI创造的作品是否可以获得版权保护。在欧盟,对于AI生成内容的版权归属问题也还在探讨中。在中国,国家知识产权局已经开始研究AI创作产权保护的相关问题,但是尚未出台具体的法规或者司法解释。

另外,即便AI生成的内容可能被认为是有版权的,如何确保这些内容不会侵犯其他人的版权也是一个挑战。因为AI系统可能会从网络上收集和学习大量的数据,包括版权受保护的内容,在生成新内容之后没有标注任何来源信息,即使后期标注了,使用该内容的人也可以将其刻意删除;或者被作者进行多次改写,直至与原文的表达方式存在很大差异,但是对于众多被引用的原创作者来说这也是属于知识产权的一种侵犯行为。

2.3 内容造假问题

包括ChatGPT在内的AIGC技术有能力生成以前未见的单词、短语和句子的新组合,往往难以辨别真伪。因此,有些人利用这些技术制造了大量的虚假学术论文、研究报告等,以欺骗学术出版机构、学术界和公众。ELSE测试发现,ChatGPT生产出的学术摘要足以骗过期刊审稿人[15],这将是学术期刊评审机制的噩梦。大量的造假内容会极大扰乱学术出版市场,严重扰乱学术出版的秩序,如果AIGC等生产的内容不断通过同行评议(可以设想,这种事情可能正在发生),这将严重影响学术界的公信力和价值体系[16]。而且,这些虚假的学术论文和研究报告会浪费大量的出版资源和时间,阻碍了真正有价值的研究成果的发表和传播。

2.4 隐私保护和数据安全问题

AIGC技术的应用还将面临着数据安全和隐私保护的挑战。比如ChatGPT会收集大量的用户信息,用户也需要通过交互界面向其传输数据,这可能会泄露用户输入的敏感信息,如商业秘密、个人隐私等[17]。ChatGPT-4提供了基于个人数据的知识库服务,科研人员可以将个人研究方向有关的私人文献、数据、文档等投喂给ChatGPT,使其成为私人助手,替他们解答各种问题,还可以替用户检索知识信息库,总结文献,编制综述,乃至运算科研数据等,这加快了科研成果的产出效率;但同时也存在科研数据的泄漏问题,尤其在当前的政治环境下,中国政府如何确保研究学者不会将敏感信息和机密数据上传至ChatGPT是个非常棘手的问题。

另外,当AIGC技术应用于医疗健康领域时,我们要确保不暴露过多的患者隐私数据。笔者团队的测试证实,ChatGPT已经可以轻松地阅读病例报告,并给予患者相当准确的诊断结果和合理的治疗建议,这为我们提供了非常便利的应用,但与此同时,它也在收集患者的隐私数据,包括检查报告、影像图片等,这些数据如果被恶意分发将给患者带来极大的伤害。

此外,AIGC技术可能会被恶意利用,以便制造虚假信息、诱导用户行为、伪造身份等,这也将带来不可预计的后果。

3 学术期刊的应对策略

为了应对上述问题,期刊界一方面需要加强学术出版市场的监管和审查机制,以确保发表的学术论文和研究报告的真实性和可信度;另一方面,也需要更多地针对AI发展利弊的展开宣传及辩论,以此不断提高公众的科学素养,加强对学术论文和研究报告的辨别能力。此外,研究人员和学术出版机构也应该加强对AI技术的应用和可能带来的风险的认识和研究,以更好地应对这一挑战。

3.1 迎接新时代的到来

比尔·盖茨说“不要过度担忧AI的发展”,“为了善用这项新技术,提升人们的生活品质,我们需要关联风险并把AI的优点跟更多人分享”。AIGC的发展和突破确实已经为学术期刊出版行业带来新的手段和方法,作为学术期刊的把关人,编辑人员不仅要具备开阔的视野和广博的专业知识,还要掌握AIGC相关的技术和应用,以崭新的姿态迎接AIGC时代的到来。

我们要意识到,AIGC时代的到来是不可逆的趋势,就跟20世纪末计算机和互联网的发展一样,这些技术为学术期刊带来了嬗变,促进了学术期刊生产的集群化、规模化,内容发布的平台化,传播模式的多元化和商业模式的多样化。中国在过去的20年没能很好地把握住这些发展趋势,创建享誉全球的学术期刊出版平台[18]。在当下,我们更应珍惜这些技术发展的红利,使其变为我们的利器,摆脱“科技大国、期刊小国”的困局。

3.2 成为AI的主宰者

AI将深刻地改变学术期刊出版的发展方向,但这并不意味着它会取代人类。与之相反,它将提供更多的工具和资源,使我们能够更好地发挥自己的才能和创造力。我们要保持对AI技术的乐观态度,它只是可以与人类协同工作的一种工具,而不是人类的替代品。

为此,学术期刊编辑首先应该关注AIGC领域的进展,拓展自己的知识面和视野,关注其在各个学科领域的应用和影响,了解AIGC对学术出版模式和规范的改变,增强自身的专业素养和竞争力。其次,学术期刊编辑要意识到,AIGC技术可以帮助优化出版流程中的各个环节,提高出版效率、质量和传播力,从而节省编辑的时间和精力,让编辑更专注于学术内容和价值的评估。最后,学术期刊编辑应该加强与AIGC相关领域的作者、审稿人、读者、研发人员的沟通与合作,建立良好的学术生态。

3.3 努力应对AIGC问题

作为一种新兴的技术,AIGC引发了学术界关于其在著作权归属、学术诚信风险、算法黑箱风险、数据安全、隐私保护等方面的担忧,学术界正在努力采取有效措施进行防范和治理,以应对AIGC带来的困扰。

首先,学者们普遍强调对AIGC技术的监督和管理,建立相应的规范和标准,确保AI在学术期刊出版中的合法合规使用[4]。

其次,提出提高对AIGC的识别和检测能力,防止基于AI的剽窃行为,维护学术期刊的学术品质,目前已知有类似的产品比如Turnitin可以检测AI写作,在其实验室中可以识别97%的ChatGPT和GPT-3撰写的写作,误报率低于1/100,计划于2023年4月早期将此功能添加到其核心写作完整性产品中。

再者,我们需要采取严格的数据保护和隐私保护措施,通过匿名化处理、数据加密、访问控制等手段,确保科研人员,尤其是患者的个人信息不会被泄露或滥用。

最后,我们需要遵循透明原则,比如《科学》在早期就主张对方法和证据公开透明,无论当时流行的是哪种技术。《自然》杂志也制定了类似原则,要求研究方法必须透明,作者必须诚实、真实,毕竟这是科学赖以发展的基础。透明原则同时也保护了AIGC所依赖的数据来源的权利。

4 结语

在学术期刊出版的征程中,我们告别了一个又一个时代,又迎接一段又一段万象更新。AI正在改变出版业,不仅改变我们读书的方式,也在改变我们创造、编辑和出版内容的方式。对于学术期刊而言如何利用好AI的优势,规避好AI的风险,是学术期刊面临的重大课题。

我们认为,学术期刊从业人员要开放胸襟,拥抱AIGC时代的到来,主动抓握AIGC技术,促使其协助编辑优化出版流程,降低出版成本,提升创作效率,增强传播和知识服务能力,提供决策支持和数据分析,使学术期刊出版更加透明化和智能化。AI是出版业的未来趋势,对学术期刊出版行业的职业需求和人才培养提出了新的挑战和机遇,需要从业者不断学习和适应新的技术和模式,时刻牢记我们才是AI的主人。我们相信,技术可以铸就出版的新形态,但出版才会赋予技术新风姿;没有人知道学术期刊的未来,但只要在抉择中秉承信念、坚守梦想、大胆描摹、书写现实,我们总归会在风浪中披荆斩棘,勇立潮头。

作者简介

沈锡宾,男,中华医学会杂志社新媒体部主任,编审,研究方向:数字出版、融合出版。

王立磊,男,中华医学会杂志社新媒体部产品经理,研究方向:数字出版、融合出版。

刘红霞,女,中华医学会杂志社新媒体部学术编辑,副编审,研究方向:数字出版、融合出版。

作者贡献声明

沈锡宾:设计论文框架,收集资料,撰写论文;王立磊:收集资料,撰写论文;刘红霞:修改论文。

透明度声明

作者利用Bing和ChatGPT 3.5进行了资料的检索,利用ChatGPT 3.5辅助完成英文摘要翻译,关键词提取和部分文章内容的润色工作。

参考文献

国务院.国务院关于印发新一代人工智能发展规划的通知[C/OL].(2017-07-20)[2023-3-30].http://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm.

STM.Entering the Al Era Creative Humans & Smart Machines[C/OL].(2017-07-20)[2023-3-30].https://www.stm-assoc.org/2021_03_29_STM_Tech_Trends_Brain.pdf.

Van Dis EAM,BOLLEN J,ZUIDEMA W,et al. ChatGPT:Five priorities for research[J].Nature,2023,614:224–226.

LIEBRENZ M,SCHLEIFER R,BUADZE A,et al.Generating scholarly content with ChatGPT:Ethical challenges for medical publishing[J].Lancet Digit Health,2023,5: e105–106.

ChatGPT风靡全球,突飞猛进的AIGC机会何在[EB/OL].(2017-02-11)[2023-03-09].https://posts.careerengine.us/p/63e817c6c1d447146421f236.

CURTIS N.ChatGPT.To ChatGPT or not to ChatGPT? The impact of artificial intelligence on academic publishing[J].Pediatr Infect Dis J.,2023,42(4):275.

WEN J,WANG W.The future of ChatGPT in academic research and publishing:A commentary for clinical and translational medicine[J].Clin Transl Med,2023,13(3):e1207.

赵泓维.借大模型东风,中康科技撬动临床科研大数据价值[EB/OL].(2023-03-17)[2023-3-30].https://www.vbdata.cn/1518901407.

BOLTON E,HALL D,YASUNAGA M,et al. PubMedGPT 2.7B[EB/OL].(2022-12-15)[2023-02-25].https://crfm.stanford.edu/2022/12/15/pubmedgpt.html.

SHEN X B.Test dataset of ChatGPT in medical field[DS/OL].Science Data Bank,2023[2023-03-30].https://DOI.org/10.57760/sciencedb.o00130.00001.

THORP H H.ChatGPT is fun,but not an author[J].Science,2023,379(6630):313.

HOMOLAK J.Opportunities and risks of ChatGPT in medicine,science,and academic publishing:A modern Promethean dilemma[J].Croat Med J,2023,64(1):1-3.

Science Journals:Editorial Policies[EB/OL].[2023-3-30].https://www.science.org/content/page/science-journals-editorial-policies#authorship.

Authorship[EB/OL].[2023-3-30].https://www.nature.com/nature/editorial-policies/authorship.

ELSE H.Abstracts written by ChatGPT fool scientists[J].Nature,2023,613:423–423.

ZOHNY H,MCMILLAN J,KING M.Ethics of generative AI[J].J Med Ethics,2023,49:79–80.

杨庆丰,邹昭,施宇.ChatGPT引发的AI监管问题思考与建议[EB/OL].(2023-03-07)[2023-03-20].https://www.secrss.com/articles/51651.

沈锡宾,刘红霞,王海娟,等.刍议推动科技期刊创新发展的7大科技趋势[J].编辑学报,2021,33(2):129.

Abstract: The recent artificial intelligence (AI) technology has greatly improved the technology of AI-generated content (AIGC), among which the most famous is the ChatGPT model developed by OpenAI. The successful applications of the ChatGPT model in intelligent questions and answers, classification, abstract, translation, and reviews have attracted widespread attention in the academic journal industry, bringing opportunities and challenges. On the one hand, AI has greatly benefited researchers in writing, editing, producing, publishing, communicating, and knowledge serving. On the other hand, academia also faces difficulties accompanying AI applications, such as author contributions, academic fraud, plagiarism, and privacy protection. Therefore, the publishing industry of academic journal needs to embrace the AIGC era, explore the advantages of AIGC technology, strengthen the supervision and management of AIGC technology, establish corresponding standards and guidelines, and ensure the legal and compliant use of AI in academic journal publishing. In addition, the academic journal publishing industry should formulate personalized application plans in accordance with the reality by taking advantage of AIGC technology to improve the quality and readability of academic papers in order to foster communication efficiency, enhance the breadth and depth of knowledge service as well as avoid its limitations and potential problems.

Keywords: Artificial intelligence; AI-generated content; Academic journal; Opportunities; Challenges; ChatGPT

猜你喜欢
机遇学术期刊挑战
RCEP与房地产机遇
学术期刊引证指标
学术期刊引证指标
你的焦虑,也是你的机遇
时代邮刊(2019年16期)2019-07-30 08:01:58
再见,机遇号
不必过于悲观,四大机遇就在眼前
汽车观察(2019年2期)2019-03-15 05:59:50
河海大学学术期刊创办百年
叽咕乐挑战
叽咕乐挑战
叽咕乐挑战