张济明 吴领叶 丁译
[摘要]ChatGPT的一项重要功能是可以生成自然流畅的文本,对期刊出版的影响备受出版业关注。文章通过探讨ChatGPT能否成为署名作者的争议,对ChatGPT生成文本的版权归属问题进行了分析;通过探讨ChatGPT出现后引发的科研诚信问题,对期刊编辑如何识别ChatGPT生成文本提出了具体建议;通过讨论ChatGPT为期刊出版带来的机遇,提出ChatGPT具有提高编辑工作效率、多语种出版等作用,在期刊出版领域具有广阔的应用前景。
[关键词]ChatGPT;期刊出版;机遇;挑战;学术不端
ChatGPT(Chat Generative Pre-trained Transformer)是由OpenAI公司研发的基于自然语言模型的聊天软件,一经问世就在社交网络迅速走红。推出后仅短短5天,其注册用户数就突破100万人[1],引发了各行各业的热议。骆飞等认为以ChatGPT为代表的人工智能生成内容可以在知识生产、科学评价、快速传播等方面发挥作用,但也可能造成责任分散、潜在歧视与信任危机[2]。郑燕林等支持教育工作者以开放的心态、前瞻的视角理性分析人工智能在教育应用层面的价值以及可能带来的风险与挑战[3]。周智博认为ChatGPT能够推动数字政府的亲民化、高效化和智能化发展,但同时可能引发国家层面的数据主权安全风险、政府层面的行政公共性结构风险以及个人层面的数据权利侵犯风险[4]。陈杨园认为跨境电商行业在ChatGPT的帮助下可以“用三秒干一天的活”[5]。杨玲认为ChatGPT可以成为开展优生工作的好帮手[6]。
ChatGPT的一项重要功能是可以生成自然流畅的文本,这将会给出版业带来哪些影响?为了更好地理解ChatGPT,文章有必要回顾ChatGPT的发展历史。
ChatGPT的发展历程可以追溯到2018年,OpenAI在该年推出了第一个GPT模型。该公司在2019至2023年分别发布了GPT-2.0、GPT-3.0、GPT-3.5和GPT-4.0等版本。ChatGPT在GPT-3.5架构模型的基础上,经过改进和优化后最终形成,可以生成更加自然、流畅的文本,被用于解决更加复杂的自然语言处理任务。ChatGPT生成的文本具有哪些特性?与人类写作的论文有何区别?ChatGPT是否可以真正写作论文?ChatGPT的出现又将会给期刊出版带来哪些影响?文章将对上述问题进行分析。
一、出版伦理和版权问题
在科学研究领域,论文署名是一种非常重要的认可和评价方式,应遵循实际贡献、顺序、透明、责任和知识产权等原则,确保署名的公正、客观和诚信,维护学术研究的科学性和可信度。值得一提的是,Nurse Education in Practice曾发表Open Artificial Intel-ligence Platforms in Nursing Education:Tools for Academic Progress or Abuse一文,将ChatGPT列为第二作者[7];
Oncoscience期刊发表的Rapamycin in the context of Pa-scal's Wager:generative pre-trained transformer perspective一文將ChatGPT列为第一作者[8],这些将ChatGPT列为作者的文章迅速引发出版业关于出版伦理和版权的热烈讨论[9-10]。
我国著作权法第二章第二节第十一条对作者的概念进行定义,创作作品的自然人是作者。由法人或者非法人组织主持,代表法人或者非法人组织意志创作,并由法人或者非法人组织承担责任的作品,法人或者非法人组织视为作者。按照这一规定,署名作者包括两类对象,一类是自然人,一类是法人或非法人组织,即作者应是具有独立主体的自然人或者组织机构。作为机器学习模型,ChatGPT并非真正具有自我意识,它既非自然人,也非组织机构,因此,从我国著作权法的角度来说,将其列为作者并不合适。作品的署名应基于实际的贡献,即只有对研究做出实际贡献的人才能被列为作者。例如,设计研究方案、进行实验、分析数据、提供重要的研究材料或设备等工作,都可以被视为实际贡献。ChatGPT并没有参与实际的研究工作或做出独特的贡献,其只作为一种技术工具和资源,用于协助人类完成相关工作。例如,大多数学工作者在撰写论文时会使用许多软件进行辅助,如数学软件MATLAB可以用于数据分析、无线通信、深度学习、图像处理与计算机视觉、信号处理等领域,那么是否可以把MATLAB也列为作者?从本质上讲,ChatGPT与MATLAB一样,都是辅助人类的应用软件,因此将其作为共同作者署名并不合适。
ChatGPT生成文本的版权究竟应归谁?答案基本有三种:研发ChatGPT的OpenAI公司;使用ChatGPT生成文本的自然人;ChatGPT本身。数学工作者通常会在论文中注明计算结果是应用MATLAB的某个版本在什么样的硬件上得到的结果并进行相应的分析。而科研工作者通过提问或输入相应命令生成的ChatGPT内容,与MATLAB软件计算得到的结果类似,均为机器学习模型软件生成的语言内容,因此这些内容在正文中应被加以标注或者说明。由于ChatGPT本身并不具有思想,也不具备写作论文的动机,本质上的操作者还是自然人,因此应说操作ChatGPT或是提出论文思想的自然人才是真正的作者。
随着ChatGPT在国内外被广泛应用,未来人机协同进行科研创作或将成为一种普遍的状态。因此,在使用ChatGPT等人工智能生成文章时,科研工作者需要充分考虑到其本质上只是一种技术工具和资源,对论文中ChatGPT等人工智能生成的内容必须进行相应的标注,说明使用了人工智能。
二、学术不端与科研诚信问题
学术出版是科研成果传播的重要途径,而科研诚信则是保障学术出版品质和权威性的重要基础。随着诸如ChatGPT等人工智能对中国用户开放以及国内类似产品的开发,未来我国学术期刊将面临越来越普遍的人机协同和更复杂多元的写作伦理、科研伦理以及其他不确定性和未知性课题[11]。如何应对以ChatGPT为代表的人工智能生成文本给学术出版带来的巨大挑战,是出版业亟待思考的问题。目前,学术界使用的查重软件有很多,但主要原理基本相同:当用户将文章上传至查重软件后,软件按照连续出现13个相同字符判为重复的标准来计算论文重复率,同时将论文分段处理,利用算法对每一个段落计算重复率,待全部查重完毕后,软件会将论文的重复率、引用率、重复内容等自动记录并生成查重报告。当前,国际上使用比较广泛的英文学术论文查重软件是CrossCheck,当论文相似度超过50%时系统会自动显示黄色提醒,其被Elsevier、Wily、Springer Nature、Taylor&Francis
等出版集团旗下的期刊广泛使用[12]。国内中文期刊使用较多的学术不端检测软件是中国知网开发的AMLC软件,该软件不断采用新技术提升检测能力,对大面积改写以降低文字重复比例的论文,采用神经网络方法,对观点类似内容进行“意思抄袭检测”[13]。但由ChatGPT等人工智能生成的内容,包含大量预训练模型生成的文本,相关数据库或网络中并不存在完全相同的内容,因此目前的反剽窃软件很难准确检测到ChatGPT等人工智能生成的内容。
ChatGPT具有很强的自然语言生成能力,使用大规模的语言模型来进行训练,因此其生成的文本通常不会出现明显的语法错误或拼写错误,但与人类写作的语言还是会存在一些差异。第一,文本流畅度和自然度。通常人类写作文本的语言表达更加流畅,而ChatGPT生成的文本可能会存在一些非常规的表达方式,甚至在某些情况下会产生模糊的回答。第二,文本逻辑性和连贯性。人类写作文本通常有更好的逻辑性和连贯性,句子之间的连接更加自然,而ChatGPT生成的文本可能会出现逻辑性不强、句子之间转换不够自然的情况。第三,文本主题和细节表述。人类写作文本通常能够深入主题细节,表述更加具体,而ChatGPT生成的文本可能只是对主题的概括性描述,缺少细节和具体表述。第四,深度语义理解和用词准确性。ChatGPT能够理解和学习单词和短语的含义,但在深度理解语言方面如隐喻、比喻等会有些欠缺。因此,期刊编辑在判断作者是否使用ChatGPT生成文本时,可从以上几个方面仔细审查和验证。
ChatGPT预训练模型的数据源于互联网,主要使用互联网已有的知识进行深度排列组合,它并不具有真正创新的能力。因此,是否具有创新性可以说是ChatGPT生成文本与人类写作文本的根本区别。ChatGPT生成的内容往往逻辑性不是很强,常常会出现文不符题的现象。例如,当笔者向ChatGPT提问“如何识别ChatGPT生成文本”时,其回答只涉及了ChatGPT生成文本与机器翻译或填充式文本的区别。因此,期刊编辑要对ChatGPT生成内容具有高度敏感性,可以从文本的流畅度、逻辑性、用词准确性、文本细节、深层语义等方面加以辨识。值得一提的是,相关企业机构正在不断开发能够识别ChatGPT生成文本的相关检测软件。例如:OpenAI推出的GPT-2 Output Detector就可以比较准确地识别ChatGPT生成的文本;国外学术检测服务机构Turnitin表示,今年将推出合成文本检测器,据说可以检测由ChatGPT生成的97%的文本,误报率为1%;普林斯顿大学生Edward Tian表示,目前已经设计出相关工具GPTZero用于辨认ChatGPT生成文本,来自哈佛大学、耶鲁大学、罗德岛大学和其他大学的6000多名教师已经注册使用GPTZero。相信随着科技的发展,利用专业软件检测人工智能生成的文本有望被推广应用。
三、期刊出版面临的机遇
以ChatGPT为代表的人工智能软件在知识生产和传播方面给出版业带来了机遇和挑战,如何在出版工作中学会利用其强大的功能是每个期刊编辑面临的课题。笔者认为,ChatGPT可以帮助期刊编辑提高工作效率,撰写公文和改善读者体验。
(一)初步校对稿件,提高编辑工作效率
ChatGPT可以作为期刊编辑的智能助手,帮助编辑初步校对稿件,优化文本内容。ChatGPT可以检测文章中的语法错误、错别字和标点符号等问题,并提出改进建议,从而帮助期刊编辑更快速地完成文章的校对和优化。当前,只要在ChatGPT对话框输入“请校对以下段落:……”就可以实现自动校对,较为明显的错误均可以得到纠正。尽管ChatGPT可以帮助期刊编辑检查错误,但其仍不能完全替代人类进行编辑和校对,机器学习模型仍然存在误判的可能,而且机器学习模型难以感知文章的上下文和背景信息。因此,期刊编辑在使用ChatGPT进行文章编辑和校对时,需要结合自身经验综合判断,才能取得最佳效果。
(二)多语种出版成为可能,增强不同国家读者的母语阅读体驗
ChatGPT具有强大的翻译功能,几乎可以翻译所有领域的文章,包括但不限于科技、商业、医学、法律、社科、人文等。此外,ChatGPT可以自动识别输入的语言,并将其翻译成多种语言,如将英语翻译成法语、西班牙语、中文、日语等。ChatGPT强大的翻译功能和极低的使用成本,使得多语种出版和推送成为可能。为了扩大期刊的影响力,许多出版社和期刊编辑部会进行邮件推送。但由于语言限制,多数中文期刊只能将发表的文章在国内推送,英文期刊虽然可以将发表的文章推送到不同的国家,但是非英语国家的读者还是缺乏母语阅读体验。期刊编辑可以利用ChatGPT提供的多语言翻译功能,将需要推送的文章翻译成相应的语言针对不同国家进行推送。期刊编辑在推送时可以注明这是机器翻译结果,读者可以参考英文与母语一起阅读,获得较满意的体验。这种既节约经费又节省人力的多语种推送工作,可以帮助期刊扩大读者群,提高国际化程度,丰富不同国家的读者的母语阅读体验。
(三)帮助期刊编辑撰写各类信函和邮件
ChatGPT可以生成自然流畅文本的能力给期刊出版带来隐性的学术不端问题,但其强大的文本生成能力也可以用来进行公文写作。期刊编辑每天需要与众多作者、读者、审稿人、编委联系,需要发出大量的邮件,耗费大量的时间和精力。而通过ChatGPT,这些邮件完全可以由其代为书写,期刊编辑只要输入收件对象和信函主要内容,ChatGPT就可以撰写标准的收稿函、审稿邀请函、录用函、约稿函等各种邮件。
四、结语
ChatGPT作为一种全新的工具,给人类的生活和工作带来便利,同时带来前所未有的挑战。在这样的背景下,期刊编辑不仅要被动应对随之产生的诸如版权归属等问题,还要坚守期刊的科研诚信,积极利用各种办法对ChatGPT带来的更加隐蔽的学术不端问题进行检测。此外,ChatGPT可以为期刊出版带来许多机遇,帮助期刊编辑提高工作效率和丰富读者的体验,同时可以帮助期刊降低成本和提升竞争力。当下,以ChatGPT为代表的人工智能发展迅速,期刊编辑要不断提高人工智能素养,在工作中主动利用ChatGPT来提高工作效率,做一名人工智能新时代的高水平期刊编辑。
[参考文献]
[1]5天注册用户超100万,ChatGPT让谷歌百度坐不住了[EB/OL].(2023-02-03)[2023-10-28].https://baijiahao.baidu.com/s?id=1757139070445438265&wfr=spider&for=pc.
[2]骆飞,马雨璇.人工智能生成内容(AIGC)对学术生态的影响与应对:基于ChatGPT的讨论与分析[J/OL].现代教育技术:1-12[2023-10-30].http://kns.cnki.net/kcms/detail/11.4525.n.20230322.1635.002.html.
[3]郑燕林,任维武.实践观视域下ChatGPT教学应用的路径选择[J].现代远距离教育,2023(02):3-10.
[4]周智博.ChatGPT模型引入我国数字政府建设:功能、风险及其规制[J/OL].山东大学学报(哲学社会科学版):1-11[2023-10-30].http://kns.cnki.net/kcms/detail/37.1100.c.20230315.1052.002.html.
[5]陈杨园.ChatGPT引爆跨境电商行业“用三秒干一天的活”[N].第一财经日报,2023-03-21.
[6]杨玲.ChatGPT能成为优生工作的好帮手吗?[J].中国优生与遗传杂志,2023(03):431-432.
[7]OConnor S.Open Artificial Intelligence Platforms in Nursing Education:Tools for Academic Progress or Abuse?[J].Nurse Education in Practice,2022.
[8]ChatGPT Generative Pre-trained Transformer, Alex Zhavoronkov.Rapamycin in the context of Pascal's Wager:generative pre-trained transformer perspective[J].Oncoscience,2022(09):82-84.
[9]羅东.ChatGPT可以是“作者”?《科学》等学术期刊发投稿禁令[N].新京报,2023-02-07.
[10]张月红.ChatGPT的感悟:既生瑜,何生亮?[EB/OL].(2023-02-24)[2023-10-30].https://mp.weixin.qq.com/s?__biz=Mzg4OTY3Njg4Mg%3D%3D&mid=2247486965&idx=1&sn=5afe759e76499cf579e7eb5f9e3b70d1&scene=45#wechat_redirect.
[11]李二斌.ChatGPT对学术期刊影响如何[N].中国社会科学报,2023-02-28.
[12]李小燕,郑军卫,张蕾春,等.学术不端检测系统应用现状及对我国科技期刊的启示[J].中国科技期刊研究,2022(09):1178-1185.
[13]孙雄勇,耿崇,申艳.学术不端检测的难点及对策[J].中国科技期刊研究,2019(01):14-18.