ChatGPT参与知识生产的技术路径、应用与挑战

2023-05-30 11:44:11王仕勇张成琳

教育传媒研究 2023年3期

王仕勇张成琳

【内容摘要】ChatGPT技术的崛起给知识生产领域带来了颠覆性变革，其凭借优异的自然语言处理技术和算法让知识生产进一步走向智能化、自主化、高质化、仿真化和个性化，未来有望在与知识生产密切相关的教育培训、新闻媒体和学术研究等领域充当重要角色。但ChatGPT在参与知识生产的过程中，也面临着真实性和可靠性待评估、学术伦理和知识产权遭遇冲击，以及人类生产知识的潜能和自主性面临消解等严峻挑战。由此，本文认为我们需要牢牢把握知识生产以人为本的原则，重新思考强人工智能时代下的人机协作与融合方式。

【关键词】ChatGPT；知识生产；人工智能；深度学习；学术伦理；知识产权

近年来，人工智能（AI）在参与知识生产领域的应用呈现出多种方式，涉及多个领域，例如自然语言处理、计算机视觉、机器学习，等等，但总体智能化水平较低、自主性较差，难以摆脱弱人工智能的标签。2022年11月30日，美国人工智能公司OpenAI公司推出了聊天机器人ChatGPT，这款引领自然语言处理技术革命的机器人迅速在全球范围内引发现象级关注，一周内其用户数量就突破百万。作为一款基于深度学习技术的自然语言处理工具，ChatGPT具有自动生成、摘要和翻译等多種任务的能力，广泛应用于文本自动生成、自然语言处理和知识管理等领域。①ChatGPT的迅猛发展被誉为“AI时代的二次复兴”②，意味着人类告别弱人工智能时代。③

一、ChatGPT参与知识生产的技术路径

人类知识形态经历了从经验形态到分科的原理形态知识，再从原理形态发展到在信息技术平台上形成的差异化或交叠形态的知识。④计算机的广泛应用不仅实现了知识的大规模组合，而且促进了知识层面之间的协作和互动，颠覆了传统的知识生产方式。首先接受变革的就是作为知识载体的语言。随着计算机技术的进一步发展，人们希望计算机能够像人类一样处理自然语言，NLP （Natural Language Processing，自然语言处理）技术应运而生。作为一种机器学习技术，NLP致力于研究计算机如何理解、分析和生成自然语言。ChatGPT（Generative Pre-trained Transformer）便是一种基于自然语言处理的模型。它依托LLM（Large Language Model，大型语言模型），通过创新性地利用 transformer 模型和自注意力机制（Self-Attention Mechanism）等技术，同时使用RLHF（Reinforcement Learning with Hindsight Feedback，人类反馈强化学习）进行训练，实现了更加自然化的对话交互，让知识生产更加智能化、自主化、高质化、仿真化和个性化。

（一）依托大型语言模型（LLM）的智能化生成和自主化学习

ChatGPT采用预训练（Pre-training）和微调（Fine-tuning）的两阶段训练方式进行模型训练，而LLM便是其进行预训练的基础。LLM指采用大规模预训练的深度学习语言模型，通常由数十亿或数百亿的参数组成，因此需要在大规模数据集上进行预训练。ChatGPT的模型参数多达1750亿，不仅包括一些公开语料库，还包含OpenAI自己爬取的超过万亿单词的人类语言数据。⑤在海量数据的基础上，ChatGPT通过MLM（Masked Language Model，掩码语言模型）和NSP（Next Sentence Prediction，下一句预测）实现预训练。MLM可以将输入文本中的某些单词随机替换成掩码字符，并通过模型对这些单词进行预测，NSP可以让模型预测两句话之间是否有逻辑关系，从而使模型能够对语言结构和语义进行建模，进而模仿训练文本，智能化生成各种语言表达，包括对话、文章、摘要和翻译等。

依托LLM的ChatGPT还能自主发现语言模式和规律，自主调整模型参数，自主适应各种任务和场景，从而实现高效的自主化学习。具体而言，在预训练阶段，ChatGPT依托LLM对大规模语料进行无监督学习，学习语言的基本规律和语义结构。LLM可以帮助ChatGPT自主地发现语言中的隐含模式和规律，从而更好地理解和生成自然语言。在微调阶段，ChatGPT在依托LLM的基础上，根据用户输入的数据进行有监督学习，自主地调整模型参数，自主学习和适应各种特定任务和场景。例如，ChatGPT可以利用LLM对话的历史信息，在对话生成任务中自主调整模型的生成策略和语言表达方式，从而更好地满足人类更加高效、精准和个性化的知识生成需求。

（二）基于transformer模型的高质量知识表示和推理

知识表示与推理（Knowledge representation and reasoning，KR2）是人工智能领域的一项重要研究课题，是计算机有效处理知识和信息的基础，也是人工智能“弄懂”自然语言并输出高质量知识的关键。人类用自然语言对知识进行表示，但这种表示方法并不能被机器接受，于是发展出了能够将文本信息转化为计算机理解形式的知识表示方法。ChatGPT采用的是向量表示法，即将每一个知识和概念等表示成一个多维向量，便于计算机理解和处理，而其获取向量的技术支撑便是transformer 编码器-解码器模型。transformer模型是一种基于注意力机制的深度神经网络模型。多层的 transformer 模型构成分层结构，每一层都包含多头自注意力机制和前馈神经网络，能够更好地捕捉上下文信息和对多层处理输入文本，并将文本转化为富含语义信息的向量表示，用于后续的知识推理任务中。transformer 模型的核心组成部分自注意力机制，能够在不同层次、不同位置上自适应地聚焦不同的语义信息，帮助模型理解文本知识和推理规则。它可以将已有知识与先验语言知识有效结合，推理出新的结论和概念，以此让ChatGPT更好地理解复杂的语言推理任务，实现多轮对话和常识推理。有学者比较了ChatGPT和GPT-3.5 （textdavinci-003）在不同任务上的零样本学习性能，研究发现，ChatGPT的确在许多有利于推理能力的任务上有良好表现。⑥

（三）利用人类反馈强化学习（RLHF）实现知识生产的仿真化和个性化

预训练阶段的自监督学习算法并不能完全让ChatGPT实现高度仿真和个性化交互，在进行对话生成任务时，ChatGPT还需要使用其他算法来进行微调和训练，其中之一就是RLHF。⑦RLHF的主要步骤为：使用监督学习训练语言模型、根据人类偏好收集比较数据并训练奖励模型，以及使用强化学习针对奖励模型优化语言模型。⑧在RLHF算法中，ChatGPT 通过强化学习框架与环境进行交互，并在每一轮交互中生成回复，该回复会发送给人类评估者，人类评估者将其与期望回复进行比较后，给出奖励值，以此代表ChatGPT生成回复的质量。在奖励值的反馈下，ChatGPT会自主调整回复策略，逐渐学习人类语言的风格、情感、语气和语境等，最终生成高仿真性的对话文本。有学者就ChatGPT对教育的影响与ChatGPT进行互动研究，发现ChatGPT有很强的交互性，能够与人类就广泛的主题进行非常自然化的对话。⑨此外，RLHF算法还可以利用CER （Counterfactual Experience Replay，反事实经验回放技术），使ChatGPT更好地適应不同用户的需求。通过运用该技术，ChatGPT会生成多个不同的回复，并根据用户的反馈来选择最优回复作为训练数据，以此了解不同用户的不同偏好和需求，从而实现知识的个性化生产。

二、ChatGPT技术应用于知识生产领域的角色展望

ChatGPT技术应用场景非常广泛，包括聊天机器人、智能客服、语音识别、文本摘要、机器翻译和内容生成等，未来将在知识生产领域充当重要角色。

（一）教育培训领域的虚拟助教

ChatGPT给教育界带来了重大变革，其强大的知识集成和生成能力能够极大提升教师教学能力和学生学习效率。首先，ChatGPT可以作为教育辅导工具，帮助教师实现个性化教育和自主化评估。ChatGPT除了能够帮助教师获取最新且全面的教学资源和工具外，还能够协助教师监测学生的学习进展。例如，ChatGPT可以通过分析学生提交的作业和回答，自动评估学生的学习水平和理解程度，自动调整教学内容和难度，实现智能化因材施教。其次，对于学生来说，ChatGPT可以作为一种智能对话辅导工具，提供在线答疑、课程安排、学习计划、学习资源推荐等服务。对话本身也是一种教学实践，传统的师生对话多发生于课堂，受到教学环境和人际交往等诸多限制，而ChatGPT具有高度拟人化的知识生成能力，能够为学生构造仿真化的对话环境。在与ChatGPT的对话中，学生能自主探索知识与答案，这不仅突破了教师设定问题的局限性，更激发了学生的学习潜能和探索问题的积极性，有利于培养学生自主获取知识的能力。有学者指出，ChatGPT 和其他生成式 AI 技术已经在突破教育界限，并将在现有教育实践中引发重大范式转变。⑩

（二）新闻媒体领域的全能记者

融媒体时代要求记者具备多种技能，ChatGPT的智能化生成和个性化交互等优势让它有望成为媒体领域的机器全能记者。在新闻报道方面，ChatGPT可以通过大批量分析和处理数据及信息，发现新闻线索，并自动生成新闻报道，包括新闻标题、正文和图片等内容，大大提升了新闻报道的时效性和准确性。同时，还可以提取文章的关键信息，生成文章摘要，帮助受众快速了解文章内容。在与受众互动方面，与传统的人工智能相比，ChatGPT能够更好地考虑上下文和语境信息，对受众的指令、浏览记录和搜索行为等有更准确的理解，从而真正发现受众的兴趣和需求，提供多样化、精准化的媒体内容推荐。此外，ChatGPT还能够通过与受众的个性化交互和对话方式，及时跟进受众的反馈和建议。有学者就新闻和媒体等相关知识与ChatGPT进行了问答交流，称赞其拥有的新闻和媒体知识水平和范围“令人印象深刻”，并能很好地协助人类记者提高媒体工作效率和质量。

（三）学术研究领域的智能专家

ChatGPT对学术界的影响无疑是巨大的，它能够帮助研究人员快速检索文献和资料、分析数据和交流研究结果，甚至能够生成论文提纲和设计方案等。目前已有研究者开始使用ChatGPT来总结文献、撰写和改进论文。例如，有研究者尝试使用ChatGPT 撰写一篇有关教育方向的学术论文，整个过程总共用了2-3个小时，结果表明，ChatGPT 在帮助研究人员撰写论文方面表现优秀，能够做到语句连贯、准确（部分）、信息丰富且系统性强。还有研究者在ChatGPT的协助下创建了一篇文献综述文章，并利用ChatGPT对检索到的论文摘要进行转述，同时通过与ChatGPT的互动得到了相关问题的满意回答，展现了ChatGPT在学术研究领域加速知识汇编和知识生成的巨大潜力。ChatGPT后期可能将应用到设计实验、撰写手稿、协助同行评审和稿件录用。

三、ChatGPT参与知识生产面临的挑战

虽然ChatGPT在知识生产领域具有无限的潜力，但其面临的学术伦理、知识产权、人类生产知识的自主权等方面的挑战需要高度重视。

（一）知识生成的真实性和可靠性亟待评估和验证

多项研究证实，ChatGPT虽然能极大提升知识生产效率，但其存在生成错误内容、编造文献等诸多局限性。Van Dis 等人向ChatGPT提出了一系列需要深入了解文献的问题，但ChatGPT却通过伪造数据和事实，编造了一个让人看起来信服的回应。另一位研究者在应用ChatGPT 生成论文参考文献时发现，ChatGPT 不仅向他提供了一篇不存在的虚构文章，还煞有介事地提供了该文章的详细信息以及一个非功能性 URL。这种“一本正经的胡说八道”在ChatGPT参与学术的实践中屡见不鲜，非常容易误导研究人员和审稿人。如何对ChatGPT生成知识的真实性和可靠性进行评估和验证，是未来推行ChatGPT技术参与知识生产的重大挑战。

（二）学术伦理和知识产权遭遇重大冲击

ChatGPT的知识生产能力极度依赖海量数据、复杂的算法和流程，这使得其参与知识生产的透明度较低，用户很难追溯相关数据来源和理解内容生成流程，容易引发学术侵权、学术剽窃等学术不端行为以及知识产权纠纷。在目前公开发表的论文中，部分研究者开始将ChatGPT列为“合著者”。如Pavlik在《与 ChatGPT 合作：考虑生成人工智能对新闻和媒体教育的影响》一文中，明确表示该论文由人类新闻和媒体研究教授与ChatGPT合著。随着ChatGPT参与学术论文写作的案例增多，一些学术期刊社公开发表声明，明确禁止或严格限制使用ChatGPT进行学术论文撰写。与此同时，教育界也掀起了一股“反ChatGPT”新潮，不少学校宣布禁止学生使用ChatGPT完成作业。然而，如何鉴别ChatGPT是否参与了知识生产，目前还存在技术壁垒，学术伦理和知识产权仍面临巨大挑战。

（三）人类生产知识的潜能和自主权面临消解危机

对ChatGPT技术的极端崇拜和过度依赖，会在一定程度上打击人类从事知识生产的积极性和主动性，扼杀人类的创造性。由于ChatGPT能够应对复杂场景并在极短时间生成高质量知识，知识生产者很容易被自动化生成的知识所折服，放弃主动思考和批判，长此以往可能会丧失知识生产的创造潜能。同时， ChatGPT算法有较强的自主性和深度学习能力，虽然现在还存在“胡说八道”的缺陷，但随着技术迭代和数据更新，未来ChatGPT是否会拥有自主意识依然值得重视。有学者在谈及人工智能的负面效应指出，人工智能的异化会使其摆脱人类控制，甚至人工智能可能会获得自主意识，最终将会导致人工智能取代人类甚至人类被奴役的结果。

四、结语

“机器是延伸自我的一种工具”，但自我不能被机器取代。如何平衡人工智能和人的智能之间的关系，实现人机协作与融合，将是人工智能时代下知识生产领域亟待解决的一大难题。ChatGPT技术的崛起虽然极大提升了知识生产的效率和质量，给知识生产领域带来了颠覆性变革，但我们始终要把握的原则是，知识生产的本质是以人为本，“类人化”的机器始终不能取代人类的创造价值和意义。因此，人类在追寻用机器分担劳动的同时，不仅要对机器产生的各种伦理问题进行反思，更要时刻警惕知识生产的自主权和批判思维不被消解。

参考文献：

①Open AI： ChatGPT： Optimizing Language Modelsfor Dialogue，https：//openai.com/blog/chatgpt/.

②⑤朱光輝、王喜文：《ChatGPT的运行模式、关键技术及未来图景》，《新疆师范大学学报（哲学社会科学版）》2023年第4期。

③令小雄、王鼎民、袁健：《ChatGPT 爆火后关于科技伦理及学术伦理的冷思考》，《新疆师范大学学报（哲学社会科学版）》2023年第4期。

④韩震：《知识形态演进的历史逻辑》，《中国社会科学》2021年第6期。

⑥Qin C， Zhang A，Zhang Z，et al. Is ChatGPT a General-Purpose Natural Language Processing Task Solver？. ArXiv. /abs/2302.06476，2023.

⑦Christiano P F， Leike J， Brown T， et al. Deep reinforcement learning from human preferences[J]. Advances in neural information processing systems， 2017，30.

⑧Ouyang L， Wu J， Jiang X， et al. Training language models to follow instructions with human feedback[J/OL]. ArXiv. /abs/2203.02155，2022.

⑨⑩Baidoo-Anu D， Owusu Ansah L. Education in the Era of Generative Artificial Intelligence （AI）： Understanding the Potential Benefits of ChatGPT in Promoting Teaching and Learning. SSRN Electronic Journal，2023.

Pavlik J V. Collaborating With ChatGPT： Considering the Implications of Generative Artificial Intelligence for Journalism and Media Education [J]. Journalism & Mass Communication Educator，2023，78（1）： 84-93.

Zhai X. ChatGPT User Experience： Implications for Education [J/OL]. SSRN Electronic Journal，2022.

Ayd?n ?， Karaarslan E. OpenAI ChatGPT Generated Literature Review： Digital Twin in Healthcare [J/OL]. SSRN Electronic Journal，2022.

Van Dis E A M， Bollen J， Zuidema W， et al. ChatGPT： Five priorities for Research [J]. Nature，2023，614（7947）： 224-226.

Qadir J. Engineering Education in the Era of ChatGPT： Promise and Pitfalls of Generative AI for Education. TechRxiv，2022.

薛峰：《人工智能对劳动的挑战与马克思劳动理论的回应》，《劳动哲学研究》2021年第2期。

刘伟：《智能传播时代的人机融合思考》，《人民论坛》2018年第24期。

Davenport T H， Prusak L. Working knowledge： How organizations manage what they know[M]. Harvard Business Press，1998.

（作者王仕勇系广西大学新闻与传播学院院长、教授；张成琳系马来西亚国立大学人文与社会科学学院博士研究生）

【责任编辑：韩勇】