人智交互新体验:基于ChatGPT的学术问题求解过程分析

2023-04-20 04:14李子运
电大理工 2023年4期
关键词:学术人工智能文本

李 悦 李子运

(江苏师范大学,江苏徐州 221000)

0 引言

人工智能已然成为当今最热门的研究领域之一,在人工智能的众多应用领域中,自然语言处理技术显得尤为重要。自然语言处理是(Natural Language Processing,NLP)指将人类自然语言转化为机器可读的形式,以便计算机可以理解和处理,而且自然语言处理研究实现人与计算机之间用自然语言进行交流的各种理论和方法,是计算机科学领域与人工智能领域中的一个重要方向[1]。人工智能写作也是人工智能发展的重要产物,按照其智能化程度可以进一步细分为自动写作和辅助写作[2]。在这方面,ChatGPT 预训练语言模型因其优秀的表现在学术问题求解过程中备受关注。

20世纪60年代,人工智能领域的第一次发展高潮出现,孕育出自然语言处理和人机对话技术。70 年代开始,基于统计的方法逐渐代替了基于规则的方法。90 年代中期以来,计算机的运行速度和存储量大幅度增加,为自然语言处理技术的飞速发展提供了硬件基础[3]。本文通过对ChatGPT 在学术问题求解过程中的应用进行分析,探讨其实现过程、应用效果和未来发展方向,为研究和应用ChatGPT 在学术问题求解领域的读者提供参考和借鉴。学术问题的解决是科研工作者和学者生活中重要的研究行为。依托于人工阅读大量的书籍文献和资料,不仅费时费力,而且会很容易出现漏洞,Chat-GPT 作为自然语言处理领域的一个重要模型,其在解决学术问题中具有独特的优势。

1 ChatGPT 模型的基本原理、特点与应用

ChatGPT 是一种由OpenAI 所推出的基于Transformer 结构的预训练语言模型,它在2018年被首次提出,目前已经发展到了第三代。

与传统的神经语言模型不同,ChatGPT 利用了Transformer 结构中的自注意力机制,能够更好地捕捉句子中的上下文关系。ChatGPT 模型的预训练过程主要分为两个阶段,分别是语言建模和文本生成。在语言建模阶段,模型使用海量的未标注文本数据进行训练,学习对语言的理解。在文本生成阶段,模型通过对一个给定的前缀文本进行自动生成,进一步提高其语言生成的能力。而且,ChatGPT 在自然语言处理中也有着广泛的应用,如文本分类、情感分析、机器翻译和问答系统等。与此同时,在学术领域中,ChatGPT是基于transformer模型的一种自然语言处理技术。该技术主要包括三个部分:输入编码、transformer 模型和输出解码。输入编码主要负责将输入的自然语言文本进行编码,转换为计算机可以理解的向量形式;transformer 模型主要负责对输入的文本进行理解和推理,并生成相应的输出;输出解码主要负责将输出向量转换为自然语言文本,使得用户可以方便地阅读和理解。

语言文化存在着差异,当前市面上混杂着各式各样的单一语言的系统软件。在任何一种系统中,开发多种语言字体的支持环境势在必行。这不仅满足国际化市场的需要,也是系统软件自身发展的趋势[4]。由于ChatGPT 在预训练阶段就是采用的无标注的文本数据,所以能够很好地适应不同语种的文字。因此,ChatGPT在跨语言、跨文化的传播方面有着巨大的潜在价值,将会使其在更广阔的领域中得到更多应用。

ChatGPT 可以用于对话系统中,通过生成自然语言来回答用户的提问,实现智能对话。比如,可以使用ChatGPT 来构建聊天机器人,实现智能客服、问答等场景。也可以用于生成代码。例如,可以输入自然语言描述的任务要求,ChatGPT 会生成相应的代码,自动实现任务。但也只限于文本式的输入形式,无法达到对图片类数据的识别和解析。

智能问答系统是一种能够理解用户提出的用自然语言表述的问题,并能够自动、准确地给出用户答案的软件系统[5]。ChatGPT 便是一个基于自然语言处理技术的问答系统,可以回答用户的各式各样问题。

它的应用场景包括但不限于以下几个方面:一是常识性问题:ChatGPT 可以回答与日常生活、科技、文化等领域相关的常识性问题,例如“太阳为什么会发光?”“中国的首都是哪里?”二是搜索性问题:ChatGPT 可以根据用户的提问,在网络上搜索相关的信息,并给出相应的答案,例如“如何瘦身?”“如何学习编程?”三是对话式问题:ChatGPT 可以与用户进行自然的对话,例如“你好”“今天天气怎么样?”四是语言翻译:ChatGPT 可以将一种语言翻译成另一种语言,例如将英文翻译成中文或者将中文翻译成英文等。

总之,ChatGPT 是一款功能强大的问答系统,其经过大量的语料库训练,具有广泛的知识储备,能够对多领域的问题进行回答,可以为用户提供全方位、多样化的信息和服务。

2 学术问题求解过程

2.1 问题提出

问题提出是学术问题求解过程的第一步。在这个环节中,需要明确问题的研究领域和问题的具体内容。而问题理解的关键在于问题语义特征的提取和表示,以此来明确用户所提出的自然语言问题的真实意图[6]。ChatGPT 擅长于理解自然语言,并能够提供与之相关的信息,但它需要用清晰、精确的语言描述准确的问题才能提供有效的回答。而且,在输入问题之前,用户需要对所询问的问题进行足够的思考,并尽可能提供其详细的背景信息,只有这样Chat-GPT 才能给出有用的答案。此外,ChatGPT 可能会对问题进行重述,以确保它正确理解了用户的意图。问题重述通常是为了使问题更加清晰,或者以不同的方式表达问题,以提高回答的质量。例如,一个关于人工智能的问题可能是:“人工智能技术的现状和发展趋势是什么?”

2.2 语言理解

在问题提出后,需要对问题进行语言理解,将问题转化为机器所能够理解的形式。在自然语言处理几十年的发展历程中,文本表示方法经历了从离散符号表示到连续向量表示的体系转变[7]。而ChatGPT 是一种基于神经网络的自然语言处理模型,它使用深度学习技术进行语言理解。具体来说,ChatGPT 是一种预训练语言模型,它在大规模的文本数据集上进行训练,以学习自然语言的规律和结构。当用户输入一个问题时,ChatGPT 首先将其转换为一个数字向量表示,并将其输入到模型中。具体体现为:ChatGPT 使用词嵌入技术将文本中的单词或子词(例如字母、词根)映射到向量空间,以便模型能够理解词汇。然后,文本通过多层编码器(通常是Transformer 编码器)来捕获不同层次的语义信息。编码器是深度神经网络的一部分,它将输入文本的每个位置上的词嵌入进行组合,以捕获上下文信息。

模型还通过多个自注意力层和前馈网络层对输入进行处理,以学习输入序列中的上下文信息和语言规则。模型还可以考虑先前的对话历史或上下文信息,以更好地理解用户的问题。除此以外,在进行语言理解时,ChatGPT 还可以使用其他技术来提高其性能。ChatGPT 可以使用语言模型微调技术来进一步改进其对特定任务或领域的理解能力。还可以使用预处理技术,例如分词和去除停用词,以减少输入数据中的噪声和冗余信息,从而提高模型的准确性和效率。例如,ChatGPT 输入“人工智能技术的现状和发展趋势是什么?”是机器无法理解的语言组织形式,可以将其改成“请描述人工智能技术目前的状态和未来的发展趋势。”

2.3 知识检索

在语言理解后,需要对问题进行知识检索,获取与问题相关的知识和信息。ChatGPT 是一个基于机器学习的自然语言处理模型,它的知识来自于被训练时接触的文本数据。在训练期间,为ChatGPT 提供了大量的文本语料库,例如维基百科、新闻报道、互联网上的博客和论坛等,以学习和理解自然语言。在处理用户的问题时,ChatGPT 会使用一种称为“前馈神经网络”的技术。用户可以输入检索内容,经过语义理解将输入内容转化为机器可识别的内容[8]。这种技术将输入的文本转换为数字形式,然后使用预先训练好的模型来预测最可能的答案。ChatGPT 可以根据用户提供的关键词、问题或查询来执行基本的关键词检索操作。它可以搜索其预训练的文本语料库,找到包含相关关键词的文本段落或句子。接着,ChatGPT 可以从检索到的文本中提取信息、事实或知识。它可以分析文本并识别其中的关键信息,然后将这些信息组织为回答问题或生成响应的一部分。

模型的预测基于其先前接触的文本数据,以及对文本数据的理解和上下文的理解。当用户提出问题时,ChatGPT 将尝试在其训练数据中找到最相关的信息,并利用这些信息来生成一个回答。如果ChatGPT 无法找到相关的信息,则它可能会给出一个无法回答的答案或者询问用户是否需要更多信息。因此,ChatGPT 的知识检索和回答生成能力是由其训练数据的质量和数量决定的。针对此类问题,可以通过搜索引擎或学术数据库等途径获取与该问题相关的研究文献或知识点。

2.4 答案生成

知识检索后,需要将获取到的知识和信息进行答案生成,得到与问题相关的答案。在这个过程中,ChatGPT 模型可以通过生成式方法或选择式方法进行答案生成。这是通过深度学习模型和自然语言处理技术实现的,通常使用递归神经网络(如Transformer)的结构来生成自然语言文本。而且ChatGPT 提供的回答可能包含多个信息来源和角度,需要仔细解读并理解。如果回答不够清晰或者不符合预期,可以尝试重新提问或者重构问题,以获得更准确和有用的回答。

在进行答案生成时,ChatGPT 可以利用各种技术来提高其性能和效果。例如,ChatGPT可以使用文本生成微调技术来进一步改进其生成答案的能力。而且ChatGPT 还可以使用多模态数据,例如图片和语音,来生成更加丰富和全面的回答。同时,ChatGPT 还可以使用多语言技术来支持不同语言的输入和输出。需要注意的是,ChatGPT 的答案生成能力是有限的,它通常依赖于其预训练模型中包含的知识。对于一些问题,可能需要结合ChatGPT 与其他知识库或外部信息源,才能提供更全面的回答。此外,答案生成还需要模型在不断微调和改进中不断发展,以提供更高质量的回答。

2.5 结果评价

最后,需要对答案进行评价,判断答案的准确性和完整性。评价可以基于人工标注、自动评价指标等多种方式进行。例如,对于上述问题,“请描述人工智能技术目前的状态和未来的发展趋势”,可以通过专家评估或自动评价指标,判断生成的答案是否准确、完整。同时,用户也应该需要使用多个来源渠道和资源验证答案的准确性和可靠性。除此以外,还可以通过收集用户反馈来评估ChatGPT 对问题回答的质量。用户的满意度和反馈可以提供有价值的信息,帮助改进模型的性能。

对于生成问题的答案需要多方考证,而ChatGPT 作为人工智能发展到一定程度的产物,其为教育评价提供虚拟开放的评价空间、人人平等的评价思维、数据互通的教育评价平台等。最重要的是,人工智能时代的教育评价应该消除主体单一、错位等不利影响,激发多元评价主体参与的积极性[9]。与此同时,教育教学依据收集到的数据和设计好的评价指标建立符合实际情况的评价模型,综合运用算法建模和数据挖掘等技术对学生的学习成果和表现进行量化评价[10]。然而,我们也需要认识到,ChatGPT在各领域中的应用尚处于初始阶段,技术的作用并未得到充分发挥,也并没有实现真正意义上的人工智能。因此,要实现人工智能对于学术问题求解的应然之态,还需要夯实人工智能时代技术发展的支撑体系。

综上所述,ChatGPT 在学术问题生成过程中其严密的步骤促进了答案的有效性和准确性。虽说ChatGPT 作为人工智能系统的功能性价值彰显已经无需赘述,但其是否具有原本意义上的价值生成和价值创造的意义仍需讨论。尽管ChatGPT 在一定程度上加深了人类对于社会和未知事物的理解,但我们仍需考虑新一代人工智能所存在的伦理道德隐患以及其可能对社会各方面所产生的影响和变革,将其更好地与社会结合起来,打造一个更加和谐的人工智能时代。

3 应用策略建议

本文基于ChatGPT 模型,通过提出学术问题求解的案例,分析其在学术问题求解中的优势和不足。ChatGPT 模型具有快速、自动化回答问题,广泛的知识库,灵活性等优点,但也存在模型精度不够高、受限于知识库、无法进行推理和思考等不足之处。在实际应用中,我们需要结合其优势和不足,进行科学合理的使用,以提高学术问题求解的效率和准确性。可从以下三个方面进行改进。

3.1 技术干预修正

可以考虑通过增加知识库的规模和丰富度,提高知识的覆盖广度和深度;同时,也可以考虑引入多模态信息(如图片、视频等),丰富问题和答案的表现形式和内容;可以将该方法应用到其他更广泛的领域,如医学、法律等,满足人们对于知识的更多需求;还可以进一步探索如何将基于ChatGPT 的学术问题求解方法与人类专家相结合,提高答案的可信度和权威性。例如,可以将模型生成的答案交由人类专家进行审查和评估,以确保答案的正确性和可靠性。另外,ChatGPT 模型还可以通过增加数据集、优化模型结构等方式进一步提高模型的性能和效果,从而更好地满足学术领域的需求。此外,还可以考虑将该方法与在线教育、知识图谱等技术结合,打造更加完整和全面的知识服务平台。总之,基于ChatGPT 的学术问题求解方法具有很大的应用潜力和推广价值,未来可以进一步完善和优化,满足人们对于知识获取和解决问题的更多需求。

3.2 伦理风险规避

在训练和微调ChatGPT 模型时,确保使用的数据集是清洁和合法的,排除不当、恶意或不符合伦理规范的数据。定期审查和监控模型生成的内容,以检测并纠正不当内容,把控数据的过滤和审查工作。实施文本生成的限制,以确保生成的内容符合伦理标准。这可以包括设置最大文本长度、添加关键词过滤、限制敏感内容的生成等,有助于防止不适当的内容生成。与此同时,ChatGPT 的运行应该是透明的,用户应该了解它是一个自动化生成模型,提供有关模型如何工作的信息,以增加用户对模型操作的信任。社区和利益相关者提供模型的信息,包括数据来源、训练方法和微调策略。公开透明性可以帮助评估模型的伦理合规性。更重要的是,在部署ChatGPT 时,建立审查机制,对生成的内容进行人工审查或监督学习。审查员可以干预模型生成的内容,以确保符合伦理和法律要求。

3.3 评价体系分级

由于读者对快餐化出版物的强烈需求,机械式出版物的大量出现已经是大势所趋,这是弥补出版市场空缺的一个新的增长点。但是,机器生成内容主要基于已有的数据和模式,而不具备创造新知识的能力。这意味着机器生成的内容可能会显得相对缺乏创意和原创性。为了使机器生成的内容能够更好地与传统人类出版物竞争,确实需要制定两套评价体系,以改善机器生成和人类创作的现状。评价体系分级将有助于确保机器生成内容的质量,并为出版业提供了一种与传统出版物并存的途径。机器生成内容可以填补市场空白,但也需要以更高的标准来评估和监管,以满足读者和行业的需求。同时,这也促使内容创作者更好地使用技术,以创造更有价值的出版物。此外,还可以考虑制定专门的评审标准和建立相关的认证机构,以确保内容的质量和合规性。这将有助于创造一个更公平和透明的出版市场,同时鼓励创造性思考和知识传播。

4 结束语

当今时代,随着人工智能愈演愈热,Chat-GPT 一经面世便对各领域产生了颠覆性影响,现有研究对其进行了全面剖析,并取得了一系列有价值的研究结果。本文基于人智交互视角,对ChatGPT 的学术问题求解过程进行研究,发现该项人工智能技术仍不成熟,存在着知识有限、缺乏深层情感理解以及风险偏好等问题。因此,作为ChatGPT 等智能工具的创造者、使用者,人们要秉持“科技向善”的理念,持续改进技术,提高自身在利用人工智能生成技术上的专业素养,积极参与人工智能技术、数据挖掘等领域的专业培训,要主动与其他部门或学科协作,应对挑战,未雨绸缪,制订规划,为发展创造有利条件,使ChatGPT 能够更好地服务人类。

猜你喜欢
学术人工智能文本
如何理解“Curator”:一个由翻译引发的学术思考
在808DA上文本显示的改善
对学术造假重拳出击
2019:人工智能
基于doc2vec和TF-IDF的相似文本识别
人工智能与就业
数读人工智能
下一幕,人工智能!
文本之中·文本之外·文本之上——童话故事《坐井观天》的教学隐喻
如何快速走进文本