戴莹莹 万雨亭
生成式人工智能技术,是指具有文本、图片、音频、视频等内容生成能力的模型及相关技术。(1)国家网信办等:《生成式人工智能服务管理暂行办法》,2023-07-10,https://www.gov.cn/zhengce/zhengceku/202307/content_6891752.htm,访问日期:2023-10-08。2022年底,OpenAI推出的ChatGPT使生成式人工智能引起公众的广泛关注。2023年上半年,GPT-4更是引起了学界大量的讨论。新一代的ChatGPT能够理解并生成符合人类自然语言习惯的“常识性、结构性、对话性”文本,能够与人展开自然、深入的多轮对话,是一种“革命性”媒介。(2)焦勇勤:《大模型媒介:ChatGPT引发的智能传播革命及其社会影响》,《海南大学学报(人文社会科学版)》,网络首发,2023年10月8日。新文科建设是新时期我国高等学校人才培养改革的重要战略,新文科建设的要义是推进哲学社会科学与新一轮科技革命和产业变革交叉融合,更新学科观念和思想,产生新兴的、深度交叉融合的学科专业,产出新成果,培养新的创新人才。(3)张福贵:《技术主义道路与传统文科的发展路向》,《山东大学学报(哲学社会科学版)》2021年第5期。毋庸置疑,将生成式人工智能融入新文科建设,是高等教育教学改革的需要,也是学科发展的需要。在新一代人工智能工具推广之后,传统文科的教学理念、教学目标、教学方式都将迎来巨大的改变。有人认为,生成式人工智能就是一个潘多拉魔盒,它的滥用可能导致学术诚信、知识产权以及路径依赖等问题,甚至可能对某些传统学科、领域带来颠覆性的冲击。有人认为,应该冷静、客观地看待新技术,生成式人工智能在很长时间内都无法颠覆任何一个学科。(4)一些学者认为,未来一二十年内,生成式AI无法完全取代人类学者,最多只能占据部分学术知识生成的份额。即使对一个小的学科分支而言,人工智能技术也远不能起到颠覆性作用。参见陈云松:《ChatGPT对人文社科研究的价值与挑战》,《探索与争鸣》2023年第5期;王峰:《生成式人工智能与文学知识系统的创新》,《文艺争鸣》2023年第7期。在新文科的发展建设进程中,应当如何正确认识生成式人工智能,理性应对生成式人工智能带来的机遇和挑战,将新技术有效应用于新文科建设,最大化服务教学、科研和复合型人才的培养,是当下需要思考的问题。
信息技术辅助文科教学和科研是近40年尤其是数字人文兴起之后的热点议题,只是学术史对这方面的梳理不够细致深入。(5)欧美“数字人文”这一概念在2004—2008年正式出现并流行,在2009年进入中国大陆和台湾地区。一些学者将从1980年代中国典籍数字化实践的开端到2009年“数字人文”进入中文世界之间的这段时间视作数字人文发展的“史前史”并加以研究。参见徐力恒:《华文学界的数位人文探索:一种“史前史”的观察角度》,《中国文哲研究通讯》2020年第2期;舒健:《拥抱“大数据”对历史研究的挑战》,载舒健编:《大数据时代的历史研究》,上海译文出版社,2017年,第1-11页;李友仁:《北美与西欧的数字人文中国研究状况论析》,《山东社会科学》2019年第7期;邱伟云:《我国台湾数字人文研究进程(2009—2017)》,《图书馆论坛》2020年第7期。由于中文文本信息处理的独特性,直到1974年“七八四工程”(汉字信息处理系统工程)建设和1981年《信息交换用汉字编码字符集》正式实施,计算机才具备处理中文材料的能力。1986年,我国的台湾地区也公布了通用汉字编码。(6)徐力恒:《华文学界的数位人文探索:一种“史前史”的观察角度》,《中国文哲研究通讯》2020年第2期。这是中文材料数字开发和研究的必要条件。从此,计算机和数字技术与人文学术的关系越发密切。1985年,中国社会科学院文学研究所开展了古籍数字化的初步探索,出版了《十三经注疏》《全唐诗》《全唐文》《大藏经》等典籍的索引或整理本,并完成了《十三经注疏》《诸子集成》以及部分朝代文学总集的电子化。(7)郑永晓:《钱钟书与中国社科院古代典籍数字化工程》,《山东社会科学》2019年第6期。但是,这些成果因最终以纸质书籍形式出版,那些“庞大的数据库本身除个别时段曾被少量学者试用外,其庐山真面目学界一直未能得见”(8)郑永晓:《钱钟书与中国社科院古代典籍数字化工程》,《山东社会科学》2019年第6期。。1990年,中国台湾史语所与计算中心合作完成“二十五史全文资料库”(后来扩充为“汉籍电子文献资料库”)(9)参见https://hanchi.ihp.sinica.edu.tw/ihp/hanji.htm。。1996年,香港中文大学建成收录先秦两汉至魏晋南北朝所有传世文献的“汉达文库”,后又收录出土文献。2005年,在此基础上成立“刘殿爵中国古籍研究中心”。(10)参见http://www.chant.org/。1997年,香港“迪志文化”与北京“书同文”两家公司开发制作《四库全书》电子光碟。“在其他更大型的资料库出现之前,‘汉籍’和‘四库全书’两个全文资料库可说是研究中国传统文史的标准配备。这些工作所起到积累数位资料的作用,为后来的数位人文时代奠定了重要基础。”(11)徐力恒:《华文学界的数位人文探索:一种“史前史”的观察角度》,《中国文哲研究通讯》2020年第2期。数字人文的兴盛、庞大的数据、便捷的检索,为文科建设带来了巨大的变化。
近年来,人工智能技术取得了长足的发展,并广泛应用于文科建设。2015年以后,“智能法学”或“人工智能法学”的概念出现。中国政法大学成立大数据和人工智能法律研究中心,北京理工大学成立人工智能法律研究中心,西南政法大学和上海政法学院均建立了人工智能法学院。(12)苏宇:《“信息技术+法学”的教学、研究与平台建设:一个整体性的观察与反思》,《中国法律评论》2021年第6期。2017年,会计、金融等专业开始出现人工智能的应用。(13)邹玲莉:《人工智能背景下会计人才培养面临的挑战与对策》,《经贸实践》2017年第7期。与此同时,浙江大学“智慧古籍平台”将基于大数据的计量统计、聚类查询、数据关联等技术和基于人工智能的OCR识别(“光学字符识别”)、智能标点和标引等技术相结合,以科技赋能古籍的保护传承。(14)《让古籍“活起来” 浙江大学“智慧古籍平台”上线》,2021-11-23,http://wwj.zj.gov.cn/art/2021/11/23/art_1639077_58878423.html,访问日期:2023-10-08。北大数字人文中心正在开发的“吾与点”古籍智能处理系统,其中的古籍文字识别、自动标点和分段等功能也是人工智能技术在古籍数字化中的应用。(15)《ChatGPT、人工智能与数字人文:传统学问的科技未来?》,2023-02-21,https://www.thepaper.cn/newsDetail_forward_21973969,访问日期:2023-10-08。
生成式人工智能产生之后,不断促进文科建设的更新迭代。ChatGPT发布不久,各大浏览器以及微软Office办公软件陆续植入相关插件,打开智能检索和写作的大门;许多笔记软件则配备了AI助手,能满足实时问答、图片转文字或对笔记内容进行名词解释等需求。以各类网盘为主的云储存产品也开通了智能助理,能够学习用户储存的文档和视频文件,并提供问答对话服务,能够总结文档内容、给出文档内容大纲、学习文档内容并给用户出题、撰写读后感以及观后感等,甚至能给出回答的文献或者视频出处。虽然这些回答的准确性有待提升,但在教育中应用生成式人工智能的趋势已然不可逆转。
2023年7月13日,国家网信办联合国家发展改革委、教育部等七部门发布《生成式人工智能服务管理暂行办法》(以下简称《办法》),自2023年8月15日起正式施行。该《办法》是全球首个有关生成式人工智能的监管方案。《办法》第二章第五条指出,“鼓励生成式人工智能技术在各行业、各领域的创新应用”,“支持行业组织、企业、教育和科研机构……在生成式人工智能技术创新、数据资源建设、转化应用、风险防范等方面开展协作”。(16)国家网信办等:《生成式人工智能服务管理暂行办法》,2023-07-10,https://www.gov.cn/zhengce/zhengceku/202307/content_6891752.htm,访问日期:2023-10-08。2023年9月7日,联合国教科文组织(UNESCO)发布《生成式人工智能在教育与研究中的应用指南》 (GuidanceforGenerativeAIinEducationandResearch,以下简称《指南》)。作为全球首个生成式人工智能应用指南,《指南》对生成式人工智能的态度是谨慎而友好的。它一方面提醒各国政府尽快出台相关法律法规,加强对生成式人工智能的监管,另一方面呼吁各国鼓励和支持学界和教育工作者在教学和研究中合理利用人工智能技术。(17)UNESCO,Guidance for Generative AI in Education and Research,2023-09-07,https://unesdoc.unesco.org/ark:/48223/pf0000386693,2023-10-08.
在后信息社会走向纵深之时,人工智能时代接踵而至,信息技术与人文社科的交叉融合趋势将进一步加深。从全球来看,数字人文、生成式人工智能在未来世界高等教育中将占有重要比重,如何提高师生的数字素养、借力生成式人工智能开启教育新篇章成为未来高等教育的重中之重。“新文科”是人工智能时代高校推进文科教育、教学改革的新路径,应在教学、科研等环节充分合理利用生成式人工智能。
过去,数字技术和人工智能虽然影响了文科研究和教学的各个环节,但通用性不强。举例来说,制作学术地图涉及的地理信息系统、社科研究常用的社会网络分析与统计工具等,仍然需要专业学习才能掌握。而生成式人工智能有望一站式解决问题,消除专业软件的使用门槛。一些学者对数字人文研究的评价很高,认为它代表了今天的学术正处于“向新学术转变与跨越的门槛上”,如同20世纪30年代开始的中国现代学术转型期那样。(18)史睿:《数字人文研究的发展趋势》,《文汇报》(上海)2017年8月25日。生成式人工智能的出现,不仅加快了学术转型的步伐,也全面推进了教育教学改革,为新文科发展带来了新的机遇。
在教育教学领域,生成式人工智能可能在新文科的教育格局、教育目标、教育理念、教学方法、教学内容等方面引发巨大的变革。首先,生成式人工智能改变了文科的知识生产方式,逐步推动了新文科教育数字化转型,改变了传统文科的教育格局。面对一个有可能“无所不知”的人工智能,教育工作者应当重新思考:人工智能时代文科的教育目标是什么?新文科教育如何在与人工智能的对话中寻求新的育人之路、发展之道?新文科建设需要什么样的人工智能学习和科研平台,需要什么样的新兴学科、专业、课程和学位授权点?
其次,生成式人工智能改变了传统的教学形式,为新文科建设重塑教学模式提供了时代契机。新的人工智能时代,为什么学习,学习什么,怎么学习?学校、课堂和教师的角色和功能将如何调整?过去的教学方法和教学内容还适用吗?如果生成式人工智能进入课堂之后,课堂对话是否会由师生之间的人际交流演变为师生与人工智能之间的“人机交流”?这些问题是新文科建设不得不面对的重要议题。以课堂教学为例,生成式人工智能将逐渐改变师生的互动方式,改变传统的教学方法。尽管生成式人工智能的总体发展还有很长一段路要走,但专门用于教育教学的大模型如各类EduGPT的技术突破可能会先一步到来。例如,华东师范大学计算机科学与技术学院EduNLP团队研发的教育领域对话大模型EduChat,能够支持多样化的教学场景,满足师生个性化的学习要求。(19)参见https://www.educhat.top/。值得注意的是,生成式人工智能具有针对不同特点的学生因材施教的能力,这是传统教育欠缺的地方。在2023第二十届上海教育博览会举行的“人工智能与教育未来”高峰论坛上,上海师范大学校长袁雯在以《教育强国:人工智能与教育之变》为题的报告中总结了人工智能服务教育本质的四个要点,也是对未来人工智能发展的美好展望,包括:提升学习效率,减少重复;关注个体,激发学习者的潜能;消除差异,促进教育公平;在集体中发现和培养人才。(20)《大咖说|上海师大校长袁雯:人工智能时代,教育之“适变”“自变”与“不变”》,2023-10-05,https://mp.weixin.qq.com/s/Wgyif9RBZGyPuDw4vKxJ4w,访问日期:2023-10-08。新文科建设中讨论的开放式学习、深度学习、精准学习、自主学习和个性化学习可能会提前到来。
最后,在教学资源、教学工具方面,生成式人工智能将逐渐改变信息获取方式,大幅提升教与学的效率。举例来说,生成式人工智能通过强大的数据检索和组织能力,可以在最短的时间内生成课程需要的文本、图像、音频或视频内容;辅助教师批阅作业,大大缩短教师的工作量。例如,专用于批改学生作文、针对性提出修改建议的“批改网”(智能批改英语作文在线服务系统)已经被使用多年。
在学术研究领域,生成式人工智能对新文科未来的学术范式、研究方法、研究问题以及具体研究工作的开展等将产生较大影响。首先,强大的计算量、庞大的数据量、智能的训练方法、快速的写作能力,推动着学术研究新范式(21)顾小清:《ChatGPT对教育生态的影响》,《探索与争鸣》2023年第3期。、新格局的出现,助推新文科数字化转型的持续性展开。2007年,计算机科学家吉姆·格雷就曾宣称,“科学世界发生了变化,对此毫无疑问。新的研究方式是通过仪器捕获数据或通过计算机模拟生成数据,然后用软件进行处理,并且将所得到的信息或知识存储在计算机中。科学家们只是在这个系列过程中的最后阶段才开始审视他们的数据。这种数据密集型科学的技术和方法是如此不同,因此值得将数据密集型科学与计算科学区分开来,作为科学探索的新的第四范式。”(22)转引自董春雨、薛永红:《数据密集型、大数据与“第四范式”》,《自然辩证法研究》2017年第5期。米加宁等学者认为,人文社会科学领域的四个范式分别是社会科学的定性分析、社会科学的定量研究、社会科学的计算实验的仿真研究、基于数据科学的大数据研究。(23)米加宁、章昌平等:《第四研究范式:大数据驱动的社会科学研究转型》,《学海》2018年第2期。同时,生成式人工智能还可以充当科研助理、PPT制作助理等角色。研究人员只需要向人工智能提问,就能从完整的知识系统中获取需要的那一部分内容。未来人文学者不需要掌握非常专业的编程技术,就能更深度地参与相关研究;涉古专业研究人员不需要深厚的目录学知识,就能快速浸入海量的古代文献之中。“人机交互”的研究方式、工作方式将大幅度降低专业门槛的要求,降低专业知识的束缚,推动跨学科、跨领域的学术研究快速到来。
其次,从研究方法和操作层面来说,根据指定专业、领域、主题、时间、关键词等信息,生成式人工智能可以快速查找文献资料,自动筛选代表性论文,生成文献综述和论文的常规结构,提供专业的写作指导,大幅度提高学术研究的效率。在选题调研阶段,研究人员通过关键词提问、命令,或进行持续的综合性问答,让生成式人工智能完成概念解释、资料检索和整理等基础工作,有助于研究人员追踪某一领域的科研成果和参考文献等。在研究中期,有较多工作量的任务如文本挖掘、情感分析、主题分析等也可以利用生成式人工智能辅助完成。对于需要较高思维水平的写作,人工智能可以辅助研究人员高效完成构思、素材收集、内容校对等基本环节。同时,生成式人工智能还能输出图像、音频和视频,这就为科研成果可视化以及演讲报告带来极大的便利。有的学者把这种科研工作方法称为人工智能对学术的“渗透”,甚至“入侵”。(24)王峰:《生成式人工智能与文学知识系统的创新》,《文艺争鸣》2023年第7期。2023年7月7日,Nature新闻栏目刊登的一篇讨论性文章称,在生成式人工智能的帮助下,科学家用了不到1小时就完成了一篇研究论文。(25)Scientists Used ChatGPT to Generate an Entire Paper from Scratch — But is it Any Good?2023-07-07,https://www.nature.com/articles/d41586-023-02218-z,2023-10-08.
最后,随着信息技术的不断发展,生成式人工智能将不断拓宽新文科的学术视野,开辟新的学术空间。以文学研究为例,未来由人工智能创作的文学作品会不断涌现,大量新的研究话题会不断产生,并对现有的创作和研究理论造成强有力的冲击。例如,元宇宙中的文学与艺术生产,作为读者的人工智能与接受美学,甚至人工智能的解释学等话题将逐渐从科学幻想走向现实。需要引起重视的是,生成式人工智能逐渐“入侵”传统写作领域。虽然目前人工智能还处于初级阶段,联想和想象的能力很弱,但从前些年微软“小冰”创作并出版的现代诗、清华“九歌”创作的古诗词到最近亚马逊平台上线的200多本署名为ChatGPT的电子书,(26)《“书籍海啸”时代到来:一切都不再是原创,但读者喜欢?》,2023-07-11,https://www.bjnews.com.cn/detail/1689042597169551.html,访问日期:2023-10-08。生成式人工智能表现出的“创作力”不容小觑。未来若将AI作家与传统作家放在一起评判,最高产的诗人不再是陆游、杨万里,而是一天就可以写几百首古体诗的AI作家。生成式人工智能同时还是阅读面最广的读者、掌握资料最多的评论家。这些都将为文学阐释带来新的讨论空间。
生成式人工智能的出现,使新文科建设迎来了重要的转折点。但是,生成式人工智能在广泛应用的同时,也带来了不可预期的风险和挑战。举例来说,生产误导性信息,侵害知识产权,因技术滥用造成的数据安全、数据污染等问题屡见不鲜。网信办联合教育部等七部门公布的《办法》第二章第七条明确要求生成式人工智能服务提供者要“依法开展预训练、优化训练等训练数据处理活动”,并给出具体要求,包括数据来源合法、不侵害他人知识产权、个人信息取用合法以及提高训练数据质量等。(27)国家网信办等:《生成式人工智能服务管理暂行办法》,2023-07-10,https://www.gov.cn/zhengce/zhengceku/202307/content_6891752.htm,访问日期:2023-10-08。这从一个侧面说明,当前生成式人工智能在真实性、准确性、客观性、多样性等方面仍存在缺陷。
从生成内容来说,目前生成式人工智能输出的内容仍存在真实性、准确性等问题,这与模型训练数据来源的复杂、算法选择的偏见甚至遭受恶意攻击等因素有关。在使用人工智能的过程中,人机需要进行多轮对话才能得到较为理想的内容。同时,生成式人工智能大模型训练时所用的数据过于庞大,一经预训练后又无法对数据进行检测,所以它们输出内容的过程缺乏透明度和可解释性。虽然总体方法(包括所使用的算法)通常是可以解释的,但特定的模型及其参数是不可检验的。目前尚不能够在GPT模型经过训练后将某条数据单独删除,(28)关于大模型训练数据无法删除,及其带来的递归风险、伦理问题等,参见UNESCO,Guidance for Generative AI in Education and Research,2023-09-07,https://unesdoc.unesco.org/ark:/48223/pf0000386693,2023-10-08.这就为将来的GPT模型带来了递归风险,即未来的模型在生成文本时,还可能会用到以前的模型生产的错误文本。因此,生成式人工智能输出的信息并非百分之百准确,甚至可能是虚假信息和恶意制造的信息。人工智能科学家的实证研究表明,ChatGPT可能在特定主题的对话中产生“幻觉”内容。所谓“幻觉”(Hallucination),即“模型可能会生成文本来描述现实中并不存在的情况,还可能会生成与常识或专业知识有冲突的文本”(29)参见Junyi Li,Xiaoxue Cheng,Wayne Xin Zhao,et al.,HaluEval:A Large-Scale Hallucination Evaluation Benchmark for Large Language Models,2023-05-22,https://arxiv.org/pdf/2305.11747.pdf,2023-10-09.柯沛、雷文强、黄民烈:《以ChatGPT为代表的大型语言模型研究进展》,《中国科学基金》,网络首发,2023年10月10日。,这对生成式人工智能的研究和应用均会产生负面影响。联合国教科文组织发布的《指南》指出,由于缺乏严格的法规和有效的监测机制,生成式人工智能输出的错误材料越来越多地在互联网上传播,增加了数据污染的风险。(30)UNESCO,Guidance for Generative AI in Education and Research,2023-09-07,https://unesdoc.unesco.org/ark:/48223/pf0000386693,2023-10-08.也就是说,在使用生成式人工智能的过程中,使用者需要有一定的专业素养。生成的内容不能直接用于教学和科研,否则那些错误、虚假、零碎的知识有可能在课堂上蔓延。学生以人工智能作为自学工具,也要小心谨慎地使用,避免在不知不觉中接受了肤浅或者错误的内容。
从生成方式来说,由生成式人工智能输出的内容可能存在侵犯知识产权、隐私权等问题。生成式人工智能的基础是大数据,而这些数据通常是从互联网上搜集、整理出来的。如何判定作者,是否侵犯知识产权,能否发表或者出版,对于教学和科研而言都是至关重要的。同时,无法在大模型中单独删除个别数据这一限制,(31)UNESCO,Guidance for Generative AI in Education and Research,2023-09-07,https://unesdoc.unesco.org/ark:/48223/pf0000386693,2023-10-08.也意味着个人信息一旦泄露就可能造成难以挽回的后果。研究人员、教师和学生应该对人工智能生成的文本和图像等的出处多加注意,谨慎判断、检验和使用相关资源。举例来说,人工智能撰写或提供思路的文章是否应当发表?使用人工智能创作的质量较高的内容,是否需要在文中提及?是否应署名人工智能?显然,全面禁止并不可行。目前,在新文科建设的背景之下,学界和教育界应该关注并思考如何将有关技术应用于教学、科研,如何实施长期有效的监管、审查,如何明确生成式人工智能可能出现的违规、违法行为,制定并及时更新相关行为准则,避免学术诚信在人工智能时代走向岌岌可危的局面。随着技术发展,作者撰写文章乃至编辑审核文章都可能会用到更多人工智能工具。彼时,期刊论文发表的各方面主体都应履行声明义务,给予读者明确的信息。(32)高奇琦:《知识革命还是知识堕化——ChatGPT与知识生成秩序》,《中国社会科学评价》2023年第2期。例如,标记人工智能生成的内容、承担的工作等。另外,有的行业已经开辟人工智能“专用通道”。2023年3月,完全由人工智能生成内容的新闻平台NewsGPT开始运营。这种运营方式,给新闻传媒等专业带来了巨大的冲击。
从技术应用来说,生成式人工智能减少了大量简单、重复、无趣的教学和科研服务,减轻了教师和学生的负担,无形之中也增强了人们对人工智能的依赖。对技术及其产品的过度依赖会逐渐改变人的思考和行为方式,在未来的新文科建设中需要警惕教师和学生基础知识与能力的弱化。举例来说,当下学生原典阅读能力普遍下降。从阅读目的来看,学生借助高度发达的互联网和信息检索技术,阅读变得更加功利,“直接后果就是对经典的疏离”(33)徐振:《教学过程中文学经典深入人心的四种路径》,《高等教育研究学报》2018年第2期。。从阅读方式来看,碎片化阅读成为主流阅读方式,浅尝辄止取代了深思熟虑。同时,学生借助各种基于原典二次创作的文本、图片、视频获得相关知识,制造出“伪阅读”(34)关于数字化阅读时代曾引起教育界热议的“伪阅读”现象,可以参考吴晞的介绍:“所谓‘伪阅读’,意谓不是真的在读书,而是假读书,尤其是不愿意下功夫研读大部头书、古文书、外文书。即便是一些以治学为生的所谓读书人,也只是热衷于走捷径、找窍门、浅尝辄止,或只是看一些零星的二手资料混日子。”参见吴晞:《“伪阅读”及其他》,《图书馆论坛》2016年第11期。的假象。互联网和数字技术的高速发展、古籍数据库的强大检索功能与学生经典原典阅读量不足、基础知识薄弱形成了鲜明对比。在未来人工智能庞大的数据库资源的支持下,这种对比会加剧。举例来说,2006年,谷歌推出了一款名为“谷歌写作”的AI写作工具,可以自动生成简单的文章摘要和标题;2009年,微软研究院推出了一款名为“小冰”的AI写作聊天机器人,可以进行自然语言对话和文本生成;2014年,OpenAI推出了一款名为“GPT”的AI写作模型,可以生成更高级的文本和文章;2016年,微软推出了“微软小冰2.0”,进一步提高了自然语言处理和文本生成的能力……从简短的自然语言对话到后来高质量文本的生成,AI写作的功能实现了质的飞跃。但是,AI写作的使用门槛低,它提供的海量信息和自动化生成可以帮助学生完成日常作业甚至撰写论文。学生为了达到完成作业的目标更倾向于使用人工智能,这在提高学习效率的同时,也减少了学生深度思考的机会,不利于学生学习迁移能力的发展。(35)朱永新、杨帆:《ChatGPT/生成式人工智能与教育创新:机遇、挑战以及未来》,《华东师范大学学报(教育科学版)》2023年第7期。同时,学生选择AI写作时可能对他人的作品形成侵权纠纷或剽窃抄袭,形成不良的诚信观和价值观。国内外一些高校禁止学生使用生成式人工智能,正是出于这种担忧。(36)易宪容:《ChatGPT对人类社会运行机制的四种影响》,《探索与争鸣》2023年第3期。
不仅如此,在生成式人工智能产生以后,以往数字人文研究中的“路径依赖”明显增强。学者们回顾数字人文“史前史”时期的研究发现,当今数字人文的主要研究方法即使用资料库及相关检索工具,很少有使用其他各类数字工具的动机,一定程度上造成了数字人文研究方法的路径依赖。(37)徐力恒:《华文学界的数位人文探索:一种“史前史”的观察角度》,《中国文哲研究通讯》2020年第2期。还有学者认为,从索引工具开发到全文检索,其研究逻辑依然是传统的,并没有范式上的创新。(38)项洁、翁稷安:《数位人文和历史研究》,载项洁编:《数位人文在历史学研究的应用》,台湾大学出版中心,2011年,第 18页。以 ChatGPT 为代表的人工智能出现以后,这种路径依赖非但没有减少,还将向纵深发展。
人工智能技术的快速发展正深刻改变着高等教育,也影响着未来的新文科建设。尽管它还有很多弊端,也存在着风险,但不可否认的是人工智能与新文科建设深度融合的时代已经到来。在这样的大环境下,怎样才能更好地利用生成式人工智能促进新文科的发展建设,是我们必须深入思考的问题。
从培养方案来说,在“新文科”建设的导向下,未来教育应以培养复合型文科人才为目标,重新思考教育理念、教学方法,优化学科体系和课程内容。教育变革的主要特点在于“从‘教的效率’转向‘育的本质’”,“从知识传承转向知识创新”。(39)朱世强:《人工智能驱动未来教育变革》,《中国社会科学报》2023年5月26日。教师要做的不仅是知识的传授,更是引导学生会学习、会思考、会创新。正确引导学生学习人工智能的运行原理和应用方法,学习人工智能时代迫切需要的技术和内容,帮助师生适应时代发展和社会需求。近年来,国内许多高校的文科院系都开设了与人工智能、数字人文相关的暑期学校、工作坊。例如,四川大学文学与新闻学院网络与新媒体专业本科生的培养方案里设置了“编程基础”这门课程,需要一定技术基础的社会关系分析和数据统计工具也成为专业学生必备的技能。浙江大学智慧古籍平台和学术地图发布平台连续几年举行暑期实践。这些实践一方面促进了平台的建设,另一方面也让学生学习并锻炼了古籍OCR识别、文本标注、地理信息系统运用等基础技能。2023年下半年,四川大学与哈佛大学将联合举办数字人文工作坊,旨在培养兼具人文学者问题视角与理工学者实践能力的跨专业高水平学术人才,并探索学科融合与文理交叉的边界。苏州大学还设想过成立数字人文专业实验班,以期结合数字素养和人文素养,重塑人文专业教学模式。(40)周毅、李卓卓:《新文科建设的理路与设计》,《中国大学教学》2019年第6期。值得注意的是,在新文科建设和生成式人工智能融合的过程中,教育者应更加关注教育公平、资源共享,尽量避免进一步加剧不同学生群体在技术和教育资源方面的差距。
从教学主体来说,要重视新文科背景下的教师队伍建设,充分提升教师数字人文素养。未来新文科课堂将融入更多的数字化、智能化资源,教师需要提升自身的数字人文素养,加强对生成式人工智能的学习和使用。举例来说,教师可以开展人机协同教学。在课前,教师可以利用人工智能整合教育资源、设计教案和收集学生信息;上课时,可以实时人机互动,开展课堂练习,及时获取学生反馈;下课后,人机协同批改作业,提高工作效率。教师与学生组成的二元结构真正扩容为“教师—机器—学生”三位一体的三元结构,教师的任务也将“由知识传授转变为知识创造”。(41)刘利、周小兵、高雪松等:《“ChatGPT来了:国际中文教育的新机遇与新挑战”大家谈(上)》,《语言教学与研究》2023年第3期。联合国教科文组织发布的《指南》建议世界各国通过培训和持续指导,加强建设教师和研究人员在教育和研究中适当使用生成式人工智能的能力。例如,新加坡通过其人工智能政府云集群(AGCC)提供了一个专门的平台以支持教育机构利用人工智能,其中还包括一个专门的GPT模型存储库。(42)UNESCO,Guidance for Generative AI in Education and Research,2023-09-07,https://unesdoc.unesco.org/ark:/48223/pf0000386693,2023-10-02.此外,应组建专门的教育教学数据库,训练专精于教育的生成式人工智能。有规划、有导向地控制数据来源,提高真实、准确数据的权重,清洗、剔除劣质数据,提高大模型的精准度,使生成内容具有可控和可验证性。高等教育方面相关的人工智能虽然还未出现,但可以用来训练的数据资源有很多,如各学科经典教材、原典名著,学术论著和学术检索数据库,线上课程学习平台以及各类数字人文成果等。
从学科建设来说,面对智能时代的诸多复杂问题,新文科建设应积极推动学科交叉融合和跨学科研究。目前,文科学科发展存在着一个重要的问题,就是学科之间的互动性不够强,交叉融合度不高。传统的学科划分日益细化,学科之间的隔阂也随之扩大,学科知识体系的整体性、综合性和全局性受到影响,形成了较为狭隘的思维方式与较为固定的学科范式——“孤立、静止、片面地研究某一领域”。(43)参见王丹:《人类命运共同体引领下的高校新文科建设与人才培养》,《华南师范大学学报(社会科学版)》2023年第1期;刘曙光:《新文科与思维方式、学术创新》,《上海交通大学学报(哲学社会科学版)》2020年第2期。不同学科之间的交流不足影响了学生知识面的拓展,复合型文科人才的培养受到阻碍。举例来说,可以加强文学学科与其他学科(如计算机科学、心理学等)的交流合作,可以通过组织各种类型的学术会议等形式建立跨学科交流平台,让来自不同学科的专家、学者有机会共同讨论问题,分享研究成果和经验,开展跨学科研究项目,利用计算机科学、数据科学等技术发展数字人文,减少人文社会领域中不同学科之间的隔阂,更好地理解和应对人工智能带来的挑战。
从技术规范来说,在新文科建设中应用生成式人工智能,必须制定和完善相关准则和制度。一是在理念层面,技术应用应坚持以人为本,重视人工智能技术可能带来的道德伦理和法律问题。二是在制度层面,国家相关部门应当加强信息安全建设,制定数据保护法规,保护个人隐私、防止数据泄露,并提供相关的维权渠道,切实保障个人的合理权益。针对道德伦理问题,可以设立由专家、学者、法律顾问等组成的人工智能伦理委员会,对人工智能的发展和应用进行监督。加强对教师和学生的教育引导,让他们认识到诚信与创新意识在人工智能时代的重要性,培养正确的价值观和道德观。三是在技术层面,研发可以检测生成式人工智能的技术产品,识别是否存在考试作弊、剽窃抄袭等问题,提高人工智能应用的透明度。
2010年之后,随着信息技术的快速发展,生成式人工智能逐渐成为学界和教育界的热门话题。时至今日,它已经成为新一轮教育教学改革的核心驱动力,正对新文科建设的方方面面产生着深远的影响。一方面,它给新文科建设带来了极大的便利,促进了新文科教学和研究范式的转型,引发学界重新思考教研的目标、理念、内容和方法等问题。另一方面,它也给新文科建设带来了很多挑战。生成式人工智能技术的不稳定性、不确定性和侵犯知识产权等问题层出不穷。面对人工智能技术的新发展,新文科建设乃至于整个高等教育应当持友好而谨慎的态度。“人工智能+文科”研究的核心归根到底还是在人,而人工智能只是一个辅助工具。哲学社会科学工作者在科研与教学中使用人工智能服务时要坚持以人为本的理念,正视人工智能带来的变革与风险,合理适当利用新技术,从价值导向、课程设置、教师培养、学科交叉等方面助推人工智能与新文科的建设。既要学习接受新技术和新问题,积极探索新领域和新方向,理解掌握新知识和新方法,还要谨防新风险和新挑战。