人工智能视域下母语写作评价的构想

2019-12-03 09:22蒋兴超江苏省南京外国语学校江苏南京210008
教学月刊(中学版) 2019年33期
关键词:母语人工智能作文

蒋兴超(江苏省南京外国语学校,江苏南京 210008)

史钋镭(江苏省南京外国语学校,江苏南京 210008)

人工智能时代的到来,以其便捷、智能、高效的优势,无孔不入。长久以来,母语写作评价都依赖于教师评价,存在种种弊端。人工智能可以替代教师,评价母语写作吗?人工智能写作评价,已广泛运用于英语写作,母语写作也能运用吗?本文基于人工智能评价研究的基础与现状,进行如下三层构想。

一、展望,人工智能评价与教师评价的现状与未来

(一)母语写作评价的现状与不足

母语写作评价,包括定量评分和定性评语两种评价方式。定量评价是对学生作文赋分或定级的评价,而定性评价是针对作文整体或局部进行或褒扬优点或指明不足的评语性评价。两种评价都从字、词、句、篇等方面进行量衡,主要涵盖内容、结构和表达三个维度。

现行的两种评价都是以教师为主导的评价(以下简称教师评价)。其缺点是评价者个人主观性较强,同一篇文章不同评价者的评价结果往往相差较大——这容易挫伤学生写作的积极性,误导学生写作的方向;数量极大的考卷容易让评价者产生阅卷疲劳,降低评价质量,教师也无法真实地把握学生写作中存在的问题与不足,难以对症下药等——这严重影响作文教学,降低了作文评价的效能。在此背景下,便捷高效的人工智能写作评价(以下简称人工智能评价),成为母语写作评价的时代之需。

(二)人工智能评价的原理与优势

人工智能视域下的写作评价是借助人工智能技术领域中一个分支,即自然语言处理(Natural Language Processing,简称NLP)技术。而自然语言处理技术,就是人工智能写作评价的核心技术。

自然语言即人类日常使用的语言,比如口语表达或书面文本。自然语言处理,就是利用电子计算机为工具对人类特有的书面和口头形式的自然语言进行各种类型的处理和加工的技术。以自然语言处理技术为主的各种自然语言处理系统,包括机器翻译系统、自然语言理解系统、自动检索系统、文字自动识别系统、数据库系统等。[1]

人工智能评价的基本原理是基于语言学专家开发的大型词法、句法和语义规则库,用人工智能技术对作文语境、词法、句法、语义以及篇章等进行多维度分析,从而解析作文的篇章结构、主题、通顺度、丰富度、修辞手法、错别字和语病等。

人工智能写作评价基本过程主要分为六步。第一步,获取。采用纸质文本扫描及文字识别技术获取原始文本并转为数字文件。第二步,标准化。对文本进行预处理,去除无关内容,保留待分析内容。第三步,分解词。采用分词技术将文本按词组分开,并构造文本树。第四步,词法分析。对名词、动词、形容词、副词、介词等进行定性。第五步,语法分析。分析主语、谓语、宾语、定语、状语、补语等句子元素。第六步,语义分析。分析句子、语段、文章的内涵,将其含义正确地表达出来。基于这六步,人工智能评价和教师评价一样,进行定量评分和定性评语两种评价。[2]

人工智能评价的优点是:智能,高效,评价稳定高,评价更公平,为教师、教学提供海量写作数据,更易对学生写作中存在的问题对症下药。

(三)人工智能评价的探索与机遇

国内人工智能评价的探索与建设有两类:一类是针对英语写作的评价,另一类是针对母语写作的评价。

先说针对英语写作评价的探索。最具代表性的是北京词网科技有限公司开发的批改网,已累计批改作文超5.3亿篇。批改网是智能批改英语作文的在线服务系统,它通过将学生的作文和海量标准语料库进行对比分析,能在1.2秒内对英语作文给出分数、总评、按句纠错的批改反馈。该系统能有效帮助教师提高工作效率,帮助学生有效提高英文写作能力。[3]针对英语写作评价的研究十分广泛,技术已十分成熟,被广泛运用到教学实践中。

再说针对母语写作评价的尝试。中国语言智能研发中心发布了一款智能批改系统——IN课堂语文作文批改系统,它使用可以扩展的“知识库”来解释学生作文的“一般逻辑”和“含义”,突出需要改进的文体、结构和主题领域的问题。系统能够读懂文意,注意到段落是否偏离主题。测试效果尚佳。[4]但这一技术尚属实验研究阶段,还未得到科学、广泛的认同。百度AI面向中小学学校教育,搭建百度智慧课堂云平台,为中小学教学提供了各种智能化服务,其中作文智能评阅系统,整合百度教育AI能力,尝试智能评阅服务。

随着人工智能技术的日臻成熟,相信人工智能将会成熟、广泛地运用到母语写作评价中,扮演十分重要的角色。

二、检视,人工智能评价和教师评价的实验与纠偏

(一)人工智能评价的原理学习与系统建构

深谙人工智能评价的方法原理。人工智能评价的方法原理,涵盖了信息采集技术、分解词技术、词法分析技术、语法分析技术、语义分析技术和标准化制定技术,这些技术融合了计算机、母语写作、评价研究、数据收集与分析等多个跨界领域。只有了解、研究、深谙这些技术与方法原理,才能建构科学的人工智能评价体系,在反复实验和纠偏的过程中才容易得心应手。

建构科学、高效、便捷的人工智能评价体系。构建科学、高效、便捷的人工智能评价体系有两种方式:一、基于国内已有的实验评测系统平台,对其进行实验、检验和再建;二、根据人工智能评价的方法原理,重新开发新的评测系统平台。无论何种方式,都需要多学科跨界技术的支撑和深度融合,特别是人工智能技术和母语写作的专业评价之间的互融、共建。母语写作的人工智能评价,可借鉴成熟的外语写作人工智能评价;母语写作有别于外语写作特殊的言语表达,更要求互融、共建的温度与效度。

(二)人工智能评价与教师评价的对照与修正

两种评价对照与修正的路径。首先,在多个地区、多所学校选择多个生源层次不同的实验班级,作为实验研究对象。其次,选取多种任务、多种类型、多种文体的写作,作为参照数据。然后,以教师评价和人工智能评价两种评价方式,分别进行赋分评价和评语评价。接着,对教师评价和人工智能评价进行对照分析。最后,以教师评价为基准,对人工智能评价存在的缺陷与不足进行修正、优化。对照、修正路径如图1。

图1

两种评价的多轮对照、修正与完善。上述对照、修正的路径,需多次、反复试验才能提高人工智能评价的准确性与稳定性。多次、反复试验,离不开如下几大要素:一、写作类型、文题与文体的多次转换;二、教师评价主体的多元构成,多次轮换;三、写作主体的多元组成,多样式写作的变换。在写作主体、评价主体、写作内容的多次调配、组合和变换后,两者评价的数据对照才更具可靠和稳定。基于此,修正和完善人工智能评价才更有价值和意义。

(三)人工智能评价与教师评价效度一致性的检验

人工智能评价的效度一致性检验。检验人工智能评价效度的具体方案如下:首先选择三个层次大致相同的教学班级,分别作为实验班级、对照班级1和对照班级2;然后,三个班级共同执行相同的写作任务;实验班级的写作评价由人工智能评价和教师评价共同完成,对照班级1的写作评价由人工智能评价完成,对照班级2的写作评价由教师评价完成;接着将实验班级、对照班1和对照班2的评价结果进行三方对比、分析;三方数据对比、分析后,再对学生和教师进行问卷调查、观察和访谈,了解、探究深层次原因,对人工智能评价进行完善;最后通过写作测验,再次检验人工智能评价效度的稳定性。检验人工智能评价效度一致性如图2。

图2

成熟的人工智能评价系统建设。人工智能评价体系建设路径为:系统开发——实验、对照、修正——多轮检视与完善——效度一致性检验——再实验、修正、完善——成熟模式。在多轮动态、变化的实验、检视中不断修正和完善,以至日臻成熟。这是人工智能评价走向成熟、得以推广的最为重要的环节,否则人工智能评价的准确性和稳定性都将大大降低,人工智能评价也终将是纸上谈兵。

三、融合,人工智能评价和教师评价依赖与共存

(一)人工智能评价给教师评价提供精准反馈

准确、稳定和成熟的人工智能评价,能给教师评价提供海量数据,作出精准诊断,反馈突出问题和典型案例,有利于教师精准化指导,有利于写作教学的精深化推进,还有利于教师评价的精细化开展。

人工智能评价提供海量数据。互联网的便捷与普及,使学生写作愈加拥抱和融入人工智能评价。长而久之,人工智能评价就能为教师提供海量的评价数据。海量数据涵盖了各种类型写作的真实样态、某一文体写作的现存问题、某类问题的症结之处、某个地区的写作状况、某所学校的整体水平、某个学生的大致走向……这些海量数据直观地呈现了写作水平、优点与不足,为及时矫正、精准推进提供了极大便利。

人工智能评价能作出精准诊断。人工智能评价精准诊断主要包括三个层面:一是对地域整体水平的诊断,比如这个地区写议论文可能说理不够有力,那个地区写记叙文描写不够细致;二是对某类主题、文体、任务驱动写作的水平诊断,例如亲情类主题写作、演讲稿的写作、情境任务类写作问题主要集中在哪里;三是对学生个人写作水平的诊断,比如某个学段、某种文体、某种类型的写作,以前和现在比是否有变化。这些诊断,为教师评价的刻意、集中关注提供了便利。

人工智能评价还反馈突出问题和典型案例。人工智能评价反馈学生写作中出现的某类突出的问题,比教师评价更容易及时、准确地找到短板,促使教师针对突出问题集中深研、改进和再评价,以至突破。人工智能评价发现学生写作的共性优点和典型案例,也容易被发现和放大,促进学生整体写作水平的发展。

(二)教师评价能补位人工智能评价的温度关怀

人工智能评价是以教师评价为基准反复实验、检校和优化后的智能标准化的评价。标准化的缺陷是缺少个性化,缺少温度。教师评价便补位了人工智能评价的这一短板。

教师评价的情感融入。人工智能评价的层级赋分和评语生成,有固化的思维与样式;而教师评语则有情感融入,这是人工智能评价所无法相比的。教师针对学生写作的内容,可以有深层次的对话和互动,或触发情思,或交流技法,或引动思考……融入情感的评价,更有温度和价值。归根结底,评价不是目的,而是手段,是为了将学生引向精神追求的高地,是为了激发学生写作的兴味,是为了促进学生写作能力的全面提升。而教师评价,无疑才更符合评价的终极追求。

教师评价的个性化辅导。和教师评价相比,人工智能评价更显得脸谱化、平庸化和平面化。教师评价能针对学生个体写作,进行立体的、多层面的、个性化的交互和指导。人工智能评价根据字词、句、段、篇评价语句、文段的连贯和文意情感的表达状况,而教师评价则能跨越这些平面的、浅表的评价,更加走向深层,更容易和学生个体形成深度交互,有利于学生个体的重审和再修,更易于学生个体的能力成长。

(三)人工智能评价与教师评价的融合发展

互补互鉴。人工智能评价发展到成熟和高阶阶段,将会和教师评价形成互补互鉴的局面。当大批量的作文批改降低了教师评价的效率与质量时,人工智能评价能发挥评价的客观性、稳定性与高效率。当学生个体写作需要精细化、个性化的辅助时,教师评价的温度、深层交互的优势就会派上用场。两种评价互为补充,共生共存。

因需而评。人工智能评价和教师评价,各有所长,各有优势。因不同的评价需要,选择不同的评价方式,是较为可取的做法。比如,大型考场作文批改,适宜采用人工智能评价,避免教师评价的主观性和随意性,发挥人工智能评价的客观性和稳定性,这样更公平。再比如,要解决班级长久以来存在的某一类写作问题时,适合采用教师评价,这样更容易集中发现问题,深究问题,攻克问题。再例如,常规写作训练,为了提高批改效率,及时发现问题,先采用人工智能评价,后采用教师评价,两者结合效率更高。

联动、融合发展。人工智能评价经过反复实验、检视和完善后逐渐走向成熟,但也不是一成不变的。教育改革的不断发展,也倒逼母语写作评价的变革发展。教师评价发展,必然联动人工智能评价的再调整与再适用,以至两种评价的再融合和再发展。到那时,评价就迈上了更高的台阶。

猜你喜欢
母语人工智能作文
母语
2019:人工智能
人工智能与就业
母语教育:从美出发
数读人工智能
下一幕,人工智能!
论《远大前程》的语言特色及其母语迁移翻译