智能时代教材复杂度的量化研究:以数学表达式为例①

2023-09-21 05:30郭玉峰
数学通报 2023年7期
关键词:表达式新教材复杂度

赵 四 郭玉峰

(北京师范大学数学科学学院 100875)

大数据时代,人工智能的发展推动了教育现代化建设,为智能化教材开发、智能技术助力教学、精准测评和个性化诊断等领域的发展带来了机遇和挑战.目前,教育人工智能化飞速进展,课堂教学、学生测评等与人工智能的结合稳步推进,然而课程与教材的智能化实施仍在摸索阶段.人工智能与课程教材的发展深度融合,将成为智能时代教育现代化的趋势.

1 研究背景:智能技术助力数学教材的量化评估

数学教材是数学课程的载体,在学校课程中处于核心地位,在教学中发挥着关键作用.与其他学科教材相比,数学教材有其独有的特点,它通过文字、图象和符号三类语言来建构数学知识,而数学符号则是数学教材中主要和广泛使用的一类语言[1],是数学高度抽象的一种表现.如何将教材中抽象的数学符号语言智能化、实现人机对话,是数学课程人工智能化首要解决的问题.数学表达式是数学教材中最具代表性的数学符号,它在问题解决与意义建构等方面占有重要地位.利用智能技术分析数学教材中的数学表达式,是助力数学教材智能化发展和评估的有效举措.

一个数学表达式是由几个运算符(operator)连接的运算元(operand)组成.运算元是指参与运算的元素,它可以是常数或变量,可以是简单的(单个运算元),也可以是复合的(一组运算元和括号内的运算元).运算符对表达式中的运算元进行逻辑或数学运算[2].复杂度是刻画数学表达式性质的一种很重要的方式,复杂度的概念一般在计算机领域出现.复杂度概念首先由前苏联数学家Kolmogorov提出,简单说就是一件事物的复杂度可以用该事物的最简单的表示方式所用计算机语言的长度来衡量[3].一般认为,描述一件事物的计算机语言的长度越长,该事物就越复杂.

数学表达式的复杂度是一种度量,可以用来比较两个数学表达式哪一个更简单.数学表达式复杂度的刻画,一定程度反映了数学教材的复杂度,是开展数学教材量化评估的重要指标.在中国知网上以“教材复杂度”或“教科书复杂度”为主题进行搜索,截止到2023年2月27日,仅有22条结果,这些研究大多涉及英语教材中的词汇、句法和文本的复杂度,没有关于数学教材复杂度的研究.目前与数学教材复杂度最为相关的,主要有课程教材难度的研究.例如课程难度模型,该模型涉及课程广度、课程时间和课程深度三个维度[4],并在数学教材以及其他学科教材内容中有具体应用[5][6].与课程难度模型相比,数学表达式复杂度的研究更凸显对数学内容的关注,囊括对构成数学表达式的元素和运算规则的分析,体现算法程序,而数学课程难度模型更关注教材整体情况,刻画的是教材难度.为此,本研究从数学教材中的数学表达式这一视角,探讨智能时代教材复杂度的量化模型及其应用的问题,以期对实现教材人工智能化以及定量深入分析教材的推进.

2 数学表达式的复杂度模型

本部分首先介绍了数学表达式的组合规则及其语法树,接着介绍了基于二进制λ-演算的复杂度模型.根据该复杂度模型,任何一个数学表达式都可以通过本文介绍的步骤计算出其复杂度的数值,以此直观刻画一个数学表达式的复杂度.

2.1 数学表达式复杂度的刻画

图1 数学表达式的语法树

表1 数学表达式的运算优先级

Awde等的数学表达式复杂度一定程度上反映了数学表达式的特点,但简单计算个数,会忽略运算元对数学表达式的影响.此外,语法树的深度只关注到根节点到叶子节点的最远连接路径的数量,没有完全反映数学表达式的运算优先级问题.基于此弊端,Su等[7]在此基础上做了改进,他们对数学表达式复杂度的刻画考虑到了运算元和组合规则的复杂度,较完整地体现了数学表达式的各项特点,尤其是基于二进制λ-演算(λ-calculus)的方法,来刻画运算优先级问题,具有一定独创性.λ-演算是Church在20世纪30年代开发的一个形式系统,在这个系统中,每一个可计算的数值函数都可以用无类型(untyped)的λ-演算来表达,反之,每一个可以用无类型的λ-演算定义的数值函数都是可计算的.关于λ-演算的具体内容,可以参考[8].

一个数学表达式的运算元的复杂度呈现了该表达式中数据的大小,而组合规则的复杂度呈现其结构的复杂程度,反映数学表达式的运算优先级问题,数学表达式的复杂度由这两方面来共同决定.本研究计算数学表达式的复杂度模型没有简单考虑运算元的个数,而是通过计算运算元在计算机中的储存长度来表示其复杂度;此外,该模型计算组合规则复杂度的过程保留了数学表达式的运算规则,是对数学表达式“深度”的刻画.

2.2 基于二进制λ-演算的数学表达式复杂度模型

本研究采用Su等[7]对数学表达式复杂度的刻画模型,基于二进制λ-演算方法,研究数学教材中数学表达式的复杂度.

Su等认为影响数学表达式复杂度的因素有三个:表示复杂度、计算复杂度和可理解性.本研究采用了他们的表示复杂度的计算方法.一个表达式的表示复杂度是人类感觉的表达式的长短,它主要与数学表达式的句法(syntax)和对称性(symmetry)有关.从句法构成来看,一个数学表达式可以由三个要素组成:运算符(包括函数)、运算元、运算符和运算元的组合规则(combination rules,即图1所示的语法树).其中运算元有三种类型:数字、变量(如x,y,…)和符号常数(如π,e,…),数字又可分为整数、小数和分数.对称性与运算元出现的次数有关,如果一个表达式中出现的不同数字、变量和符号常数较少,那么表达式的复杂度就会降低.一个数学表达式的复杂度通过运算元和组合规则的二进制存储长度之和来计算.

2.2.1 运算元的复杂度

表2 运算元的复杂度模型

2.2.2 组合规则的复杂度

数学表达式的组合规则体现了数学运算优先级问题,能反映数学表达式结构的复杂程度.利用λ-演算,可以充分刻画数学表达式的组合规则.λ-演算是有关函数的一个理论,这个理论将函数视作规则,并可以表示从输入参数到输出值的过程,这个过程由一个定义(λ-演算中的定义)来表示,λ-演算的一个最突出特点是其研究的对象可以同时是函数和参数[9].λ-演算只能呈现数学表达式的组合规则,而要计算组合规则复杂度还需利用二进制λ-演算的方法.利用二进制λ-演算方法计算数学表达式组合规则的复杂度分为三个步骤:首先,画出一个数学表达式的语法树,并将其表示成λ-演算的形式;其次,将λ-演算转化为de Bruijn符号;最后,计算数学表达式的二进制λ-演算,其长度即为组合规则的复杂度.

图2 无类型符号组合规则的树状结构

(1)λ-演算

在Su等的研究中,为了便于将数学表达式转换成de Bruijn符号,他们将任何一元函数(如sinx和cosx等)的λ-演算表示为λab.ba,任何二元函数(如x+y)表示为λabc.cab,任何一个三元函数表示为λabcd.dabc…….这里的λab.只是一个记号,仅仅代表函数由此开始,它是λa.λb.的简单写法,在这里与λ绑定的变量叫做绑定变量.我们以x+y和x+3y为例,说明他们表示λ-演算的方法.先将x+y的语法树中的变量、常数、函数替换成没有类型的符号(如图3),则它的λ-演算表示为λS2S3S1.S1S2S3.但是对于像x+3y这样的函数是复合的二元函数,其中嵌套了二元函数3×y,其语法树如图4所示,同样将其中的变量、常数、函数和子表达式替换成没有类型的符号,如图5所示.图5右下角嵌套的子表达式的λ-演算表示为λS4S5S3.S3S4S5.因此x+3y的λ-演算就可以表示为

图3 x+y的无类型符号的语法树

图4 数学表达式x+3y的语法树

图5 无类型符号的语法树

λS2(λS4S5S3.S3S4S5)S1.S1S2(λS4S5S3.S3S4S5).

λS1.S1(λS2.S2(λS4.S4(λS8.S8S11(λS13S14S12.S12S13S14)))(λS9S10S5.S5S9S10))(λS6S7S3.S3S6S7).

实际上,从数学表达式的语法树到λ-演算的过程是可逆的,也就是一个数学表达式的语法树可以表示为唯一的λ-演算,从λ-演算也能还原成唯一的语法树.

(2) de Bruijn符号

为了克服λ-演算中变量替换时出现的麻烦,de Bruijn开发了一个不同的符号系统来表示λ-演算,其中变量的出现是由整数来表示的,它给出了与绑定变量的距离,这样的表示可以消除变量的名称[10].例如,λab.ba的de Bruijn符号是λ01,λabc.cab的de Bruijn符号是λ021,其转化过程如图6所示.

图6 de Bruijn符号转化示意图

(3)二进制λ-演算

000101100001011000011000010110111000010110

1110110000101101110110000101101110110.

该二进制λ-演算的长度即为数学表达式的组合规则的储存长度,即组合规则的复杂度.

数学表达式的复杂度即为运算元的复杂度与组合规则的复杂度之和,现在利用以上方法计算示例中表达式的复杂度,其中运算元的复杂度为32,组合规则的复杂度为79,因此该数学表达式的复杂度为111.利用该模型,数学表达式的运算元和组合规则的复杂度都能在计算机中得以呈现,并可以通过输出数据来表示数学表达式的复杂度.这为后续对学生的学习情况进行评估提供了新的思路.

3 数学表达式复杂度模型在数学教材量化分析中的应用

3.1 研究对象的选取

考虑到“三角函数”是高中数学的重要内容,也是一类特殊的函数,具有较强的抽象化和形式化的特点,同时是刻画现实世界中周期性变化规律的模型.这一内容在高中数学中具有代表性,也能较为充分地体现高中数学表达式的特点.因此本研究选取了人民教育出版社出版的《普通高中课程标准实验教材·数学4》A版(以下简称“新教材”)的第五章“三角函数”,这一章节的目录如表3所示.考虑到5.5节是5.3节内容的拓展,我们的研究没有包含该小节.选取的数学表达式需满足以下规则:①至少应包含一个运算符;②将一个等式的等号两边的式子分别作为一个数学表达式;③连续的不等式拆写成简单不等式;④区间不作为数学表达式.

表3 新教材“三角函数”章节的目录

3.2 数据结果

3.2.1 数学教材中数学表达式复杂度的整体表现

根据数学表达式选取的四条规则,统计新教材在“三角函数”这一章对应小节的数学表达式,共得到577个数学表达式.按照以上计算数学表达式复杂度的模型对新教材中每个表达式的复杂度进行计算,得到新教材中数学表达式的复杂度的情况如表4所示.

表4 新教材数学表达式的复杂度

表5 各小节数学表达式的数量

表6 各小节数学表达式的复杂度

表7 新教材知识内容部分和例题部分数学表达式的复杂度

*这里的平均数代表每个数学表达式的平均复杂度

为具体比较新教材中数学表达式的分布情况与复杂度,对比新教材“三角函数”这一章各小节,以分析同一知识点下不同内容中数学表达式的区别与规律.同时依据数学教材特有的结构,分别统计教材中的例题部分与非例题部分的数学表达式,从数学表达式这一视角分析数学教材的特点.

3.2.2 数学表达式的复杂度在各小节的分布情况

3.2.3 数学表达式的复杂度在知识内容部分和例题部分的情况

新教材中知识内容部分的数学表达式共235个,例题部分的数学表达式共342个.数学表达式的复杂度在知识内容部分和例题部分的情况如下表所示.

3.3 数据结果分析

3.3.1 数学表达式的复杂度可以体现数学教材编制的知识逻辑

比较新教材各小节中数学表达式复杂度的数量及其平均数,对比情况如图7和图8所示.各小节数学表达式复杂度的分布呈现出一定的特点.其一,从数学表达式的数量和复杂度来看,数量最大的前两节分别是“三角函数的图象与性质”和“诱导公式”,这两节内容都属于三角函数的性质,是“三角函数”这一章的重点和难点内容;排在后两位的分别是“任意角和弧度制”和“三角函数的应用”这两节,其中“任意角和弧度制”是三角函数概念的预备知识部分.其二,数学表达式复杂度的平均数呈现的结果与数学表达式的数量和复杂度的结果不一致,“函数y=Asin(ωx+φ)”和“三角函数的应用”两节的平均数最高,这两节内容都涉及三角函数的应用问题,与现实生活联系紧密.

图7 新教材各小节数学表达式复杂度的数量

图8 新教材各小节数学表达式复杂度的平均数

一般来讲,学校教材在编撰时需要考虑学科自身的逻辑,尤其是针对数学这样逻辑性强、抽象性高的学科.在数学教材中,一章的内容是一个联系紧密、不可分割的整体,前面的内容作为后面内容的基础,后面的内容作为前面内容的应用.因此,一章内容的安排通常以“预备知识→主体内容→应用”的形式呈现.以上特点表明,数学表达式及其复杂度是建构数学知识的一类重要语言,数学教材中数学表达式及其复杂度的分布情况一定程度上反映了章节具体数学内容的性质.第一,章节主体内容部分,往往是教学的重难点内容,其数学表达式的数量及其复杂度通常更高;第二,章节预备知识部分,内容较为简单易懂,对学生的认知要求不高,因而数学表达式的数量和复杂度较低;第三,章节最后通常是这一章内容的综合应用,往往与现实生活情境联系紧密,解决现实生活中的问题涉及更加复杂的数学表达式,因此属于应用部分的内容其数学表达式的复杂度的平均数可能会比章节的其他部分内容要高,也就是使用了更复杂的数学表达式.

3.3.2 数学表达式的复杂度可以作为评估数学教材例习题质量的指标

学校教材的表层结构通常由课文系统与课文辅助系统构成[12],数学是学校的一门重要而特殊的学科,其结构一般由知识系统、助读助教系统和例习题系统构成[13].数学教材历来强调例习题系统的地位,例习题在数学教学中发挥着重要作用,因而例习题的质量也是决定数学教材质量的一大因素.从本研究的结果来看,数学教材中数学表达式的数量及其复杂度,以及复杂度的平均数,都表现出一致性的结果,即例题部分的数学表达式数量及其复杂度、平均数都比知识内容部分要高.该结果从侧面反映了数学教材重视例习题的特点,也呈现了数学教材的结构组织特点.数学表达式的复杂度的计算结合计算机领域的方法,呈现了数学表达式运算规则的特点,并直观刻画了数学表达式的复杂度,可以作为评估数学教材中例习题质量的一个指标.

4 结论与讨论

智能技术与教育的深度融合,推动了教育现代化的进程.立足于数学教材中的数学表达式这一视角,本文探讨了智能技术与数学教材研究融合的可能性.基于二进制λ-演算方法,对数学教材中的数学表达式进行量化分析,结合数学表达式的运算元和组合规则两方面刻画数学表达式的复杂度,呈现了数学教材中内容的分布特点与结构特色,反映了数学表达式的复杂度可以作为刻画数学教材质量的一种指标.智能时代加速了教育革新,数学教育研究需要在结合数学特点的基础上加强智能技术的应用,以推动数学教育的纵深发展.

4.1 数学表达式的复杂度为分析数学教材提供了新视角

近几十年来,教材的研究日益受到重视.国内早期关于教材的研究,主要集中在教材内容分析和教材难度分析等方面.近年来,研究者逐渐转向社会与文化视角的教材研究,强调通过分析语义结构、功能和形式去解构教材[14],重视对教材中语言的分析.本研究中构建的数学表达式复杂度模型,以数学教材的量化分析为立足点,探讨数学表达式这一符号语言的复杂度.数学表达式复杂度模型既能实现对数学教材复杂度的量化,也能呈现数学表达式构建数学知识的过程.国内探讨教材复杂度的研究多集中在语言学科,如有研究者以美国的选文评鉴指南为例,探讨了语文教材的选文复杂度研究[15],还有研究者聚焦大学英语教材的词汇复杂度,考察了教材册级之间的差异,为教材词汇复杂度级差提供了定量评价的方法[16].

数学教材的内容由文字、图象和符号三种语言建构而成,从定量的角度分析数学语言,客观呈现教材的复杂度为分析数学教材提供了新视角.数学表达式复杂度的运算结果,客观呈现了一个数学表达式的复杂程度,可以作为考查教材难度的一种指标;数学表达式复杂度的运算过程包含对数学表达式的组合规则的分析,组合规则中涉及的运算法则和运算定律,是数学运算推理的基础,因此数学表达式的组合规则在一定程度上反映了教材的质量.

4.2 数学表达式的复杂度为数学题目命制提供了新思路

教材是教学的重要资源,最终目标旨在促进师生的共同发展.可以从两方面考虑,一是为教师教学提供高质量的协作活动支架,帮助教师优化教学决策;二是为学生学习提供可视化的知识建构过程,促进学生对数学知识的理解和应用.

此外,不能忽视学生在数学学习上存在的困难,数学的强逻辑性和高抽象性特点,往往使得学生对数学有畏难情绪.有研究表明,相对文字和图形来说,学生对数学表达式的感知能力较弱[17][18],然而在表征数学概念时,学生对符号表征的倾向性较高[19].这说明学生能认识到数学符号在解决问题、建构数学意义过程中的重要作用,但数学表达式这类符号对学生来说并不直观.比如抽象的函数表达式一直是学生学习的难点之一,很多学生常常在学习函数的过程中对数学失去兴趣.本研究的数学表达式复杂度模型包括对构成数学表达式的元素及其运算规则的分析,教师在例题的选择和讲解过程中,可以借助对数学表达式复杂度的分析,为学生提供数学表达式分解和数学知识建构的可视化过程,提升学生对数学表达式的感知能力,促进对数学知识的理解.进而逐渐形成有效的数学学习方法,领会数学知识的魅力.

4.3 数学表达式的复杂度模型助力智能技术与数学教育的深度融合

智能技术对社会各领域的影响越来越大,教育是智能技术应用的一个非常重要的领域.针对数学这样抽象的学科,在与智能技术融合的过程中需要突破更多难点.智能技术与教育融合的根本目的是实现人的发展,这里的发展不仅指学生的发展,同样包括教师的专业发展.

智能技术在一定程度上将教师从琐碎的事务中解放出来,并在获取资源和进行教学决策方面为教师提供了极大的便利条件.但智能技术与数学教育的融合仍有广泛的改进与提升空间,比如智能技术不应仅仅停留在对主观题的数据统计上,还应能就学生客观题的答题情况进行分析,为教师巩固教学、有针对性的查漏补缺提供充足的依据.从本研究对数学表达式复杂度的分析过程看,未来的智能技术完全可以突破此局限,应用于对学生主观题作答的评估上.比如针对化简类题型,可以借助对学生解答中数学表达式复杂度的比较,分析学生的化简过程和结果,并为学生提供个性化学习分析.此外,利用本文的复杂度模型,可以将大量数学表达式输入计算机并计算其复杂度,形成不同数学表达式的表征层级结构,进而开展对学生的数学符号表征能力和对数学表达式的感知能力等方面的认知诊断.

随着时代发展和技术进步,智能技术与数学教育的深度融合,是未来数学教育现代化建设纵深发展的趋势,需要在数学和技术两方面突破局限.智能技术的应用,应逐渐从单一的数据可视化呈现和分析,转向充分结合数学特点进行精细化反馈,包括针对教师教学提供个性化教学决策和教学评估,针对学生学习进行精准化测评和个性化学习方法建议等,才能推动数学教育的纵深发展.

猜你喜欢
表达式新教材复杂度
《新课标·新教材·新高考》特别征文
体现新课标 用好新教材
挺立于课本之中的“树”
担当意识:历史新教材渗透不可或缺
一个混合核Hilbert型积分不等式及其算子范数表达式
表达式转换及求值探析
浅析C语言运算符及表达式的教学误区
一种低复杂度的惯性/GNSS矢量深组合方法
求图上广探树的时间复杂度
某雷达导51 头中心控制软件圈复杂度分析与改进