新医科背景下的医学物理STEM项目案例
——基于物理建模和频谱分析的音准测试

2024-01-12 08:46付旭洋胡东升吴怡锋符维娟曾文姣
物理实验 2023年12期
关键词:测者基频音高

付旭洋,胡东升,吴怡锋,符维娟,曾文姣

(1.复旦大学 a.医学院;b.物理系 上海 200433; 2.复旦大学附属中学,上海 200433)

STEM教育理念自20世纪80年代被提出后,在全世界范围内都受到广泛关注. 近年来,各国均出台了STEM高等教育政策和改革STEM课程的结构化以及培养学生的跨学科意识和能力[1]. 2017年,我国教育部也将STEM教育列入义务教育课程标准,倡导跨学科的STEM学习方式,将科学、技术、工程、数学有机融合,以项目学习、问题解决为导向,培养学生的创新能力. 与基础教育阶段的STEM教育蓬勃发展相比,国内本科生的STEM教育在认知、活动、成效等方面亟需快速发展[2]. 2019年,我国全面启动新工科、新医科、新农科、新文科建设,推动了卓越医学人才教育模式逐渐从“以生物医学科学为主要支撑”转变为“以医文、医工、医理、医X交叉学科为支撑”[3]. STEM教育的目标正是在学科交互融合的基础上提升学生解决实际问题的综合能力、创新能力与实践能力,而物理又是STEM教育的基础,因此在医学本科生的物理课程教学中落实STEM理念,对 “医学+X”复合型创新拔尖人才的培养具有重要意义.

复旦大学物理实验教学中心针对医学院本科生开设的医学物理实验课程已有十余年历史,自主建设了如压力传感器特性研究及数字血压计的组装、人造骨杨氏模量的测量、A 型超声原理及应用等的“三有”(有物理基础、有物理与医学的结合、有医学应用)医学物理实验,涵盖了生理物理量测量、医学影像原理、生物材料物理参量测量等医学物理分支领域[4]. 课程还有设计性医学应用实验模块,鼓励学生自主设计融合物理、医学、工程等多学科知识的实验进行探究. 综上,医学物理实验课程已成为实践STEM教育理念的平台.

疫情期间医学物理实验课程开设了居家实验“语音声谱和科学发声”,引导学生用频谱分析方法解读发声的物理过程. 选课的学生曾经在合唱团选拔过程中发现部分学生并不能意识到自己的音不准,于是在完成实验后萌生了想法:运用学到的发声物理模型和频谱分析方法,将主观感觉的音准转化成客观可视的数据,从而能够更方便地评价音准. 由此,学生在设计性医学应用实验中,以STEM项目形式综合运用跨学科知识探索了音准测试方法[5-6]. 本文以“基于物理建模和频谱分析的音准测试”为案例,呈现了医学物理STEM项目的实践过程.

1 音准测试STEM项目的设计思路

音准为歌唱中所发的音高,能与一定律制的音高相符. 常用钢琴判断人的音准:弹出1个音,要求被试者能够模仿出这个音高的音. 音准的学生不仅能正确模仿,也能听出其他学生是否音准. 音不准的原因,可能是声带控制能力较弱,也可能是辨音能力较差. 用发声物理模型和频谱分析方法设计音准测试项目的过程,体现了STEM教育的宗旨:以设计和探索为手段,运用科学与数学的思想,通过应用技术解决实际问题,并从中学习知识.

ADDIE模型被广泛应用于教学设计,包括分析、设计、开发、执行和评估5个阶段. 完成教学的3个核心问题:学什么,如何学,学的怎样. ADDIE 模型不仅仅是教学设计过程模式,更为要解决的问题的提供了思路[7],可作为STEM项目设计的依据. 如图1所示,ADDIE模式下的音准测试STEM项目流程中,将要解决的问题(音准测试)作为项目内容并对其分析,在建构音准测试物理模型的过程中设计如何去完成项目,利用频谱软件、问卷、数据分析等和统计手段开发和执行音准测试方案. 项目流程的各个环节之间互相协同、形成闭环,每个环节都可以评价和修改,促使项目流程不断优化.

图1 ADDIE模型下的音准测试STEM项目流程

最初的项目执行对象主要为选修2022年春季课程的医学生,项目任务为设计客观、有效的音准测试并和被测者的自我认知进行对照. 选修2022年秋季课程的物理系学生加入了项目团队,进一步完善了音准的物理模型,项目执行中恰逢初新冠病毒爆发,咽喉疼痛、声音嘶哑等症状严重影响了音准测试,因此增加了用音准来判断声带健康状况的项目任务.

2 音准测试的物理基础

2.1 发音器官的生理结构

人的发音器官可以分为3大区域:动力区、声源区、调音区. 如图2所示,动力区由肺、气管和横膈膜构成,主要负责产生气流,是语音的原动力. 声源区由声带和喉头组成,声带是2片富有弹性的带状薄膜,2片声带之间的间隙叫声门. 从肺部呼出的气流通过关闭着的声门时会引起声带的振动,气流被转变为一系列的脉冲信号(声门波),形成的声音也称为喉原音. 调音区是由口腔、鼻腔、咽腔等组成的弯曲通道(声道),将微弱的喉原音加工成具有意义的语音,有扩大音量和丰富音色的作用[8].

图2 人体发音器官的生理结构

2.2 发音过程的滤波器模型

如图3(a)和图3(b)所示,声门波在时域上是声脉冲,声门闭合和开启的快慢程度决定了声门波脉冲的形态[8]. 图3(c)为声门波的频谱,由一系列倍频组成,其中最低的频率f0称为基频,每个倍频的幅值逐级递减.

图3 声门波的波形和频谱

在声门波经过声道的传播过程中,频谱结构发生变化,如图4所示,部分特定的频率被加强形成频谱包络线的峰(称为共振峰),共振峰是识别语音的重要特征参量. 发“a”“i”“u”音时,声道形态不同,共振峰的位置和强度也不同,因此声道可以看作是具有特定调制性能的滤波器.

图4 发音过程的滤波器模型

2.3 人声音准的物理建模

声门波中的基频决定了音高,因此对音准的物理建模也就是探究声带的振动过程. 声带由声韧带、声带肌和甲杓肌等组成的对称结构,如图5所示,内侧白色为声韧带,中间绿色为声带肌,外侧为甲杓肌,肌肉能控制声带的紧张程度.

图5 声带的生理结构示意图

采用声带的双压振子模型[9],如图6(a)所示,一侧声带看作是2个相同的矩形薄板压电晶片黏结组成的双压振子,压电片的长度为L,宽度为W,厚度为H,黏接侧的极性相反. 将双压振子接入图6(b)所示电路来模拟图5中的右侧声带,压电片中的电场方向如图6(c)所示. 根据逆压电效应,左侧压电片极性方向和外电场方向相同,在x轴方向上拉伸,厚度H增大,由于压电片总体积不变,因此面积减小,即长度L和宽度W均减小.右侧压电片极性方向和外电场方向相反,在x轴方向上压缩,厚度H减小,面积增大,即长度L和宽度W均增大.黏结层的面积不变,左侧面积减小,右侧面积增大,因此双压片向x轴正向弯曲[图6(d)]. 再用同样的双压振子模拟左侧声带,上下两端连接,接入电路呈现对称弯曲[图6(e)]. 当撤去外电场后,压电片会沿x轴做弯曲振动,这与声带振动类似.

(a) (b) (c) (d) (e)图6 声带的双压振子模型

由弹性力学知识,双压振子矩形截面的弯曲振动方程为

(1)

其中,η为振动位移,ρ为振子的密度,r为回旋半径,E为振子的杨氏模量.

求解式(1),可得压电振子矩形截面的弯曲振动本征频率为

(2)

其中,γ为材料的泊松系数,i和j为振动阶次,

(3)

当i=j=1时,可得基频为

(4)

式(4)中,E/ρ是材料的比模量,反映了材料的承载能力,比模量越大,材料的刚性越大.由式(4)可知,决定声带基频的主要因素是声带尺寸(长度L和宽度W)及性能参量(比模量E/ρ).对于不同的人来说声带尺寸也不尽相同,例如女高音声带长度为11~19 mm,女中音声带长度为18~21 mm,男高音声带长度为14~22 mm,男中音声带长度为22~24 mm,男低音声带长度为24~25 mm. 不难看出男性比女性的声带更长,基频更低.声带的比模量由声带肌肉和韧带的紧张程度决定,紧张状态下的比模量更大,声带的基频更高.受过声乐训练的人可以在更大范围内调节声带的比模量,从而有更宽的基频范围,也就能在更宽的音域范围内达到音准.

2.4 钢琴音准的物理模型

钢琴是击弦乐器,按下琴键时琴槌敲击琴弦(若干长短、粗细不同的金属弦线),如图7所示.琴弦的—端固定,另一端紧绕在弦轴上,转动弦轴可调节琴弦的张力.

图7 钢琴的琴弦结构(三角钢琴)

琴弦受击时产生的振动主要为横振动,根据弦振动的驻波条件,其本征频率为[10]

(5)

其中,n为谐波次数,n=1,2,3…,l为有效弦长,T为弦的张力,σ为弦的线密度.琴键对应的音高,即为相应琴弦的基频

(6)

钢琴调音时,通过转动弦轴来提高或降低琴弦的张力,改变琴弦振动的基频,从而达到音高准确.

3 音准测试方案

3.1 声音信号的采集和处理工具

采用Adobe Audition软件进行音频采集和频谱分析,持续发音“a”, 其测量界面如图8所示.测量界面中右侧为频谱图,横轴为对数频率,纵轴为相对强度,图中第1个尖峰对应基频f0≈251 Hz,之后的尖峰依次对应各次倍频.频谱包络线的峰为共振峰,第一个共振峰在1 kHz附近,和图4中“a”音的共振峰基本一致.

图8 Adobe Audition软件测量界面

3.2 音准测试方案

由人声和钢琴的音准物理模型可知,基频由相应的结构参量(如声带的长度、宽度、厚度,琴弦的有效长度等)和状态参量(声带的比模量、弦线的张力和线密度)决定. 人耳在辨音时会将基频作为音高,不同的发音并不会影响人耳对于音高的识别. 于是,以合唱团的主观音准测试为参考,开发基于频谱分析的音准测试方案,具体流程如图9所示.

图9 音准测试流程

首先通过电脑模拟琴音和人声,测试并分析音准,确定测量方法的可行性和测量系统的可靠性. 设计包含音准自我认知和嗓子健康状态的调查问卷,收集足够的样本进行统计分析,探究音准自我认知、声带的结构参量和状态参量等因素对音准测试结果的影响,并检验双压振子物理模型的合理性.

4 音准测试和结果分析

4.1 不同音高下琴音和人声的音准测试

利用钢琴模拟器依次弹出4个音C#,F#,c#和f#,受过多年乐器训练、音准好的被测者模仿听到的琴音发声,用Audition软件分别录制琴音和人声,并做频谱分析. 测得4个音高下琴音和人声的频率(以下所有测量频率均指频谱中的基频),并和标准频率比较,结果如表1所示.

表1 不同音高下琴音和人声的频率

在1 kHz内,人耳的频率分辨率约为3 Hz,软件的测量不确定度约为1 Hz,总允许误差约为4 Hz,4个音高的琴音、人声测量频率及标准频率在误差范围内可看作一致.

4.2 不同发音的人声频率测试

被测者(音准好)在同一音高下依次发“a”“o”“i”“u”4个音,用Audition软件录制并做频谱分析,频率测量结果如表2所示.

表2 同一音高下不同发音的频率

表2的实验结果显示相同音高下,不同发音的频率基本一致. 大脑发出的音高指令调节了声带的紧张程度,而声门波的基频由声带决定,不同形态的声道对声门波频谱进行调制,改变了频谱的包络形态,但并不改变基频大小.

以上测试结果表明:音高由基频决定,音准好的被测者能在不同音高下都达到音准,由此音准测量方法的可行性和测量系统的可靠性得到检验.

4.3 新冠疫情下的音准测试

近年来与新冠病毒感染症状相关的“刀片嗓”“宝娟嗓”等热词刷屏网络,那么这对音准会产生什么影响?是否能通过音准测试来判断病毒感染后的声带状况?为此设计了音准测试问卷,在2022秋季大学物理课程班级进行发放,并用Audition软件进行频谱分析.

4.3.1 音准测试问卷和音高频率数据

音准测试问卷中,要求被测者模仿听到的4个不同音高的琴音,同时还采集了性别、乐理水平、嗓子是否存在不适以及音准自我认知等信息. 问卷发放后收到36份有效问卷.

问卷如下:

1.您的性别:

○a.男;○b女。

2.您的生源地:

________________

3.您是否接受过声乐训练?

○a.是;○b.否

4.您是否掌握1门及以上的乐器?

○a.是;○b.否

5.您的喉咙是否存在不适?

○a.是,且影响发声;

○b.是,但不影响发声;

○c.否,但前段时间存在;

○d.否,且前段时间也不存在.

6.您认为自己的音准是否准确?(测量中所发的音高,与标准的音高相符,称为标准)

○a.是;○b.否

7.您的录音请上传于此

________________

用Audition软件对问卷中的音频数据进行频谱分析,获得被测者的4个音高频率(基频),如表3所示,表中不同被测者以序号指代.

表3 新冠疫情下的音准测试频率

4.3.2 不同性别的音准分析

对表3中的C#(138 Hz)和f#(370 Hz)频率数据做散点图,如图10所示.

由图10可见,低音和高音的结果都表明在相同音高指令下,女生发声的频率总体高于男生. 成年男子声带长而宽,女子声带短而狭,女生的音高相对男生更高,符合2.3节中所述双压振子的音准物理模型. 图10还显示女生在高音区比男生更容易音准,男生在低音区比女生更容易音准.

(a)低音C#

(b)高音f#图10 低音C#和高音f#的频率分布图

4.3.3 嗓子正常状态下的音准自我认知比较

选取嗓子状态正常的音准测试问卷,根据音准自我认知分为音准和音不准2组,分别做音准曲线(频率-音高曲线),不同序号(被测者)的音准曲线以不同颜色显示,结果如图11所示. 考虑到辨音的灵敏度和软件的测量误差,标准对照曲线有一定的宽度,被测者的音准曲线落在对照曲线内,即视为音准.

(a)音准组

(b)音不准组图11 嗓子正常状态下的音准曲线对比

图11(a)的音准组测试结果表明,绝大多数被测者的音准曲线落在对照曲线内,和自我认知相符. 少部分学生开始的2个音存在一定程度的不准,可能是尚未“开嗓”,声带的紧张度不能很好地跟随意识,到第三、四个音声带恢复了应有的调节能力,表现为音准. 图11(b)为音不准组的测试结果,被测者的音准曲线在偏离对照曲线较大的范围内分布,但整体呈上升趋势,表明音不准的学生能辨识音高,也能调整声带紧张程度,但没有准确控制声带的能力,从而不能正确模仿音高.

通过比较不同音准自我认知的音准曲线,可以看出音准曲线不仅能衡量声带的紧张程度(状态参量)是否能和其结构参量共同形成某个音高频率[式(4)],还能判断声带紧张程度的调节能力,因此音准曲线提供了客观的音准测试方法.

4.3.4 嗓子不适状态下的音准自我认知比较

观察表3中19号被测者,自我认知音准,但4个音高的频率数值为129,178,201,210 Hz,越高的音越失准,问卷显示他嗓子不适. 由此,筛选嗓子处于不适状态的被测者,再根据自我认知分为音准和音不准2组,分别做音准曲线(频率-音高曲线),结果如图12所示.

图12(a)中,大部分音准好但嗓子不适的被测者,表现为和19号类似的失准,音准曲线主要分布在标准曲线下方,且失去了应有的上升趋势,越高的音偏离标准曲线越大,仿佛声带的紧张程度(比模量)很快就达到极限. 图12(b)中,嗓子不适音不准的被测者,音准曲线也主要分布在标准曲线下方,但总体更加平缓,声带几乎失去了调节紧张程度(比模量)的能力.

(a)音准组

(b)音不准组图12 嗓子不适状态下的音准曲线对比

新冠病毒感染临床表现为咽干、咽痛、咳嗽、发热等[11],声门和声带周围的黏膜也会充血水肿. 声带的液体含量增多、丧失弹性,而液体的杨氏模量为零,使得声带的比模量降低,大脑不能控制处于水肿状态的声带肌肉使其比模量增大到应有数值,无法达到应有的音高. 这就是图12中大多数被测者音准曲线处于标准曲线下方且失去上升趋势的原因. 网络上普遍反映“宝娟嗓”患者中,轻者表现为声音稍变粗/音调变低,这是声带水肿比模量降低的结果;重者表现为声音嘶哑,这是声带严重水肿已经无法振动的结果.

通过嗓子不适状态和嗓子正常状态的音准曲线比较,可以看出由音准曲线的上升趋势能客观评判嗓子状态. 比如8号和21号被测者,第一个音高频率显著小于标准参照,但是该学生自我认知音不准,因此仅从该音高偏差无法断定嗓子状态. 进一步观察2位被测者的音准曲线,几乎没有上升趋势,声带的紧张状态(比模量)不能跟随大脑指令而改变,由此可推测声带处于水肿等病理状态,失去了应有的弹性.

5 项目评价与反思

基于物理建模和频谱分析的音准测试项目是我校医学物理实验课程的设计性医学应用实验案例,将STEM理念融入到医学物理交叉学科探究实践中,能够体现以下几方面的教学成效:

1)培育学生的跨学科思维,为新医科复合型人才培养打好基础. 项目充分体现了STEM理念,综合运用了物理建模、解剖和生理、信号采集、频谱分析、乐理及问卷调研等理、工、医、文多学科知识. 项目的核心内容是建立基于音准曲线的音准测试标准,并拓展为非侵入的声带健康物理诊断方法,在多学科知识的“学以致用”中激发学生的创新意识和热情.

2)在ADDIE模式下学生始终处于观察、思考和决策中,提升了解决问题的能力. 项目评价“音准测试结果是否符合自我认知、是否反映嗓子状态”,作用于项目流程其他所有环节,提示学生在项目的每个环节根据评价结果进行反思和修正. 如,设计环节建构音准的物理基础时,尝试多种声带振动模型,最终选择能够对音准定量表达的双压振子模型;执行环节通过对比分析,确定以音准曲线和标准曲线的偏离程度以及上升趋势,来直观显示被测者的音准情况和嗓子状态.

3)跨专业的团队合作,锻炼了学生的协作和沟通能力. 医学院和物理系专业学生的思想碰撞和融合,通过网络问卷方式获取实验数据,从而发现音准曲线可以表征声带的健康状况.

项目中也存在不足之处,如设计问卷时仅选取了4个音高,且忽略了音高之间的固定关系. 对问卷获取的实验数据分析时发现,更加合理地选取音高可使标准对照曲线呈现线性,被测者的音准曲线则可以用定量的物理参量来描述.

6 结束语

STEM理念始终贯穿音准测试项目的全流程,要解决的音准测试问题源自生活,思考如何完成项目时需要综合运用物理、数学及生理学等多学科知识,开发音准测试方案时需要统计学、乐理等知识,执行音准测试方案时需要信号采集和频谱分析等技术. 学生在课程结束后仍可以继续参与项目,每学期也会有新的成员加入,形成了医学院和物理系跨专业、跨年级的项目团队. ADDIE模式下音准测试项目得到了持续的发展和优化,成长为医学物理实验课程的特色设计性医学应用实验. 学生在完成该项目的常规实验后已经具有一定的学科交叉意识和技能[12],因此有浓厚的兴趣来挑战和解决实际问题. 通过音准测试STEM项目的设计性医学应用实验,学科交叉和解决实际问题的能力得到了充分的锻炼. 也希望以该项目为案例,激发更多的学生参与设计性医学应用实验,设计出更多更有特色的医学物理STEM实践项目,为“医学+X”能力筑好根基. 该案例项目来源于生活,声音和个人密切相关,也适合转化为中小学基础教育阶段的STEM探究项目.

猜你喜欢
测者基频音高
语音同一认定中音段长度对基频分析的影响
基于时域的基频感知语音分离方法∗
里盖蒂《小提琴协奏曲》中的“双律制音高组织”研究
桥面铺装层对中小跨径桥梁基频影响分析
视功能检查辅助视标与辅助镜片的联合应用(三)
改进音高轮廓创建和选择的旋律提取算法
宽恕与宽恕干预在高校学生恋爱受挫中的运用
序列的蜕变——皮埃尔·布列兹室内乐作品《无主之槌》音高组织初探
45000kHz基频晶体滤波器
音乐是一种特殊的语言——聊聊音高的魅力