AI驱动下的个性化音乐治疗模式研究

2025-02-18 00:00:00刘凡
乐器 2025年1期
关键词:梅尔治疗师频谱

摘要:本研究旨在探讨如何利用人工神经网络和深度学习等AI技术,构建个体化的私人定制音乐治疗模式。研究提出的个性化音乐治疗模式主要由基于Transformer架构的治疗音乐个性化标注AI模型和治疗音乐个性化遴选与推荐系统两部分组成。尽管目前尚未有实验数据对该模式进行验证,但随着技术的不断升级,AI驱动下的个性化音乐治疗有望成为未来临床应用和技术开发的关键领域,因此,对这一话题的深入探讨已显得尤为迫切。

关键词:个性化音乐治疗" AI Transformer架构" 深度学习

一、引言

在传统的临床音乐治疗中,治疗师通常会使用固定的治疗音乐库,或根据与患者的深入交流和治疗需求,依照通用标准从治疗音乐库中选择合适的音乐作为处方。然而,实际应用中,由于患者的文化背景、需求层次、对音乐的理解与喜好,以及共情能力的差异,治疗音乐的选用标准需因人而异。这需要不断尝试以了解不同治疗音乐对患者的效用,并根据反馈调整音乐处方。然而,这种过程可能导致一定的负面影响:许多患者因病痛折磨,渴望快速有效的治疗,往往在接受到适用其个体的治疗音乐前就对音乐治疗失去信心,其周围患者也会对音乐治疗望而却步。如果仅采用单一的分类方式,根据所谓的普适性体系进行治疗,往往难以确保疗效。甚至因接受了与自身情况不匹配的治疗,错误地认为音乐治疗就是听听音乐而已。随着科技的进步,人工智能(AI)在音乐处理和分析中的应用前景日益广阔。将AI技术引入音乐治疗领域,可为个性化音乐治疗提供新工具和方法。因此,本文提出一种由AI驱动的个性化音乐治疗模式,为个性化治疗的实现尽微薄之力。

二、个性化音乐治疗模式设计

此模式由两部分组成,首先是基于Transformer架构的治疗音乐个性化标注AI模型,该模型由经患者个性化标注后的治疗音乐数据进行训练,生成与患者主观情感和客观生理表现高度契合的治疗音乐标注,并构建个性化治疗音乐数据库。其次是治疗音乐个性化遴选与推荐系统,该系统利用AI模型构建的个性化治疗音乐数据库,结合患者当前的生理和心理状况,进行针对性的音乐遴选与推荐。系统还可根据患者身心状况实时变化,动态调整治疗音乐,满足患者的实时需求。此外,该系统还可以根据每位患者的独特需求,建立特需治疗音乐库,从而确保治疗方案的最大包容性和有效性。此模式的流程设计如图所示:

三、基于Transformer架构的治疗音乐个性化标注AI模型

(一)治疗音乐个性化标注AI模型的作用与必要性

对治疗音乐进行特征标注与功能性分类是音乐治疗活动的重要基础,传统方法通常依照音乐的情感色彩或应用场景进行分类,形成具有普适性的标注、分类标准。然而,这些通用标准并不总是适用于所有患者。例如,明亮的大三和弦通常给人以愉快的感觉,而暗淡的小三和弦则令人感到沉闷;大调音乐能够激发斗志,小调音乐则容易引起负面情绪。尽管这些音乐色彩与情感共振似乎作为一种共识性标准存在于人类的集体潜意识中,但需要音乐治疗的患者常常表现出不同于常人的反应模式。他们对于音乐色彩的理解与接受外部情感共振的能力由于其特殊的心理结构无法与常人使用同一标准。因此,治疗音乐标注不应采用通用标准,而应基于患者的心理结构和情感需求进行个性化治疗音乐标注。

荣格认为,人类共有的意识原型和潜在心理结构,通过象征、文化符号(如音乐)表达出来,对人类情感产生普遍影响。但对于有特殊心理经历的患者,他们的个体潜意识可能产生了异质化,导致与集体潜意识产生冲突,从而对音乐表现出不同的情感反应。

弗洛伊德的精神分析理论揭示了潜意识的重要性。他认为,个体的心理行为和情感反应并不完全由意识控制,而是受到潜意识中未解冲突、压抑情感的支配。因此,患者对音乐的感触可能被这些潜意识力量所扭曲,导致与常人不同的情感反应。公认愉悦的音乐也可能因触及潜意识中的痛苦记忆,而引发患者焦虑或抑郁。

因此,针对不同患者进行个性化的治疗音乐标注、分类与选择,是确保音乐治疗有效性的关键。这种定制化模式不仅要考虑患者的当前心理状态和生理反应,还必须结合潜意识动机和深层心理冲突。传统治疗模式下,为每位患者制定不同的治疗音乐分类标准是不可能的。并且治疗师主要依赖患者的自我陈述获取信息,而这些信息往往只能触及表层意识。弗洛伊德认为,潜意识动机和心理冲突常隐藏在本我中,难以通过自我意识表现出来。治疗师因此面临巨大挑战,难以深入挖掘和理解这些深层次的信息,更难将其与治疗音乐进行有机结合。

然而,人工智能(AI)技术的发展为这一问题的解决提供了可能性。通过人工神经网络和深度学习技术,使用含有患者标注信息的治疗音乐数据进行模型训练与优化,AI模型能够识别音乐特征与患者身心状态之间的复杂关系,将音乐特征与患者的生理特征和心理表现进行数据耦合。更重要的是,AI可以处理那些隐藏在患者本我中的潜意识情感动机,将其与音乐治疗中的特定元素进行耦合。AI模型因此具备与患者行为高度一致的治疗音乐标注能力,能够对所有治疗音乐进行近似患者本人的个性化标注与分类,并分析其在作用于患者时可能引发的情感和生理变化。

这种个性化治疗音乐标注AI模式不仅提高了治疗音乐分析的精确性,还能为患者构建个性化治疗音乐数据库,使治疗师更好地理解患者需求,制定更加精准的治疗方案。AI模型还可以通过差异性学习和算法优化,根据患者的反馈动态调整标注策略,确保每位患者都能获得最适合的治疗音乐,从而最大化治疗效果。

(二)模型设计

得益于Google AI部门Magenta团队为我们揭示了使用通用Transformer架构模型进行音乐项目训练的可行性,以及其无需针对特定领域进行任何调节的优点[1]。将此架构扩展到同属于MIR任务的本研究中可谓是应时对景,相得益彰。

Transformer架构是目前应用于自然语言处理和其他数据处理任务的五大神经网络之一,它由Ashish Vaswani在其2017年的论文《Attention Is All You Need》[2]中提出。Transformer架构的主要优势在于其能够并行处理整个序列,提高计算效率,并且其特有的自注意力机制能够捕捉序列中长距离的依赖关系。有研究表明将其用于AMA自动标注(automatic music annotation)领域可解决CNN与RNN只能对局部特征提取和长程依赖的问题,而并行计算更是充分利用了GPU的计算资源。[3]并且Transformer中的自注意力机制(Self-Attention Mechanism),增强了Transformer的局部特征提取能力,使得Transformer能够更好地适应音频信号等前后联系紧密的数据。

综上,治疗音乐个性化标注AI模型采用Transformer架构具有其独特优势,通过采用Transformer架构进行个性化音乐治疗AI模型的训练,能够高效地完成治疗音乐标注与分类任务。

对于输入数据,选用梅尔频谱图与MFCC系数共同作为输入数据,梅尔频谱图为主要输入数据,MFCC系数为辅助输入数据,由于梅尔频谱图符合人类的非线性听觉特征,因此在与音乐或语音相关的AI模型中多作为主要的输入项。使用梅尔刻度滤波器组对信号进行处理可得到梅尔频谱图。随后对梅尔频谱图的幅值进行对数压缩,然后对压缩后的梅尔频谱图进行离散余弦变换(DCT),提取出一组倒谱系数,这些系数即梅尔频率倒谱系数(MFCC)。其二者针对不同的音乐特征具有各自独特优势。梅尔频谱图保留了更详细的频谱信息,可以更好地描述音频信号在时间上的变化,因而将梅尔频谱图作为主要输入数据。而选择MFCC作为辅助输入数据的原因在于其在语音特征提取中的优势,由于部分治疗音乐具有歌词,歌词的语义性无疑会对患者具有一定的暗示效应,因此使用MFCC作为辅助输入数据,可大大提高模型对音乐中具有语义性的歌词进行理解和分析。

(三)模型训练步骤

1.治疗音乐训练数据库的建立

在个性化音乐治疗中,治疗音乐本体始终为最重要且核心的部分。治疗音乐个性化标注AI模型训练的基础则是科学合理的治疗音乐训练数据库的建立。

治疗音乐具有广泛的定义,并非是一种特定的音乐形式,它是一种音乐的应用范围和价值概念。也就是说,无论何种音乐形态,只要被应用到了医疗和健康之中,它就可以被称为治疗音乐,治疗音乐不具备固有的音乐形式和音乐属性,在治疗音乐的使用场景中我们所重视的不是音乐的艺术、审美、娱乐价值,其最高权重表现为健康价值,也就是说治疗音乐的立足点在于人的健康,任何用于治疗行为中且能够对人体健康产生积极效应的音乐都可称为治疗音乐。

也正因治疗音乐几乎可以涵盖一切人类的音乐创作,所以在进行治疗音乐训练数据库的建立时,对治疗音乐的选择尤为重要,数据库应尽可能涵盖每一种音乐形式或是文化背景,唯有如此才能保证患者标注数据的完整性和可信度。

2.患者标注

采用E-Prime2.0软件在治疗音乐训练数据库中随机选择音乐进行播放,在音乐播放结束后由患者进行主观标注,主观标注项目选用常见的6种基础情绪,包括:快乐、悲伤、愤怒、惊讶、恐惧和厌恶。客观标注由音乐治疗师借助各项生理数据检测仪器进行标注,治疗师需实时记录患者接受每首治疗音乐时的各项生理参数变化,包括但不限于心率、血压、血氧饱和度等容易影响情绪变化的生理参数。

标注数据采用类似李克特五级量表的评价量表对计量项目变化趋势进行记录,记录项目分为1、2、3、4、5五级,3为无变化,1为显著降低或是十分消极,5为显著升高或是十分积极,2、4介于之间。

在完成治疗音乐训练数据库中所有治疗音乐标注工作后,将治疗音乐与对应的主观标注和客观标注进行数据整合,得到个性化治疗音乐训练数据集,使用此数据集对治疗音乐个性化标注AI模型进行训练。

3.数据预处理

数据预处理是治疗音乐个性化标注AI模型训练过程中的重要步骤,在此步骤需要进行格式转换、音频分段、降噪、归一化四个细分步骤。

使用Librosa库将个性化治疗音乐训练数据库中的音频文件统一转化为WAV格式;由于模型需要处理格式统一的项目,所以首先需要将音频数据分割成固定长度的片段,为保证统一,将所有数据库音乐分割为29秒;在此步骤对统一分割后的音频数据进行降噪处理,使用Spectral Gating算法进行降噪工作;继而归一化音频信号,以消除背景噪音和音量差异,确保音频信号的一致性。

4.输入数据提取

提取梅尔频谱图与MFCC系数作为输入数据,提取步骤如下:

(1)音频信号分帧:音频信号通常是连续的波形数据,为了处理和分析,首先需要将其分割成多个短时间窗口(帧);(2)应用窗函数:在每一帧上应用汉明窗函数,以减少频谱泄漏现象,防止信号在快速傅里叶变换过程中引入不必要的高频成分;(3)快速傅里叶变换(FFT):对每个分帧的音频信号进行快速傅里叶变换,将时间域信号转换为频率域信号;(4)将频率映射到梅尔刻度:使用梅尔刻度将线性频率轴映射到更符合人耳感知的非线性频率轴上;(5)应用梅尔滤波器组:在梅尔刻度上应用一组三角形滤波器,每个滤波器覆盖一部分频率范围;(6)计算对数功率谱:对通过每个梅尔滤波器的能量进行对数压缩,得到对数功率谱;(7)生成梅尔频谱图:将所有帧的对数功率谱排列在一起,形成一个二维表示即为梅尔频谱图;(8)离散余弦变换(DCT):对梅尔频谱图的对数功率谱应用离散余弦变换,生成梅尔频率倒谱系数MFCC。

5.模型训练与个性化治疗音乐数据

使用梅尔频谱图和MFCC系数作为输入数据至通用Transformer模型进行训练,最终得到的模型变为治疗音乐个性化标注AI模型。继而将治疗音乐输入至此AI模型之中,输出数据便为近似患者本人标注的个性化治疗音乐数据。

四、治疗音乐个性化遴选与推荐系统

在AI驱动下的个性化音乐治疗模式中,遴选与推荐系统是实现精准治疗的关键环节。此系统通过分析患者的生理和心理数据,结合个性化治疗音乐库中的音乐特征,计算每首治疗音乐与患者需求的匹配程度,并依照匹配程度进行排序后提供给音乐治疗师,由音乐治疗师结合自身观点与患者状况进行治疗音乐处方的制定。遴选与推荐系统通过分析患者的生理和心理数据,并推荐最合适的音乐。该系统由数据采集、特征提取、匹配计算、遴选推荐四部分组成。

1.数据采集与特征提取

数据采集是遴选与推荐系统的基础,系统需要采集患者的生理和心理数据,包括心率、血压、血氧饱和度、皮肤电信号以及情绪状态等;将原始数据转换为统一的表现形式,通过对患者生理和心理指标的标准化和归一化处理,将其同样转化为类似李克特五级量表的评价量表,进行患者需求特征集的构建,对患者的身心需求趋势进行表现。

2.匹配计算与遴选推荐

匹配计算是遴选与推荐系统的核心,系统通过提取到的患者需求特征集与个性化治疗音乐数据库中的特征标注数据进行相似度匹配。个性化治疗音乐数据库由治疗师使用个性化治疗音乐标注AI模型,对治疗音乐总库中的音乐进行个性化标注并整理而成。继而,系统采用协同过滤、余弦相似度、欧几里得距离和加权评分等方法评估每首音乐的适用性。根据匹配计算的结果,系统生成推荐列表。推荐列表按照匹配度从高到低排序,选择最适合患者的前几首音乐进行推荐。

五、余论

本文通过将人工神经网络、深度学习等AI技术引入个性化音乐治疗之中,提出新的个性化音乐治疗模式,通过个性化治疗音乐标注AI模型,构建患者专属的个性化治疗音乐数据库,并且借助治疗音乐遴选与推荐系统实现个性化治疗音乐的推荐。文章表明AI技术在个性化音乐治疗领域具有广泛的应用潜力,未来还可探寻如何将Suno、Stable Audio、MT3等AIGC音乐生成AI模型引入至个性化音乐治疗模式中,根据患者反馈实时生成治疗音乐。

参考文献:

[1]Gardner, Josh, et al. \"MT3: Multi-task multitrack music transcription.\" arXiv preprint arXiv:2111.03017 (2021).

[2]Vaswani, Ashish, et al. \"Attention is all you need.\" Advances in neural information processing systems 30 (2017).

[3]焦佳辉,马思远,宋玉,等.基于卷积注意力机制的双模态音乐流派分类模型MGTN[J].计算机工程与科学,2023,45(12):2226-2236.

作者简介:刘凡,海南大学硕士研究生在读

猜你喜欢
梅尔治疗师频谱
基于梅尔频谱分离和LSCNet的声学场景分类方法
一种用于深空探测的Chirp变换频谱分析仪设计与实现
女诗人梅尔诗集《十二背后》三人谈
2020年上海国际造口治疗师学校开始招生
上海护理(2019年12期)2019-02-11 07:21:11
一种基于稀疏度估计的自适应压缩频谱感知算法
测控技术(2018年7期)2018-12-09 08:58:22
上海国际造口治疗师学校通过世界造口治疗师协会教学评审
上海护理(2017年4期)2017-04-02 18:33:42
认知无线电频谱感知技术综述
上海国际造口治疗师学校第8期课程班即将开始
上海护理(2015年1期)2015-04-03 13:49:20
精神分析心理学反移情概念的发展及应用
学术交流(2015年1期)2015-02-25 12:47:32
盲人探险家触摸世界之巅
党员文摘(2014年10期)2014-10-14 23:50:35