付建梅,任国凤,张雪英
基于运动疲劳下语音参数变化的研究
付建梅1,任国凤1,张雪英2
(1. 忻州师范学院 电子系,山西 忻州 034000;2. 太原理工大学 信息与计算机学院,山西 太原 030024)
运动疲劳的检测在运动科学界有着非常重要的意义,若没有科学的运动体系作为指导,运动过量对运动员的身体会造成严重伤害.基于语音的运动疲劳程度检测,研究了基于短时平均能量、短时平均幅度函数、短时过零率、短时自相关函数和梅尔倒谱系数5个语音特征参数在运动疲劳下变化的规律.实验结果显示,随着运动疲劳程度的加深,时域和频域语音参数的幅值均呈现不同程度的上升,其中语音信号中短时平均幅度升高得最明显,短时过零率最缓慢.2种不同程度运动之间,短时过零率的增长率最快,短时平均能量的增长率最缓慢.
语音参数;运动疲劳;特征选择;梅尔倒谱系数
运动性疲劳是大家在日常运动训练时都会产生的一种正常机体反应,若没有达到一定疲劳程度运动训练效果不佳[1-2],而运动过量,对身体有损害.长久以来,运动训练学界中人体运动疲劳产生的机制及其检测和恢复办法,是该领域所关心和研究的重点以及难点[3-4].因此,本文对不同运动程度下的语音信号的参数变化进行分析研究.
本设计的受试者为8名在校大学生.其中4名男生,年龄均值+标准差:22+0.72岁;4名女生,年龄均值+标准差:21+1.24岁,被测试者身体状况良好.
设计的运动采用跑步的方式,分别对受试者运动前、运动10 min后和运动30 min后的疲劳程度下进行录音,录音时间为3~5 s,录制的语音信息统一为“健康,平安,幸福”.本设计在Matlab软件平台下进行数据分析处理,提前在格式转换软件下将语音信号转换为WAV格式[5].
语音信号采集经过加窗分帧的预处理后,提取其特征参数[6-7].实验选取的时域参数包括短时平均能量、短时平均幅度函数、短时自相关函数和短时平均过零率.频域参数选择了梅尔倒谱参数.
语音信号特征提取的过程见图1.
图1 语音信号的特征提取
语音信号的短时平均能量反映了语音信号的强度,其实现框图见图2.
图2 短时平均能量实现框图
3种疲劳状态下全部8个样本短时平均能量的平均数据见表1.从表1可以看出,随着运动时长的增长,语音信号的短时平均能量也随之增加.相较于运动前,运动10 min后增长了51.6%,运动30 min后增长了60.5%.
图3 样本1的3种运动疲劳下的短时平均能量
注:average是每个运动疲劳状态的短时平均能量的平均值
表1 8个样本3种运动疲劳状态下短时平均能量的平均值
短时平均幅度的实现框图见图4.
3种疲劳状态下8个样本短时平均幅度的平均数据见表2.从表2可以看出,随着运动时长的增长,语音信号的短时平均幅度也随之增加.相较于运动前,运动10 min后增长了103%,运动30 min后增长了202%.
图4 短时平均幅度的实现框图
表2 8个样本3种运动疲劳状态下短时平均幅度的平均值
分别提取运动前、运动10 min后及运动30 min后3种运动疲劳下样本的短时过零率(见图5).图5中的average是每个运动疲劳状态的短时过零率的平均值.
3种疲劳状态下8个样本短时平均过零率的平均数据见表3.从表3中可以看出,随着运动时长的增长,语音信号的短时过零率也随之增加.相较于运动前,运动10 min后增长了14%,运动30 min后增长了30.9%.
图5 样本1的3种运动疲劳状态下的短时过零率
表3 8个样本3种运动疲劳状态下短时平均过零率的平均值
分别提取运动前、运动10 min后及运动30 min后3种运动疲劳下样本的短时自相关函数,其自相关函数的数值见图6(average是每个运动疲劳状态的短时自相关的平均值).
3种疲劳状态下8个样本短时自相关的平均数据见表4.从表4中看出,随着运动时长的增长,语音信号的短时自相关函数也随之增加.相较于运动前,运动10 min后增长了34%,运动30 min后增长了77%.
图6 样本1的3种运动疲劳状态下的短时自相关函数
表4 8个样本3种运动疲劳状态下短时自相关函数的平均值
分别提取运动前、运动10 min后及运动30 min后3种运动疲劳下样本的MFCC见图7(average是每个运动疲劳状态的MFCC平均值).
3种疲劳状态下全部8个样本MFCC的平均数据见表5.从表5中可以看出,随着运动时间的增加,语音信号的MFCC值也在增加.与运动前相比,运动10 min后MFCC值增加了24.3%,运动30 min后MFCC值增加了35.6%.
图7 样本1的3种运动疲劳状态下的MFCC
表5 8个样本3种运动疲劳状态下MFCC的平均值
通过实验运动疲劳后语音的短时平均能量、短时平均幅度函数、短时过零率、短时自相关函数和梅尔倒谱系数增幅见表6.
表6 5种语音参数不同疲劳程度下的增幅 (%)
从表6可以看出,语音信号中短时平均幅度升高的最明显,短时过零率最缓慢.2种不同程度运动之间,短时过零率的增长率最快,短时平均能量的增长率最缓慢.
[1] 任志强.运动疲劳下语音参数变化的研究[D].苏州:苏州大学,2015
[2] 李响,谭南林,李国正,等.一种应用语音多特征检测驾驶疲劳的方法[J].仪器仪表学报,2013(10):2231-2237
[3] 谭如坤.运动性疲劳产生机理、监测及恢复方法研究[J].湖北师范学院学报,2013(2):60-63
[4] 钱瑾.应用语音特征诊断疲劳驾驶的研究[D].北京:北京交通大学,2011
[5] 汪正创.基于MFCC的声纹识别系统研究[D].无锡:江南大学,2014
[6] 王敏,赵鹤鸣.基于多带解调分析和瞬时频率估计的耳语音话者识别[J].声学学报,2010(4):471-476
[7] 陈枢茜,严竞雄.基于BP神经网络的语音检测运动疲劳度的研究[J].信息与电脑:理论版,2019(5):156-157,161
[8] 陈枢茜.基于语音分析的疲劳度检测研究[D].苏州:苏州大学,2017
[9] 高明信.运动疲劳过程中脑电信号特征提取仿真[J].计算机仿真,2017(5):277-280
[10] 侯莉娟,胡 荣光,张吉敏,等.运动疲劳状态下GPi/SNr在基底神经节信息整合中的作用[J].北京体育大学学报,201(1):76-80
Research on changes of speech parameters based on exercise fatigue
FU Jianmei1,REN Guofeng1,ZHANG Xueying2
(1. Department of Electronics,Xinzhou Teachers University,Xinzhou 034000,China;2. School of Information and Computer,Taiyuan University of Technology,Taiyuan 030024,China)
The detection of exercise fatigue is of great significance in the sports science community.Without a scientific athletic system as a guide,excessive exercise can cause serious injury to athletes′ bodies.Based on the detection of speech fatigue level,the changes of five speech characteristic parameters based on short-term average energy,short-term average amplitude function,short-time zero-crossing rate,short-term autocorrelation function, and Mel cepstrum coefficient were studied under sports fatigue law.The experimental results show that with the deepening of exercise fatigue,the amplitudes of time-domain and frequency-domain speech parameters have increased to varying degrees.Among them,the short-term average amplitude of speech signals increases most obviously,and the short-term zero-crossing rate is the slowest.Between two different degrees of exercise,the short-term zero-crossing rate has the fastest growth rate.The short-term average energy growth rate is the slowest.
speech parameters;exercise fatigue;feature selection;Mel cepstrum coefficient
1007-9831(2020)07-0029-04
TN912.3
A
10.3969/j.issn.1007-9831.2020.07.007
2020-03-17
忻州师范学院教学改革项目(JGYB201914);山西省教课规划课题(GH-17053);山西省高等学校教学改革创新项目(J2019174);教育部“产学合作,协同育人”项目(201702091017)
付建梅(1987-),女,山西吕梁人,讲师,硕士,从事语音信号处理、数字信号处理研究.E-mail:379554284@qq.com