基音

  • 连续汉语语音的自动切分研究*
    技术、相干分析和基音周期轨迹检测等方法对连续汉语语音进行切分。另一类是基于模型的切分方法,该方法需要输入人工切分好的数据,对模型进行训练。张扬[3]等提出了一种基于时间长度的音节切分方法,利用高斯函数拟合音节的长度对音节进行切分。本文综合利用端点检测、语谱图分析、基音周期轨迹检测等技术研究了汉语连续语音的自动切分。研究了一种连续语音多级切分方法,计算流程如图1。图1 连续语音多级切分计算过程2 语音特征参数提取语音信号是一种短时信号,在短时间内可看作平稳信

    计算机与数字工程 2023年4期2023-08-02

  • 基于基音周期轨迹的连续汉语语音切分技术研究*
    。2.2 倒谱与基音周期谱倒谱的本质是频谱的频谱,能够反映频域中的变化特性,得到每一帧信号的基音周期与基音峰,是语音信号分析的重要特征[13]。将第n 帧语音信号的短时谱Xn(ω)代入式(3),可以得到这一帧信号的倒谱cn。式中IFFT代表傅里叶逆变换。为了观测基音周期随时间的变化,将每一帧的倒谱幅度转化为灰度,按照时间顺序进行拼接,即可得到基音周期谱,记为T。图2 为“那年正月新春”语音数据的基音周期谱图与对应的时域波形。图2 “那年正月新春”基音周期谱

    计算机与数字工程 2023年1期2023-05-12

  • 婴儿啼哭监测及安抚系统
    克风;端点检测;基音频率;啼哭监测照顾婴儿是一项辛苦的工作,婴儿往往会因为环境的轻微的变化而产生啼哭行为,需要父母去安抚,这耗费了父母的大量精力,影响了父母正常的工作和生活。随着语音识别技术的迅速发展,语音识别已经成为各类边缘嵌入式电子系统的重要感知手段。针对婴儿领域的产品也是层出不穷,其中包括针对婴儿啼哭声识别的产品。随着人机交互、语音识别、嵌入式等技术在智能家居领域的快速应用,出现了一系列高度智能化、便捷化的商业产品,诸如扫地机器人、小米音箱、智能门锁

    电子产品世界 2023年3期2023-03-22

  • 这就是为什么管风琴看上去能够违反声音规则的原因
    ,它将管乐器音管基音的波长与管长联系到一起。通常情况下,音管越长,它的基音就会越低。但是这个等式在实践中不成立。1根音管发出的基音总要比根據亥姆霍兹公式所建议的管长情况要低。修复这个问题需要为等式加入“末端修正”。在那些两端未封闭的管乐器中,诸如长笛与那些风琴,末端修复量是音管半径的0.6倍。为什么会这样,没有人能够说得清。这种情况在2010年得到了突破。乐器的生产及修复者伯恩哈特·埃德克斯(Bernhardt Edskes)在调整一台管风琴时发现音管镀金

    中国科技教育 2022年7期2022-11-22

  • 基于改进线性预测基音频率的语音情感识别系统
    方法,即线性预测基音频率特征提取方法,利用模型相同的LPC美尔倒频谱系数(LPC Mel cepstral coefficients,LPCMCC)[5]特征提取方法来改进,从而改善噪声干扰下所出现的情感分类模糊化问题,并设计基于改进特征的语音情感识别系统,测试此改进特征在实际生活中的应用价值。1 线性预测基音频率1.1 线性预测分析基于人的发音器官特点和语音产生的机理,构成了语音信号生成的数学模型[6]。而线性预测模型则是将数学模型进行简化处理,并提出了

    科学技术与工程 2022年26期2022-11-01

  • 对钢琴调律 若干基本问题的分析(下)
    列的频率都是与其基音频率成整倍数的。乐音及其泛音列是音乐中一个极为重要的自然现象,正是由于泛音列的存在,产生了一系列音乐理论,泛音列(古代西方称谐音列)是许多音乐理论的核心原理。在钢琴上,由于钢琴弦比较粗、硬,因而在发音过程中,会产生泛音偏离⑤。所谓泛音偏离是指在钢琴的泛音列中,其泛音的频率不与基音成整倍数,而是偏离(偏高)的。例如,A2的泛音列,理想的话应该为基音110Hz,上面的泛音分别与其成整倍数,为220Hz、330Hz、440Hz、550Hz、6

    乐器 2022年5期2022-05-29

  • 基于计算听觉场景分析的单通道语音分离方法*
    模型,该模型采用基音特性和幅度调制特性分别处理低频和高频区域,分离结果的高频区域得到了改善,分离效果得到了提高[5~6]。2010 年,Guoning Hu 和Deliang Wang 提出了用于基音估计和浊音分离的算法,即tandem 算法,该算法迭代的进行基音估计和二值模估计,可以准确地获得基音和目标语音的二值模[7~8]。2013年,基于tan-dem 算法,Guoning Hu 和Deliang Wang 提出了一种无监督的语音分离系统,该算法在完

    计算机与数字工程 2022年3期2022-04-07

  • 基于主体-延伸法的基音周期检测改进算法
    48)0 引 言基音周期是现代语音信号处理领域的一个重要参数,准确地提取和估算基音周期,是保证语音信号在人机交流中更有效地产生、传输、存储、获取和应用的一个重要过程[1-2]。基音周期检测在语音识别[3-4]、复杂时频域交换的语音分析与合成[5-6]、低码频率语音编码[7]、噪声环境下的语音识别[8]、听觉障碍的残疾人语言指导[9]等多个领域有着广泛地应用。不同应用领域下的基音周期检测算法会直接影响到语音识别的识别率、合成语音是否真实再现原始语音信号、语音

    西安工程大学学报 2022年1期2022-03-17

  • 基于计算听觉场分析的单声道的双人语音浊音分离*
    u和Wang检测基音的方法不同[9],考虑到语音的浊音部分具有准周期性,其频谱分布有规律,体现在倒谱域存在明显的峰值,本文利用倒谱域的峰值信息获取基音周期,再通过基音周期获取基音频率,之后依据浊音信号的谐波频率为基音频率的整数倍这一规律进行谐波拾取。重构时,对所得的频率信息进行反傅里叶变换,由于帧移的存在,还将同一基音周期轨迹段内的所有帧按语音帧的起始位置对齐后进行叠加,并按参与叠加的语音帧个数取均值,其重构过程如图2所示,最后所得信号即是要分离的单人语音

    计算机与数字工程 2021年4期2021-10-09

  • 车辆音频信号的时域特征方法分析研究
    基于自相关函数的基音周期估计进行研究,同时对车辆音频信号进行短时能量提取和基音周期的估计。1 车辆音频信号的时域特征提取方法■1.1 短时能量音频信号的短时能量反映了声音幅度的变化[4]。音频信号的短时能量的定义为:这个表示式也可以写为:■1.2 短时自相关分析定义音频信号xn(m)的短时自相关函数Rn(k)如下:这里K 是最大的延迟点数。■1.3 基于自相关函数的基音周期估计基音周期检测技术的主要方法有时域的自相关函数法、倒谱法、时频结合的混合法及其衍生

    电子制作 2021年7期2021-06-17

  • 基于变步长LMS减噪的基音检测改进算法
    引 言目前常用的基音检测[1]方法中,ACF法[2]易出现基音半频、倍频错误,AMDF法[3]常会出现均值下降的现象,倒谱法[4]的检测误差受噪声影响较大。针对上述方法在噪声环境下的检测精度不够理想的问题,近年来许多学者提出了改进的基音检测算法。潘峥嵘等[5]提出了将经过经验模式分解的AMDF与ACF进行加权的基音检测算法,有效减少了半频、倍频的错误,但其算法较为复杂。徐昕等[6]提出通过基于听觉掩蔽的多频带谱减法对带噪语音进行减噪,再利用多门限法判决清浊

    计算机工程与设计 2020年10期2020-11-03

  • 汉语连续语音切分技术研究∗
    通过对语谱图以及基音周期轨迹的分析,研究了一种音节切分的算法,能够有效提高汉语语音切分的准确率。2 端点检测技术语音的端点检测是指从一段原始信号中准确地找出语音信号的起始点和结束点[6]。它的目的是为了使有用的语音信号和无用的无声段与噪声信号相分离,增加后续语音处理的有效性[7]。目前广泛采用的端点检测方法是双门限端点检测技术[8]。本文基于对传统双门限检测法理论的研究,研究了一种多阈值检测方法,有效提高了端点检测的准确率。2.1 双门限端点检测双门限端点

    计算机与数字工程 2020年8期2020-10-14

  • 春风常化雨 润物细无声
    提出以“人”的“基音”为“向心力”来构建“人教”、“教人”、“为人教”的“三维一体”教学结构形态。关键词:人教;教人;为人教;基音;三维一体;结构形态文学家说“文学即人学”,那么音乐家会问;“音乐艺术是什么?”稍加思考就可得出“音乐亦即人学”的同样答案,纵观历史横看中外哪一部音乐作品不是写人的、人写的、为人写的,由此而知高中音乐欣赏教学中以“人”为“基音”是“有本之树、有源之水”。笔者在此借鉴“基音”、“泛音”构成一个完整的乐音音响,建构一个理论体系来闡述

    山东青年 2020年6期2020-07-27

  • 一种医用声觉报警信号输出算法及应用
    用程序,实现输出基音频率为500 Hz 的正弦音频信号及其2~5 次泛音信号。1 算法推导为了实现式(3)中的正弦信号,基于二阶无限脉冲响应(IIR)[14]数字滤波器原理,建立如式(4)所示的正弦信号递归算式。式中第(n−1)和第(n−2)步的计算结果分别乘以系数“p”和“q”后作为第n 步的输入。根据sin(A±B)= sinAcosB±cosAsinB 三角和差定理,将式(4)右边展开:令a[n]、a[n−1]、a[n−2]满足:得到:给定基音频率f

    电子科技大学学报 2020年2期2020-04-06

  • 基于DNN与基音周期的说话人识别
    的影响,采用基于基音周期的说话人匹配的辅助确认模式,通过建立注册人的基音库,利用DTW算法对测试人的基音周期进行个性匹配,辅助基于DNN说话人识别的主线识别。1.1 特征参数提取1.1.1 Fbank参数提取相比于MFCC特征,对数梅尔滤波器组特征更接近于原始特征信息,有利于DNN学习模型获取更具代表性的信息。所以本文直接采用对数梅尔滤波器组特征(Fbank)作为DNN的输入[11-12],图1是Fbank参数提取原理框图。图1 Fbank参数提取过程1.

    计算机与现代化 2020年1期2020-02-07

  • 基于多分类支持向量机和主体延伸法的基音检测算法
    00)0 引 言基音周期是语音信号的一个重要特征参数,能否准确地估计基音周期的大小在语音识别和分离、说话人识别及跟踪等语音处理应用中有着至关重要的作用。基因检测的典型方法包括自相关函数法、倒谱法、小波变换法、线性预测法,以及在此基础上衍生的多种算法[1-3],这些算法可以在无噪声或高信噪比环境下检测出被测语音的基音周期。但是,随着信噪比的降低,基音的线索会受到极大的干扰,导致算法在低信噪比境下不再适用。因此,低信噪比环境下的基音估计问题成为近年来该领域的热

    现代电子技术 2019年22期2019-11-20

  • 一种藏语连续语音声学特征参数提取算法研究*
    频率参数包括语音基音频率、共振峰、MFCC梅尔倒谱系数(Mel Frequency Cepstral Coefficents)参数等。在孤立词语音信号中单独的字或词的语音信号的音强、时长、能量分布等特征比较容易观察和分析,但是日常生活和实际的社会环境中使用的都是连续的语音句子,这些句子根据说话人的说话风格,语速、背景,情绪有很大的差异,因而藏语孤立字和词的声学参数特征提取已经不能满足藏语语音大数据智能化的需求,本论文在Matlab环境下对藏语连续语音数据提

    通信技术 2019年8期2019-09-03

  • 基于计算听觉场景分析的单通道信噪分离方法∗
    ,在这些方法中,基音周期都作为分离和组合的重要依据,因而待分离目标语音基音周期的精度对分离效果具有决定性影响。然而,目标语音的基音周期常常受到噪声的影响,尤其是在信噪比较低的情况下影响更明显[11],因此,如何得到鲁棒性的基音周期估计是一大难点,受到研究人员的广泛关注[12]。本文在提高基音周期准确性的基础上,研究了一条新的思路,先以语音信号的短时稳定性为依据利用傅里叶变换将其转到频域,每一时段内按浊音的谐波特性,以基音周期为依据进行同时组合,同一说话人时

    计算机与数字工程 2019年5期2019-06-01

  • 闭管音频在洞箫制作中的运用
    度。各音孔发出的基音也称“第一谐音”。一般的声音都是由发音体发出的一系列频率、振幅各不相同的振动复合而成的,这些振动中有一个频率最低的振动,由它发出的音就是基音。此外,开管和闭管二者产生的谐音列情况也不一样:开管能产生与基音成整数倍的谐音列,而闭管只能产生与基音成奇数倍的谐音列,即:如果设基音的频率为n,开管的谐音列为1n、2n、3n、4n……;闭管则为1n、3n、5n、7n……。二、同一点位上开管与闭管音频的对应关系洞箫是一端通透的开管,其发出的谐音列与

    乐器 2019年3期2019-04-10

  • 基于数学模型分析的小提琴谐音能量分布特性研究
    音,整弦振动产生基音,部分振动产生泛音,基音和泛音统称为谐音.其中,基音为1号谐音,第一泛音为2号谐音……以此类推.谐音的分布情况,是一件乐器所发出声音的质量一个的重要参考方面[1].研究谐音,对于研究乐器的音色有十分重要的作用[2],例如人耳可以根据谐音的不同来识别乐器或者是人声.因此,研究乐器谐音的数量、能量以及分布,对于调查乐器的质量、声音的音色以及指导乐器的制造等方面,有积极的作用.传统分析乐器谐音的方法,多通过不同的硬件如频谱分析仪,或者软件如G

    复旦学报(自然科学版) 2018年3期2018-07-26

  • 基于Hilbert?Huang变换的语音合成基音标注搜索新算法
    语音合成系统中,基音标注的准确性是一个非常重要的因素。针对传统的短时自相关函数和小波算法准确性不高和没有自适应性的缺点,提出一种基于Hilbert?Huang变换的基音标注方法。该算法通过Hilbert?Huang变换分析语音,具有自适应性,根据自身情况选择基函数,分解过程满足条件自动停止。采用文中自适应算法对整段非平稳语音信号进行基音标注,其中浊音段、过渡段采用Hilbert?Huang变换进行标注,清音段、非语音段用相近基音周期插值。实验证明,相比自相

    现代电子技术 2018年12期2018-06-12

  • 基于小波减噪的基音检测改进算法
    241000)基音检测是指对语音信号基因周期或频率的这一特征的检测[1]699,在语音识别、语音编码、语音合成等语音应用方面具有非常重要的作用[2]223。目前基音检测存在的主要问题是,当受噪声影响时,带噪语音信号的信噪比急剧下降,从而导致基音检测准确度降低[3-4]163。针对此问题,目前国内外采用的方法主要有两类:直接法和间接法。其中,直接法是指对带噪语音信号直接利用相关算法进行基音检测;如文献[2]223提出一种新的基于经验模式分解的平均幅度函数与

    安徽理工大学学报(自然科学版) 2018年2期2018-05-25

  • 结合EMD与DWT-ACF的语音基音周期检测改进算法
    243002)基音周期检测是语音信号处理中的重要步骤之一,它在语音识别、语音情感识别、语音合成以及语音编码中有着广泛的应用[1]。于是,精准的基音周期检测就具有非常重要的意义。目前的基音周期检测方法有自相关函数法(Auto Correlation Function,ACF)[2]、平均幅度差函数法(Average Magnitude Difference Function,AMDF)[3]、倒谱法[4]、线性预测系数(Linear Prediction

    噪声与振动控制 2018年2期2018-05-11

  • 基于自相关函数的钢琴乐音改进识别算法
    钢琴乐音信号是由基音及泛音共同组成的,而决定其音高的是基音,因此基音周期的检测是钢琴音符识别的关键所在[1-2]。基音周期的检测的方法主要包括频域识别和时域识别,短时自相关法是一种经典的时域检测算法,它计算简单,应用广泛,但是该算法会发生基音倍频或半频错误。在此基础上,在计算自相关函数前进行三电平中心削波运算是一种经典的改进算法[3-5]。由于该运算去除了各个音符能量相对集中在中心区域的部分,保留了在峰值附近的能量,因而可以减少计算量,加快运算速度,同时,

    武汉工程大学学报 2018年2期2018-05-03

  • 基于Android平台的听曲绘谱研究及其实现
    计乐音的频率,即基音周期。国内有很多学者在基音周期的提取方面进行了研究。高戈等提出了一种基音周期估计算法,以实现甚低码率下的透明质量语音编码[2]。黄海亮等利用人工神经网络和动态规划算法提出了一种高精度的基音提取方案[3]。徐国庆等提出了一种音乐识别方法,为实现自动作曲系统提供了较高的识别精度[4]。成新民等通过线性变换等方法将求取“最小谷值点”转换为求取最大值,实现了精确的基音检测[5]。翟景瞳等基于自相关处理和快速傅里叶变换(FFT)提出了一种的改进的

    电子世界 2018年7期2018-04-26

  • 泛音率与德彪西的和声思维
    。如果以“C”为基音,其泛音列应为C→c→g→c1→e1→g1→bb1→c2→d2→e2→#f2→g2→a2→bb2→b2→c3。泛音率中的音并不是每个人都能听到,但是它确实存在。一个八度中有十二个半音,而以某个音为基音所产生的泛音中并没有完全产生所有的十二个半音,比如以“C”为基音所产生的泛音列中就缺少了十二个半音中的#C(bD)、#D(bE)、F、#G(bA)四个音,在德彪西的和声思维中这四个音就属于“调外体系”。德彪西认为泛音与基音之间的距离越近,两

    黄河之声 2017年9期2017-07-31

  • 基于改进小波变换的语音基音周期检测
    进小波变换的语音基音周期检测吴兴铨1,2,周金治1,2(1.西南科技大学信息工程学院,四川 绵阳 621010;2.西南科技大学特殊环境机器人技术四川省重点实验室,四川 绵阳 621010)基音在许多方面都有比较广泛的应用,比如语音编码、语音识别、语音转换、音乐检索以及发声系统疾病诊断等。针对目前很多小波变换方法在测量基音周期时存在的准确度低、复杂度高、鲁棒性差等缺点,以及在带噪语音环境下,特别是在非平稳噪声下比较难判断语音基音周期的问题,提出了一种基于改

    自动化仪表 2017年6期2017-06-23

  • 浅谈中国美声怎样冲出围城
    、声音的气质以及基音摆放三个方面。1.后背唱法:之前没人提及此方法,偶尔有人说起也是轻描淡写的几句,笔者通过反复研究发现了这一唱法。唱法要领1:在灵活的掌握了胸腹式唱法后,一定要用意念将其唱法引导转向后背,也就是所谓的后背唱法。方法是:每次吸气都到达后背,在发声的一刹那有翻起动作,也就是后背长了一对翅膀,时刻有要飞翔的冲动。水平达到一定程度后,也就尽量不动用可控肌肉(上腹),人是可以自由控制身体前面这些部位,只要可以控制,就一定或多或少带来紧张感;人们平日

    黄河之声 2017年16期2017-01-28

  • 基于Android语音信号处理教学平台的设计
    等。2 语音信号基音检测技术基音周期是语音信号处理中的一个非常重要的参数,能够准确地检测出基音周期对语音信号的分析、合成、编码以及识别,具有重要的意义[1]。短时自相关函数法和倒谱分析法是基音周期估计较为常用的方法。本节基于SEPH系统,探讨在基音检测教学中如何利用语音分析技术对实际的语音信号进行分析与检测。2.1 基于倒谱分析法的基音检测语音信号的倒谱分析是估计语音生成模型的有效方法,通常用于语音编码、合成、识别等方面[2]。根据语音产生理论,语音信号s

    实验科学与技术 2016年5期2016-11-12

  • 改进LVAMDF及综合多因素基音检测算法
    DF及综合多因素基音检测算法薛帅强,陈波,陈菲(西南科技大学 计算机科学与技术学院,四川 绵阳621010)在对语音信号静音、清音、浊音划分的基础上,针对语音信号周期特征明显段分布随机性问题,提出改进的变长度平均幅度差函数LVAMDF及综合多因素基音检测算法,该算法对语音信号进行周期特征明显段和周期特征不明显段的聚类划分,同时,获取周期特征明显语音段的所有基音周期的起止端点,针对少数基音周期划分倍频或半频问题,提出识别、修正方法,其识别、修正率极高;在对大

    计算机测量与控制 2016年4期2016-10-31

  • 基于MATLAB的说话人识别系统设计与实现
    )借助语音增强、基音频率分析和共振峰分析,设计了简单的说话人识别系统.在识别过程中以平均基音频率、共振峰峰值位置作为两种评价标准,交互印证,最终实现了说话人的身份辨认.基音频率;共振峰;说话人识别;MATLAB0引言人类语音信号可对受众提供多重信息:首先可通过字、词来传递消息,其次可将说话人的感情、性别等信息传递出来,同时在语音信号里也暗含了说话人的身份信息[1-4].语音识别的目的在于识别说话人所表达出来的词汇,而说话人识别的功能是通过提取、表征并识别语

    石家庄学院学报 2016年3期2016-09-03

  • 基于卷积神经网络的鲁棒性基音检测方法
    神经网络的鲁棒性基音检测方法张晖1苏红1张学良1高光来1在语音信号中,基音是一个重要参数,且有重要用途.然而,检测噪声环境中语音的基音却是一项难度较大的工作.由于卷积神经网络(Convolutional neural network,CNN)具有平移不变性,能够很好地刻画语谱图中的谐波结构,因此我们提出使用CNN来完成这项工作.具体地,我们使用CNN来选取候选基音,再用动态规划方法(Dynamic programming,DP)进行基音追踪,生成连续的基音

    自动化学报 2016年6期2016-08-22

  • 一种基音周期检测中减小中值平滑误差的方法
    10007)一种基音周期检测中减小中值平滑误差的方法马 英, 陈 超, 陈善继(青海民族大学 物理与电子信息工程学院,青海 西宁 810007)在语音信号处理中,常用的基音检测算法对于纯净语音信号的检测效果较好;然而,实际的语音信号都会受到背景噪音的影响,使得常用的检测算法不能达到最优化,为提高检测基音周期的准确性,可以在基音检测后处理中采用多种平滑技术,但大多情况下后处理基音周期估值仍然产生很大的误差,为此文章针对语音信号基音周期估值的中值平滑处理中,可

    新疆师范大学学报(自然科学版) 2016年2期2016-07-31

  • 浅析歌唱发声的三要素
    唱;发声;气息;基音;共鸣一、发声的原理喉头与声带是发出声音的主要器官,喉头位于颈前部的最突出的部位而声带藏在喉头里,声带由两片薄膜组成,它们的韧性很强并左右并排。声带在放松时它的形态自然张开的,而发声时,由于空气产生的阻力使两片声带自然闭合。@由于每个人的声带、各部分器官的构造不同,每个人的发声习惯不同,所以,每个人的声音是不同的。二、发声的三要素气息、基音、共鸣是发出声音的三个重要要素,是保证能正常发声的三个条件,想要形成整体歌唱,它们之间的关系必须是

    北方音乐 2016年2期2016-02-05

  • 基于语音基音频率特征对人性别识别的研究
     尹巧萍基于语音基音频率特征对人性别识别的研究江苏孙海林尹巧萍本文利用基音频率作为语音特征,研究了文本无关说话人性别判别的方法。根据所计算出的不同性别说话人的语音基音频率累积密度函数之间的差异,识别出文本无关说话人的性别,实验结果显示该方法能够有效地识别不同说话人的性别。语音基音频率说话人性别识别一、引言(研究背景)随着科学技术的飞速发展,通过对语音信号进行分析处理,进而提取语音特征参数来识别说话人身份已经成为可能。根据语音特征来识别说话人的身份,具有不会

    作文教学研究 2015年5期2015-11-29

  • 基于AMR-WB基音周期的带宽节省方法
    基于AMR-WB基音周期的带宽节省方法滕 达1,2,冯浩楠1(1.中国铁道科学研究院 通信信号研究所,北京 100081;2.中国铁道科学研究院 研究生部,北京 100081)移动网络拥塞会影响数据通信的质量和稳定性,为节省网络高峰时段的网络带宽,本文在不改变硬件和协议的条件下,将信息隐藏的思想应用于语音编码,在编码阶段对语音信号进行压缩处理,经计算可以节省约12%的带宽,从而起到缓解网络拥塞的作用。基音周期;AMR-WB;带宽随着手机、平板电脑等移动类电

    铁路计算机应用 2015年1期2015-06-28

  • 基音周期检测的希尔伯特-黄变换方法
    脉冲串的周期称为基音周期。基音周期是语音信号处理中最重要的参数之一,准确地检测基音周期对于高质量的语音合成、语音编码、语音识别及说话人识别有重要意义。近年来,人们从语音信号的时域特性、频域特性、时频混合特性出发,提出了许多基音检测方法,最具有代表性的是自相关法(Autocorrelation Function,ACF)[1]、平均幅度差法(Average Magnitude Difference Function,AMDF)[2]、倒谱法[3]、小波变换法

    计算机工程与应用 2015年1期2015-04-14

  • 语种识别中的几种特征参数
    共振峰(F1)、基音频率(F0)、短时能量(En)、韵律节奏等6种声学特征参数及其派生参数。2 特征参数2.1 美尔频率倒谱系数美尔频率倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)[1]考虑了人耳的感知频率以及音强时具有的非线性特性,被认为具有良好的语音识别性能和抗噪声能力,现在已被广泛的应用于语种识别和说话人识别中。2.2 线性预测倒谱系数(LPCC)线性预测倒谱参数(LPCC)已被广泛地应用在语音识别上[

    电子世界 2015年20期2015-03-25

  • Matlab在语音信号处理教学中的应用
    ;线性预测编码;基音检测;共振峰检测语音信号处理是利用数字信号处理技术对语音信号进行分析和处理的一门学科,涉及语音学、信息论、随机过程、模式识别等许多学科领域。语音信号处理课程不仅是与通信技术和信息处理技术发展密切相关的一门专业基础课程,而且是一门理论性强、实用广、难度大的交叉学科课程[1-2]。工科电子类专业语音信号处理课程的主要内容包括语音信号处理的基本知识、语音信号的各种分析和处理技术(时域频域分析、同态处理、线性预测分析、矢量量化)、语音信号处理及

    实验科学与技术 2015年6期2015-02-27

  • G.718音频编码器核心层的一种低延时编码方案
    析和量化以及开环基音搜索过程。1.1 G.718编码器信号分类为了在8Kbps时获得最好的语音编码性能,首先进行VAD(Voice Activitity Detection)检测判断语音信号是否为活动语音信号,非活动语音信号如果采用DTX(Discontinuous Transmission)可以按照 CNG(Comfort Noise Generator)进行编码。对于非活动语音不采用DTX方式时和活动语音,核心层将信号分成清音(unvoiced)、浊音

    长春理工大学学报(自然科学版) 2014年6期2014-12-07

  • 基于趋势分析的AMDF基音检测改进算法
    210023)基音作为语音信号处理的重要特征参数,指人在发浊音时气流通过声门使声带张弛振荡的振动频率(或周期),广泛用于语音编码、语音合成、语音增强及语音识别等。因此能准确检测基音意义极其重要。经典的基音检测算法有自相关函数法[1]、平均幅度差函数 法 (Average Magnitude Difference Function,AMDF)[2]、倒谱法[3]及小波变换法[4]等。尽管已有诸多算法及其改进算法,但准确、可信的基音检测算法研究仍为具有挑战性

    振动与冲击 2014年20期2014-09-19

  • 基于短时平均幅度差函数的带噪语音端点检测算法
    是要进行语音信号基音周期的提取.提出了一种改进的方法,用短时平均幅度差函数代替自相关函数,节约了计算量;利用浊音与噪声平均幅度差函数的区别省去了基音周期的计算,同时也避免了误差带来的问题.传统算法与改进算法的仿真比较表明,改进算法的检测曲线噪声容限大,所以在低信噪比下也表现出了较强的稳定性.端点检测;自相关函数;短时平均幅度差函数;基音周期语音端点检测是在复杂的应用环境下,在信号流中找出语音信号的起始点和结束点,它是数字语音处理的重要环节[1].在通信系统

    河南工程学院学报(自然科学版) 2014年3期2014-08-31

  • 和弦的产生及音响结构形态
    是对位音程的两个基音音响,还有这两个基音内含的两个谐音列,相互之间谐振而产生的上、下两个结合音列的音响。正是这些隐含的结合音音响,当听觉要求它们从后台再现到前台时,就相继产生了各种和弦形式。以往有关和弦的产生和功能属性等方面的认知,是欧洲音乐实践和创作中逐渐形成理论的基础,它们也仅是由创作经验感悟产生的结果,它应隶属于主观评价的一些方面。我们现在已可从上、下两个结合音列的音响分析中,找到它客观音响形态结构的理论科学依据。关键词:复调;和声;纯律;和弦;谐音

    黄钟 2014年2期2014-08-08

  • 一种改进的基音周期提取算法
    。称浊音的周期为基音周期,在时域波形里反映为峰值点和峰值点之间的距离。基音周期的提取在语音合成、语音识别、语音编码等领域有着广泛的应用。由于语音信号变化的复杂性,迄今为止,并未找到一个完善的适用于不同环境和要求,不同讲话者的可靠准确的检测基音周期的办法[1]。现有的基音周期的检测算法大致可以分为三类[2]:波形估计法、相关处理法以及变换法。波形估计法[3]直接通过语音时域上的波形分析周期峰值,算法简单,硬件实现容易,但语音信号幅度或频率快速变化时,精度下降

    数据采集与处理 2014年2期2014-07-25

  • 高噪声环境下的基音频率检测方法研究
    )高噪声环境下的基音频率检测方法研究刘何来,张正炳,杨顺辽 (长江大学电子信息学院,湖北 荆州 434023)声道特性及噪声给基音检测带来了严重的影响,针对这一问题,将线性预测残差信号作为去除声道影响的激励信号的近似,再结合自相关函数法检测基音频率的高抗噪性,探讨了用线性预测残差信号的低通自相关函数法检测基音频率。用理论模型验证了该方法的可行性,并就实际信号处理情况和倒谱法及自相关函数法进行了比较。结果表明,该方法有效的减少了声道特性的影响,在高噪声环境下

    长江大学学报(自科版) 2013年1期2013-10-26

  • 基于压缩感知观测序列的语音信号基音周期提取*
    测序列中直接提取基音周期的技术。1 压缩感知的数学模型设N维信号 X∈RN×1由某组正交变换基表示成如下形式:其中 θi=〈X,Φi〉,即式中,Φ∈N×N的正交变换矩阵,若θ是K稀疏的,即θ中非零元素个数为K(K<<N),则可以采用另一个与Φ不相关的矩阵Ψ∈RM×N(M<N)对θ进行压缩观测,得到观测序列Ψ称为投影矩阵,令ΨΦT=Θ,则称Θ为观测矩阵。当Θ满足RIP特性,可以在接收端从M=O( Klg(N))个观测值中以高概率重构原始信号,方法为解凸优化问

    电讯技术 2013年10期2013-08-08

  • 同态解卷处理在基音检测中的应用
    3同态解卷处理在基音检测中的应用杨顺辽长江大学电子信息学院,湖北荆州 4340231 引言人类语音分为浊音和清音,其中发浊音时气流通过声门使得声带产生张弛震荡式振动,从而产生准周期气流脉冲,该气流脉冲激励声道就产生浊音。这种声带振动的频率称为基频,相应的周期就称为基音周期。基音周期具有时变性和准周期性,其大小与声带、发音习惯、发音者年龄、性别和发音时的情感有关[1]。基音周期的估计称为基音检测,是语音处理中一个重要参数,基音检测是语音处理中的关键环节和难点

    计算机工程与应用 2013年24期2013-07-20

  • 低复杂度的基音检测算法
    071051)基音周期是描述浊音激励源的一个基本特征,其倒数称为基音频率.基音频率的不同轨迹就是声调,在汉语中声调承担着构字辩意的作用,因此基音检测是汉语语言处理的关键环节.自相关函数法(ACF)[1]和平均幅度差函数法(AMDF)[2]是基音检测的经典算法,但准确性不高,容易产生倍、半基音,在平滑过程中不仅增加了处理时间和算法复杂度,还可能引入新的误差[3-4].小波变换是近年来的研究热点,具有良好的时频局部分析能力,但受声道响应的影响较大,计算量大.

    河北大学学报(自然科学版) 2013年5期2013-03-01

  • 基频提取算法的研究与评价
    谷值点也不一定是基音周期所在点,在这种情况下,若以全局最低谷点作为基音周期计算点,就会产生严重的检测错误[2]。语音的音频提取有广泛的应用。它促进了韵律学研究的发展;在语音识别中被用来识别原始的词汇;一些音乐的应用也需要基频提取,比如多媒体内容元数据的抽取,被用在自动评分和实时交互系统等等应用上。但是大部分算法在可靠性上存在一定的缺陷和错误率,下面我们着重比较最近几年主要的几种基频提取算法,具有篇幅有限,我们选用测试集51mike.com中许志安的《为什么

    微型电脑应用 2012年9期2012-10-20

  • 一种基于MELP模型600bps声码器的设计
    分析、增益计算、基音估计和多带分析方法从语音信号中提取线性预测系数、增益均值、增益差值、基音周期和子带清浊判决等参数,然后通过量化进入信道。图1 编码过程译码过程(见图2)是通过将脉冲信号和噪声信号根据子带清浊判决结果,将其叠加在一起作为激励信号,然后通过自适应谱增强、LPC合成滤波、增益校正、脉冲整形滤波处理,从而充分反映了语音信号的本质特征,极大地提高了合成语音的质量。图2 译码过程2.1 线谱对(LSF)参数量化在基于线性预测的语音编码算法中,线性预

    电子与封装 2012年10期2012-05-31

  • 舞蹈机器人中音乐基音频率的提取
    音高与音乐信号的基音频率是一一对应的关系,因此,音乐的基音频率是音乐信号特征参数识别中及其重要的参数之一。音乐信号的基音频率提取的质量对音乐的音高、节奏、旋律和情感等特征参数的提取具有重要的意义,将会直接影响到音乐信号特征参数提取的效果。作为音乐识别领域内重要的研究内容之一,目前常用的音乐信号基音频率的提取方法主要有自相关函数法(ACF)[1]、平均幅度差函数法(AMDF)[2]、倒谱法(CEP)和小波变换法[3]等,而单纯的利用自相关函数法或者平均幅度差

    电子设计工程 2011年13期2011-05-21

  • 多带激励MBE谱幅度估计与参数编解码方案研究
    函数w(n)即为基音细搜索窗(宽度取为221个样点的哈明窗)。设加窗语音信号为sw(n),则sw(n)=w(n)×s(n)。用Sw(w)表示sw(n)的傅立叶变换,可以看成是系统函数Hw(w)同激励信号谱Ew(w)的乘积,即:而重建语音信号可以写成:1.1 谱幅度估计多带激励编码过程都涉及3种参数的提取,它们是基音频率,按基音频率各次谐波分成频带后每个频带的谱包络参数以及每个频带的V/U判决信息。统一提取这3个参数所涉及的计算量相当大,目前在实际应用中难以

    电子设计工程 2011年16期2011-03-28

  • 语音信号的自相关基音周期检测
    200090)基音周期的估计称为基音周期检测,基音周期检测的最终目的是得到与声音振动频率吻合较好的基音周期变化轨迹曲线.在语音信号的处理中只有准确捕获语音信号参数,才能高效地识别语音.而在这些语音信号参数中,基音周期提取的精确性和效率直接影响到合成语音能否真实快速地再现原始语音信号.本文在基音周期检测一般方法的基础上,对自相关运算过程加以修改,并给出使用该种方法对两段语音信号进行基音周期检测的结果.1 语音信号基音周期检测一般过程语音信号基音周期检测的一

    上海电力大学学报 2011年3期2011-02-26

  • 谈谈笛子的泛音
    我们能听到的只是基音。实际上此时除了基音而外,其间还夹有若干分音;这些分音就构成了该乐器的音色。当手指虚按在弦的1/n点时,该分音就被增强激发出来,而基音却被抑制,从而使我们只能听到比该分音减一的泛音。当泛音被激发以后,由于基音同其余的分音同时都被抑制,因此泛音的音色纯净却十分单调。这弦乐器上的泛音,也被人们称作“笛音”。这“笛音”的称谓,是否有其道理呢?弦乐器可以通过第一把位、第二把位……,用缩短弦长的方法获得不同频率的音高。那么管乐器能否也通过多多开挖

    剧影月报 2010年6期2010-11-16

  • 一种高效的基音估计算法
    06)一种高效的基音估计算法高 悦,陈砚圃,闵 刚,杜 佳(西安通信学院 基础部,陕西 西安 710106)分析已有的一些基音估计算法,对比其优缺点,提出一种可大大提高计算速度的高效基音估计算法。该算法是利用平均幅度差(MAMDF)法提取若干个可能峰值点,再利用计算精度较高的循环平均幅度差(CAMDF)法对这几个点进行验证,选取数值最小的点作为基音周期。由于只对几个点求CAMDF函数,因此运算量大大减小。基音周期;基音估计;平均幅度差(AMDF);改进的平

    电子设计工程 2010年1期2010-09-27

  • 一种新的语音通信抗分组丢失方法—分布式子帧交织描述
    应码书(ACB)基音延迟;Pi,2表示第二子帧的自适应码书基音延迟;FCBi,1表示第一子帧的固定码书(FCB)位置和符号,FCBi,2表示第二子帧的固定码书(FCB)位置和符号;Gi,1表示第一子帧的ACB和FCB增益;Gi,2表示第二子帧的ACB和FCB增益。(2)MD-G.729编码器一般的编码器结构如图3(a)所示。如上所述,MD-G.729通过在G.729中的两个相邻帧应用DSI,生成两个速率相同的平衡描述。与第II部分介绍的DSI不同的是:当只

    通信技术 2010年6期2010-08-06

  • 一种基于数学形态学的语音基音轨迹平滑的改进算法
    430073)基音的检测提取一直是一个被广泛研究的课题,并提出了各种各样的基音检测算法.然而由于浊音信号的周期性表征极其复杂,无论采用哪一种基音检测算法都可能产生基音检测错误,加之噪音干扰,使求得的基音周期轨迹中有一个或几个基音周期估值偏离了正常轨迹(通常是偏离到正常值的2倍或1/2),这种偏离点称为“野点”.这些脉冲噪声类似于图像中的椒盐噪声,故可以采取平滑技术加以纠正.目前比较常用的基音平滑方法主要有中值滤波算法和线性平滑算法以及它们的组合.它们有一

    武汉理工大学学报(交通科学与工程版) 2010年5期2010-07-09

  • MELP声码器的算法研究及实现
    做以下处理:1.基音分析:首先经过1KHz的巴特沃思低通滤波器,用归一化互相关法进行基音粗估,得到整数基音值T,然后进行分数基音分析,采用内插方法,求得分数基音估计的小数部分,此时分数基音值P为整数基音T与分数基音小数部分之和。采用6阶巴特沃思带通滤波器将一帧语音信号分为五个带,分别是[0,500Hz],[500,1000Hz],[1000,2000Hz],[2000,3000Hz],[3000,4000Hz]五个频带,利用[0,500Hz]子带信号与残差

    新媒体研究 2009年23期2009-07-01