浙江交互声学回声自抑制算法

时间：2022年08月15日来源：

非线性声学回声消除技术,非线性的声学回声消除问题，在实际声学系统里面非常普遍也非常棘手，到目前为止还没有特别有效的办法来解决。目前介绍非线性声学回声消除的公开文献也少之又少。如何处理非线性声学回声消除的，效果又如何？将从非线性声学回声消除产生的原因、研究现状、技术难点出发，详细介绍双耦合的声学回声消除算法以及实验检验结果。我要讲的内容是《非线性声学回声消除技术》，之所以选择这样的方向，主要是基于两个方面的原因：非线性的声学回声消除问题是一个困扰了行业很多年的技术难题，这个问题在实际的声学系统里非常普遍，同时又很棘手，到目前为止，还没有特别有效的办法。我猜测大家应该会对这个课题感兴趣。还有另外一个原因，我之前做过一些技术的调研，在现有公开的文献资料里，介绍非线性声学回声消除方面的资料非常少，我想借这样一个机会，介绍一些我们团队在这个领域的进展，希望能够对大家后续的研究有一些帮助，同时也想跟各位**做一下技术交流。我介绍的内容包括四个部分，个部分什么是非线性声学回声，它产生的原理、研究现状以及技术难点等问题；第二个部分重点介绍双耦合声学回声消除算法。

声学回声消除，该技术的出现旨在消除这种因远程网络会议所带来的回授现象。浙江交互声学回声自抑制算法

男人说话的声频为～150Hz，女人说话声频为～230Hz,发动机声频为～250Hz，绝大部分机器的噪音也是以低频为主的中低频噪音）,9.声音频率(声频)声波在单位时间内的振动次数称为频率(frequency)，单位赫(Hz)。人耳能够听到的声音的整个范围是20~20000Hz，一般把声音频率分为低频（500Hz以下）、中频（500-1000Hz）和高频(1000Hz以上)三个频带。听觉好的成年人能听到的声音频率常在30~16000Hz之间，老年人则常在50~10000Hz之间。10.混响声源停止发音后，产生的声音延续现象。11.混响时间当声场达到稳定的状态后，突然关掉声源使其停止发声，声能逐渐减小到原来声能（稳定时具有的声能）的百万分之一所经历的时间，通常用声压级60dB所需要的时间，一般用T60表示（有时也用T），单位为秒（S）；(简而言之：声能密度衰减60dB所需要的时间)。12.混响时间计算公式塞宾公式T60=αS。其中A为总吸声量，α为吸声系数，S为样件面积，V为混响室体积。13.比较好混响时间对大量音质效果评价认为较好的各种用途的厅堂实测的500HZ和1000HZ满场（指实际使用状态）的混响时间进行统计分析，从而得到的混响时间称为比较好混响时间。14.直达声与混响声声源发出的直接到达的声音是直达声。

河南智能音响声学回声分析便于大家对双耦合声学回声消除算法有一个定性的认识。

3.双耦合滤波器设计当滤波器的结构确定下来之后，我们要去设计滤波器系数了。设计过程我把它总结成了三步，第一步就是构建优化准则，第二步是求解滤波器的权系数——Wl和Wn，一步就是构建耦合机制。第一步就是构建优化准则。我觉得构建优化准则，应该是整个滤波器设计里面重要的一步，因为它决定了滤波器性能的上限。什么样的优化准则是一个好的优化准则呢？我觉得好的优化准则需要跟问题的物理特性有效匹配起来，所以在构建优化准则之前，我们先对非线性声学回声的特性进行分析，希望通过这种分析去挖掘非线性声学回声的一些物理特性。我们的分析是基于上面的函数，我们称它为短时相关度，它所表示的是两个信号，在一个短时的观测时间窗“T”这样一个尺度范围内的波形的相似程度，需要注意的是这个函数它是统计意义上的，因为我们对它进行了数学期望运算。同时在分子的一项我们还加了一个相位校正因子，目的是为了将这两路信号的初始相位对齐。基于前面构建的短时相关度函数，我们对大量声学回声数据进行分析，并挑选了几组比较典型的数据：绿色的曲线对应的是一组线性度非常好的回声数据。我们从这个数据上可以看到，在整个时间T的变化范围内，它的短时相关度都非常高。

一是恼人的异常音往往是比较轻微的，由于人工听音存在主观辨识性的问题，对于这类轻微的异常音疏于判断，但是终端客户可能不接受；二是在于产线测试环境嘈杂，普通的测试设备易受干扰，人耳对低阶次谐波的失真不敏感，所以在低阶的谐波失真导致的异音可能无法听出，但仪器有可能测出，从而导致误测，生产效率降低。要想准确检测出异常音，高性能的硬件采集和的软件算法缺一不可。指南测控的标准声学测试系统，通过规范的配备自研的高精度的测试传感器、高隔离度的环境环境、高灵敏度的GT-BT216C音频分析仪，辅以良好的减振结构设计，基于异常音包含大量的高次谐波失真成分这一基本原理，结合大量的生产测试经验和实验研究，形成了优于普通Rub&Buzz的独特的多达4种异常音检测指标，来检测异常音。下图TWS耳机中的右耳在播放低频成分较为明显的音乐或者声源时，人耳可以听出略微的异音感；左耳表现正常。通过指南测控的标准声学测试系统实际测试的结果，右耳喇叭播放时有略微异音，左耳喇叭听感正常。左右耳TWS组队声学测试，可以在喇叭播放特性的喇叭异常音测试步骤中看到，有异音的右耳的低频分量强度会变高，通过在指南GirantAudistic声学测试软件上测试异（常）音。

推出的双耦合的声学回声消除算法以及实验检验结果。

n)中的回声是扬声器播放远端参考x(n)，又被麦克风采集到的形成的，也就意味着在近端数据还未采集进来之前，远端数据缓冲区中已经躺着N帧x(n)了，这个天然的延时可以约等于音频信号从准备渲染到被麦克风采集到的时间，不同设备这个延时是不等的。苹果设备延时较小，基本在120ms左右，Android设备普遍在200ms左右，低端机型上会有300ms左右甚至以上。（2）远近端非因果为什么会导致回声？从（1）中可以认为，正常情况下当前帧近端信号为了找到与之对齐的远端信号，必须在远端缓冲区沿着写指针向前查找。如果此时设备采集丢数据，远端数据会迅速消耗，导致新来的近端帧在向前查找时，已经找不到与之对齐的远端参考帧了，会导致后续各模块工作异常。如图10(a)表示正常延时情况，(b)表示非因果。WebRTCAEC中的延时调整策略关键而且复杂，涉及到固定延时调整，大延时检测，以及线性滤波器延时估计。三者的关系如下：①固定延时调整只会发生在开始AEC算法开始处理之前，而且调整一次。如会议盒子等固定的硬件设备延时基本是固定的，可以通过直接减去固定的延时的方法缩小延时估计范围，使之快速来到滤波器覆盖的延时范围之内。下面结合代码来看看固定延时的调整过程。

介绍非线性声学回声消除的公开文献也少之又少。浙江交互声学回声自抑制算法

AEC声学回声，电话的扬声器的声音(包括反射声)，被麦克风拾取传送给远端，使远端说话人又听到自己的声音。浙江交互声学回声自抑制算法

我们还希望它在一个短时的观测时间窗的尺度里面也是比较好的，即局部比较好，所以在数学期望内部，我们又对误差进行了短时积分。这个优化准则跟传统的线性自适应滤波器是有本质区别的，因为传统的线性自适应滤波器基于小均方误差准则，它只是在统计意义上比较好，没有局部比较好约束。首先来求解这里的Wl，就是线性滤波器。主要求解方法是，假设Wn就是非线性滤波器是比较好解，把这个比较好解代入到前面的优化方程里，就会得到上面简化之后的优化目标函数。在这个地方，我们又做了一些先验假设，假设非线性的滤波器的一阶统计量和二阶统计量都等于0，我们就可以把上面的优化问题进一步简化，就得到我们非常熟悉的方程，就是Wiener-Hopf方程。这个结果告诉我们，线性滤波器的比较好解跟传统的自适应滤波器的比较好解是一致的，都是Wiener-Hopf方程的理论比较好解。所以我们就可以采用一些现有的比较成熟的算法，比如NLMS算法、RLS算法，对它进行迭代求解。这就是Wl的设计。接下来再看看Wn的设计。Wn的设计跟Wl的设计是类似的，也是需要将优化之后的线性滤波器，代入到开始的优化问题里，可以把前面的优化问题简化成下面的方程。接下来进行一系列的变量替换之后。

浙江交互声学回声自抑制算法

深圳鱼亮科技有限公司是一家有着雄厚实力背景、信誉可靠、励精图治、展望未来、有梦想有目标，有组织有体系的公司，坚持于带领员工在未来的道路上大放光明，携手共画蓝图，在广东省等地区的通信产品行业中积累了大批忠诚的客户粉丝源，也收获了良好的用户口碑，为公司的发展奠定的良好的行业基础，也希望未来公司能成为*****，努力为行业领域的发展奉献出自己的一份力量，我们相信精益求精的工作态度和不断的完善创新理念以及自强不息，斗志昂扬的的企业精神将**深圳鱼亮科技供应和您一起携手步入辉煌，共创佳绩，一直以来，公司贯彻执行科学管理、创新发展、诚实守信的方针，员工精诚努力，协同奋取，以品质、服务来赢得市场，我们一直在路上！

上一篇：天津电视盒子USB声卡前端降噪

下一篇：安徽投影仪USB声卡工艺