上海通话声学回声环境噪声抑制算法

时间：2023年04月07日来源：

该技术的出现旨在消除这种因远程网络会议所带来的回授现象，以遏制首先次回声产生所需的必要条件来遏制多次回声的出现。为什么要费那么大周折去抑制回声？这个话题应该不言而喻了。会议、语音扩声讲究的即是STI语音清晰度（可懂度），而回声是语言清晰度的比较大。设想踩脚跟式的语音信号传达到耳朵，听者难受，讲者费劲，对于这样的语音会议来说，那必将是一场灾难。我们把声学回声消除这个技术变成一张实体的插件（设备插卡），在系统中，为实现首先次回声过滤（过滤回声源则过滤多次回声）。这个技术应该插入在系统的哪个环节呢？我们不妨来找找系统中具备近乎相同/相似信号的一级进出环节。该图片经我司设计员制作后作者再编辑通过上图的分析，我们并不难发现一组具备相似信号的输入输出环节。而AEC技术认为，在这里对回声下手是治根的办法！市面上有多种类的回声消除器，也有部分抑制器，其算法和解决办法各有不同，本文就不详细阐释了。须知，通过对具有相似性极高的输入、输出信号的比对，约掉这一具备相似信号的输出，即切断了回授的根源，A地将不再听到回声现象。笔者也经常遇到有用户因远程会议本地有回声而采购了带有AEC回声消除功能的处理器。介绍非线性声学回声消除的公开文献也少之又少。上海通话声学回声环境噪声抑制算法

可以准确快速的进行底噪测试。下图TWS耳机中的左耳，在喇叭播放空声源时，喇叭端有略微的电流声底噪，右耳无此不良现场，通过指南测控的标准声学测试系统进行左右耳TWS声学测试，可以在底噪测试步骤中检测到，有底噪异常的左耳的一些频段能量值偏高，无底噪问题的右耳的表现就“平顺”很多。再结合与更多正常品的对比和设定合理的limits，可以快速准确的检查出耳机在各种状态下的底噪不良。耳机回声回声来自于非预期的泄露，一般分为电学回声和声学回声。前者一般由于麦克风和扬声器线路布局不合理的电路耦合造成，后者则是由于麦克风和扬声器的声学泄露耦合而成。对于回声不良的耳机来说，在通话时，耳机喇叭播放的声音信号通过麦克风又传回电话另一头的手机，从而让讲话者听到自己的声音。对于耳机来讲，主要是声学回声，表现为收发环路的隔离度不好，其根本原因就是耳机在装配时麦克风与喇叭的密封隔离没做好，导致通话时回声出现的不良体验。图中的耳机，在通话时，人耳会略微的感受到回声，也就是佩戴人讲话的声音又传递到了耳机本身的喇叭后播放出来，也有会在通话对方的手机端出现回声现像影响双方的通话质量。指南测控的标准声学测试系统，根据回声传输路径。天津识别声学回声分析推出的双耦合的声学回声消除算法以及实验检验结果。

WebRtcAec_Process接口如上，参数reported_delay_ms为当前设备需要调整延时的目标值。如某Android设备固定延时为400ms左右，400ms已经超出滤波器覆盖的延时范围，至少需要调整300ms延时，才能满足回声消除没有回声的要求。固定延时调整在WebRTCAEC算法开始之初作用一次,为什么target_delay是这么计算？inttarget_delay=startup_size_ms*self->rate_factor*8;startup_size_ms其实就是设置下去的reported_delay_ms，这一步将计算时间毫秒转化为样本点数。16000hz采样中，10ms表示160个样本点，因此target_delay实际就是需要调整的目标样本点数（aecpc->rate_factor=aecpc->splitSampFreq/8000=2）。我们用330ms延时的数据测试：如果设置默认延时为240ms，overhead_elements次被调整了-60个block，负值表示向前查找，正好为60*4=240ms，之后线性滤波器固定index=24，表示24*4=96ms延时，二者之和约等于330ms。②大延时检测是基于远近端数据相似性在远端大缓存中查找相似的帧的过程，其算法原理有点类似音频指纹中特征匹配的思想。大延时调整的能力是对固定延时调整与线型滤波器能力的补充，使用它的时候需要比较慎重。需要控制调整的频率，以及控制造成非因果的风险。

n)中的回声是扬声器播放远端参考x(n)，又被麦克风采集到的形成的，也就意味着在近端数据还未采集进来之前，远端数据缓冲区中已经躺着N帧x(n)了，这个天然的延时可以约等于音频信号从准备渲染到被麦克风采集到的时间，不同设备这个延时是不等的。苹果设备延时较小，基本在120ms左右，Android设备普遍在200ms左右，低端机型上会有300ms左右甚至以上。（2）远近端非因果为什么会导致回声？从（1）中可以认为，正常情况下当前帧近端信号为了找到与之对齐的远端信号，必须在远端缓冲区沿着写指针向前查找。如果此时设备采集丢数据，远端数据会迅速消耗，导致新来的近端帧在向前查找时，已经找不到与之对齐的远端参考帧了，会导致后续各模块工作异常。如图10(a)表示正常延时情况，(b)表示非因果。WebRTCAEC中的延时调整策略关键而且复杂，涉及到固定延时调整，大延时检测，以及线性滤波器延时估计。三者的关系如下：①固定延时调整只会发生在开始AEC算法开始处理之前，而且调整一次。如会议盒子等固定的硬件设备延时基本是固定的，可以通过直接减去固定的延时的方法缩小延时估计范围，使之快速来到滤波器覆盖的延时范围之内。下面结合代码来看看固定延时的调整过程。

右边的非线性声学回声场景。

这样会带来一个新的问题：按照Widrow的自适应滤波理论，滤波器的长度越长，其收敛速度越慢，同时权噪声越大，进而导致强混响下回声消除不够理想。第二个问题是延时跳变问题。在实时音视频通话领域，延时跳变是一个比较普遍的问题。主要现象是麦克端采集的信号和回声参考信号之间的时延关系会发生跳变，每次跳变之后就需要重新对齐信号，就会漏一些回声出来。第三个问题是啸叫问题。啸叫的检测和啸叫的抑制是公认的在回声领域的经典难题。还有双讲问题。双讲是评估回声消除算法性能的一个重要指标，当然也是很难处理的一个问题，因为双讲很容易导致滤波器系数发散。综合以上这些维度我们可以看到，非线性的声学回声消除是一个很有挑战的研究方向。双耦合声学回声消除算法这个是我们团队提出来的一种算法，它的主要特点是，在构建滤波器模型的过程中结合了非线性声学回声的一些特性，因此它在抑制非线性回声方面，也体现出固有的优势。1.非线性声学回声系统建模,继续回到前面的这个声学回声路径。我们对这个模型进行了简化。我们将左边的喇叭端用一个传递函数Wn来表示，假设它的是非线性的回声路径传递函数；同时我们将喇叭右边，就是麦克端，统一用Wl来表示。

声学回声是由于麦克风和扬声器的声学泄露耦合而成。天津识别声学回声分析

声学回声的作用有哪些？上海通话声学回声环境噪声抑制算法

男人说话的声频为～150Hz，女人说话声频为～230Hz,发动机声频为～250Hz，绝大部分机器的噪音也是以低频为主的中低频噪音）,9.声音频率(声频)声波在单位时间内的振动次数称为频率(frequency)，单位赫(Hz)。人耳能够听到的声音的整个范围是20~20000Hz，一般把声音频率分为低频（500Hz以下）、中频（500-1000Hz）和高频(1000Hz以上)三个频带。听觉好的成年人能听到的声音频率常在30~16000Hz之间，老年人则常在50~10000Hz之间。10.混响声源停止发音后，产生的声音延续现象。11.混响时间当声场达到稳定的状态后，突然关掉声源使其停止发声，声能逐渐减小到原来声能（稳定时具有的声能）的百万分之一所经历的时间，通常用声压级60dB所需要的时间，一般用T60表示（有时也用T），单位为秒（S）；(简而言之：声能密度衰减60dB所需要的时间)。12.混响时间计算公式塞宾公式T60=αS。其中A为总吸声量，α为吸声系数，S为样件面积，V为混响室体积。13.比较好混响时间对大量音质效果评价认为较好的各种用途的厅堂实测的500HZ和1000HZ满场（指实际使用状态）的混响时间进行统计分析，从而得到的混响时间称为比较好混响时间。14.直达声与混响声声源发出的直接到达的声音是直达声。

上海通话声学回声环境噪声抑制算法

深圳鱼亮科技有限公司是一家从事智能家居，语音识别算法，机器人交互系统，降噪研发、生产、销售及售后的服务型企业。公司坐落在龙华街道清华社区建设东路青年创业园B栋3层12号，成立于2017-11-03。公司通过创新型可持续发展为重心理念，以客户满意为重要标准。Bothlent目前推出了智能家居，语音识别算法，机器人交互系统，降噪等多款产品，已经和行业内多家企业建立合作伙伴关系，目前产品已经应用于多个领域。我们坚持技术创新，把握市场关键需求，以重心技术能力，助力通信产品发展。深圳鱼亮科技有限公司每年将部分收入投入到智能家居，语音识别算法，机器人交互系统，降噪产品开发工作中，也为公司的技术创新和人材培养起到了很好的推动作用。公司在长期的生产运营中形成了一套完善的科技激励政策，以激励在技术研发、产品改进等。深圳鱼亮科技有限公司严格规范智能家居，语音识别算法，机器人交互系统，降噪产品管理流程，确保公司产品质量的可控可靠。公司拥有销售/售后服务团队，分工明细，服务贴心，为广大用户提供满意的服务。

上一篇：上海数据降噪供应商家

下一篇：深圳机器人降噪识别