河南手机声学回声降噪算法

时间：2022年04月15日来源：

并与正常品的对比和设定合理的limits，可以快速准确的检查出耳机的异常音不良。耳机底噪底噪也就是本底噪声，一般指在电声系统中，除去有用的信号外的总噪声。底噪有来自于固有的电子、电磁噪音，也有确是功放电路或电源性能问题导致的。理论上底噪是无法去除的，当然只有当底噪大到影响听感的时候才是问题。很多时候可以提高信噪比把底噪给压低，这确实可以降低听音乐时噪声的影响。但是总之人们还是有带耳机不听音乐的时候，典型的如ANC耳机降噪工作的时候，此时显得尤为重要，近期几大品牌都因为ANC底噪问题造成过批量退货。为了准确的检测产品底噪，我们需要知道目前行业内耳机功放工作类型大概有以下两种：1、产品处于蓝牙播放状态时，功放IC有打开，输入端无任何音源，喇叭输出端有底噪信号输出。2、产品处于蓝牙播放状态时，IC会被系统静音，信号输入端需要给一个很小信号触发功放IC打开，喇叭输出端有底噪信号输出。总的来说，底噪时需要多种指标和技术手段来验证和管控。指南测控整个标准声学测试系统通过极高灵敏度的仪器和声学传感器，采用多种评估底噪能量值的方法，以及专门为底噪测试而设计的箱体及治具结构，测试软件逻辑等一体化的设计。

非线性的声学回声消除是一个很有挑战的研究方向。河南手机声学回声降噪算法

首先这里的A和D比较好判断，他们都属于线性时不变系统。比较难判断的是C，因为在一些比较复杂的场景下，声学回声往往会经过多个不同路径的多次反射之后到达接收端，同时会带有很强的混响，甚至在更极端情况下，喇叭与麦克风之间还会产生相对位移变化，导致回声路径也会随时间快速变化。这么多因素叠加在一起，往往会导致回声消除算法的性能急剧退化，甚至完全失效。有同学可能会问，难道这么复杂的情况，不是非线性的吗？我认为C应该是一个线性时变的声学系统，因为我们区分线性跟非线性的主要依据是叠加原理，前面提到的这些复杂场景，它们依然是满足叠加原理的，所以C是线性系统。这里还要再补充一点，细心的朋友会发现B里面有一个功率放大器，同时在C里面也有一个功率放大器，为什么经B的功率放大器放大之后，可能带来非线性失真，而C的功率放大器不会产生非线性失真呢？二者的主要区别在于B放大之后输出是一个大信号，用来驱动喇叭。而C放大之后输出依然是小信号，通常不会产生非线性的失真。2.非线性声学回声产生的原因.非线性声学回声产生的原因，我一共列了两条原因。原因之一，声学器件的小型化与廉价化，这里所指的声学器件就是前面B里面提到的功率放大器和喇叭。

河南手机声学回声降噪算法便于大家对双耦合声学回声消除算法有一个定性的认识。

在线性的回声场景里，双耦合的非线性滤波器是处于休眠的状态，所以它的值是趋于0的，这个时候起主导作用的是线性滤波器。接下来我们再看一下右边的非线性声学回声场景。我们假设非线性的失要出现在t1到t2这个时间段内，大家可以看到黄色线在这个时间里，出现了一次突变，对于NLMS算法，当出现非线性失真之后，它的线性滤波器会去逼近非线性失真。但是由于学习的速度跟不上滤波器变化的速度，所以它跟真实的值之间总是存在一个比较大的gap。同时当非线性失真消失之后，它还需要一段时间恢复到正常状态，因此在整个时间段里，都会出现回声泄露的问题。接下来我们再看双耦合算法，在非线性失真出现之后，线性滤波器会进入到一种相对休眠的状态，就是前面所提到的耦合机制，会降低它的更新速度，所以在整个非线性出现的这段时间里，他的值是缓慢变化的。进入非线性失真状态之后，非线性滤波器开始工作，它会快速非线性特性的变化，而当非线性失真消失之后，非线性滤波器又进入休眠状态。将这两个滤波器结合起来，就可以实现对整个声学回声路径的变化进行有效。这里只是给出了一个示例，实际情况往往要复杂很多。接下来我们对这2个滤波器做了特性比较，主要是从4个不同的维度。

他的是线性回声传递函数。基于这样的数学假设，我们收到的信号y就可以表示成发射的信号x分别跟这样两个传递函数进行卷积之后的结果。接下来我们对这个模型进行了适当的简化，简化主要是基于数学分解，我们假设非线性的传递函数，可以分解成线性跟非线性这样两个系统函数的组合形式，就会得到中间的方程。接下来对中间的方程进行变量替换，就得到这个表达式，这个表达式它的物理意义很清晰，我们从可以看到，整个回声路径是可以表示成线性回声路径跟非线性回声路径二者之和的形式，这是它的物理意义。2.双耦合自适应滤波器,基于这样一个数学模型，接下来我们就构建了一种新的滤波器结构，称之为双耦合自适应滤波器。这个滤波器跟传统线性的自适应滤波器相比，主要有两个方面的不同，个不同是传统的线性滤波器只有一个学习单元，而我们的这个滤波器有两个学习单元，分别是这里的线性回声路径滤波器，我们用Wl来表示。还有非线性的回声路径滤波器，我们用Wn来表示。第二个不同就是，我们在这两个滤波器之间还加入了一个耦合因子，这个耦合因子目的就是为了协同二者更好的工作，让二者能够发挥出比较大的效能，甚至能够起到1+1＞2的效果。

基于前面构建的短时相关度函数，我们对大量声学回声数据进行分析。

什么是非线性声学回声？，什么是非线性的声学回声？这里我给出了一张图，的是声学回声的路径图，图的左边对应的是发射端，右边对应的是接收端。我们发出的信号首先要经过D/A变换，从数字域变换到模拟域，然后再经过功率放大器，放大之后驱动喇叭，这样就会发出声音。发出来的声音经过空气信道传播之后，到了接收端被麦克风采集到，然后再次经过功率放大器，再通过A/D变换，从模拟域又变回到数字域。那么这里的y[k]就是我们收到的回声信号。，我们接收到的回声y[k]到底是线性回声还是非线性回声呢？或者说我们应该怎么去判断它？我觉得要解决这个问题，就是要认识清楚这里面的每一个环节，看看它们到底是线性系统还是非线性系统，如果所有的环节都是线性的话，那么很自然y[k]就是一个线性的回声，否则只要有一个环节是非线性的，那么这个回声就是非线性回声。先对非线性声学回声的特性进行分析。河南手机声学回声降噪算法

搜索“声学回声消除”的相关文献。河南手机声学回声降噪算法

我们比较这两个之后就会发现，双讲段主要出现在中间这一段。我们评估双讲性能的主要指标是回声抑制比和近端语音失真度。上面这是经过回声消除之后的语谱，中间的是NLMS算法的结果。我们可以看到它的回声抑制不是很理想，不管在单讲段还是在双讲段，都有比较多的回声残留。而下面这个是采用双耦合算法得到的语谱，可以看到在单讲和双讲里面回声抑制得都比较干净，并且在双讲里，对近端语音的损伤也很小。这个数据对应视频会议场景，因此还需要做一步NLP的处理。上面这个就是基于双耦合算法，做了NLP之后的输出结果。我们可以看到处理完之后，整个语谱很清晰，回声去得很干净，而且语谱没有太大损伤，双讲很通透。我再来简单总结一下，主要是介绍了三个方面的内容，个就是认识了非线性声学回声、产生的原因、研究现状以及技术难点。接下来重点介绍了华为云音视频的双耦合声学回声消除算法，我们的主要贡献体现在两个方面，个方面就是构建一种双耦合自适应滤波器结构；第二个就是提出了小平均短时累计误差准则并进行求解。通过求解之后，我们会得到双耦合滤波器的线性滤波器是具有Wiener-Hopf方程解的比较好解这种形式，然后非线性滤波器具有小二乘解。河南手机声学回声降噪算法

上一篇：信息化麦克风阵列

下一篇：云南无限ENC降噪内容