信息化麦克风阵列设计

时间:2022年06月10日 来源:

    基于双麦克阵列的产品生态构建更具优势麦克风阵列作为实现智能语音的必备硬件,可以说是人工智能感知的硬件基础。因此,麦克风阵列的布局,将深深影响人工智能产品的生态布局。首先,众所周知的是,谷歌是以生态见长的公司。比如,Android构建了整个移动互联网的生态基础。在谷歌从移动互联网向AI转型的时候,提出了“AIFirst”的口号,并推出了开源深度学习系统TensorFlow,这个系统被认为是人工智能领域的Android。那么,谷歌为什么在如此重视AI战略的时候,推出这款GoogleHome的智能家居产品,并且采用双麦克的方案呢?相信对于谷歌这样的公司,成本和技术绝不会是阻碍他们采用更好技术的原因。据业内人士分析,关键的就是上面提到的的适用性和落地的便捷性,可能让谷歌后选择了双麦克方案。谷歌布局整个智能硬件产业链,而非只打造一款爆款产品。现在做GoogleHome智能音响,以后也可能做电视、汽车等等,所以在软硬件选择上都会考虑更通用、更长远的方案。多麦克阵列对外观和结构的严苛要求,使得该方案的应用场景极为有限,不具备的适用性,以Google的远大抱负,显然会选择适应性更强的双麦克方案。目前,谷歌明确表示会部分开放对接的子系统。目前主流采用麦克风阵列+深度学习的方式来进行去混响。信息化麦克风阵列设计

信息化麦克风阵列设计,麦克风阵列

    对声信号m1(n)、m2(n)进行分帧与加窗之后,再进行时频变换即得到时频分布信号m1(l,k)和m2(l,k),其中:l和k分别是频率点和时间窗的序号;s2:因为同一个声源的声信号到达两个麦克风mic1、mic2的时间存在延迟,计算延迟系数t(l,k);s3:将所述延迟系数与所述目标声源的理想延迟时间δ1进行比较,确定所述目标声源的能量所占成分;s4:基于所述延迟系数与所述目标声源的理想延迟时间δ1的比较结果,计算m1(l,k)的掩蔽权重b(l,k),得到增强信号的时频分布表达式:s5:对目标声源对应的所述增强信号进行傅里叶反变换,然后利用重叠相加法,可以得到增强后的信号此时获得的信号中方向性的竞争语音噪声已经被抑制。其进一步特征在于:所述一级放大电路包括:放大器u1、电容c5、c6、c7、c8、电阻r5、r10,所述放大器u1的1脚连接所述电阻r10的一端,所述放大器u1的2脚连接所述电阻r10的另一端后接地,所述放大器u1的3脚和16脚分别连接所述电阻r5的两端,所述放大器u1的7脚、所述电容c8的负极、所述电容c6的一端连接后接入电源,所述电容c6的另一端、所述电容c5的一端连接后接地,所述放大器u1的8脚所述电容c7的正极、所述电容c5的另一端互相连接后接入电源。信息化麦克风阵列设计麦克风阵列一般用于:声源定位,包括角度和距离的测量抑制背景噪声、干扰、混响、回声信号提取。

信息化麦克风阵列设计,麦克风阵列

    所述电容c7的负极连接所述电容c8的正极;所述带通滤波器的电路和所述二级放大电路包括:放大器u2、电阻r1~r4、r6~r9、电容c1~c4,所述放大器u2的1脚与所述电阻r1的一端、所述电阻r3的一端、所述电阻r6的一端互相连接,所述放大器u2的2脚连接所述电阻r1的另一端、所述电阻r2的一端,所述电阻r2的另一端接地,所述放大器u2的3脚连接所述电阻r4的一端、所述电容c3的一端,所述电阻r4的另一端接地,所述电容c3的另一端连接所述电阻r3的另一端、所述电容c2的一端,所述电容c2的另一端连接所述放大器u1的9脚、10脚,所述放大器u2的5脚连接所述电容c4的一端、所述电阻r7的一端,所述放大器u2的6脚连接所述电阻r8的一端、所述电阻r9的一端,所述电阻r8的另一端接地,所述电容c4的另一端接地,所述电阻r7的另一端连接所述电阻r6的另一端、所述电容c1的一端,所述放大器u2的7脚连接所述电阻r9的另一端、所述电容c1的另一端;所述电源管理电路包括:升压转换器u3、稳压电源u4、稳压器u5、插座j1、开关j2、电感l1、l2,、电容c9~c21、电阻r11~r13,所述升压转换器u3的1脚、2脚连接后接入所述电感l1的一端,所述升压转换器u3的11脚接地。

    翻译后的文字数据、声音数据通过文字或者音频的方式传递给用户;其特征在于:所述声音采集模块包括麦克风阵列、信号放大电路、带通滤波器、电源管理电路;所述麦克风阵列包括两个麦克风,两个麦克风之间的间隔设置为15mm;所述信号放大电路包括两级放大电路,其中一级放大电路设置在所述麦克风阵列与所述带通滤波器之间,二级放大电路设置在所述带通滤波器之后;所述带通滤波器包括由二阶低通电路、二阶高通电路组成,所述一级放大电路传入的声信号,经过所述带通滤波器滤波后,声信号通过所述二级放大电路进行放大,使滤波后的信号达到预设的电压范围;由所述麦克风阵列采集的声信号通过所述一级放大电路、所述带通滤波器、所述二级放大电路进行放大、工频滤波处理、放大升压处理后送入所述音频转换模块中进行数模转换;所述电压管理电路同时为所述声音采集模块、所述音频转换模块、所述语音增强模块供电;所述语音增强模块中通过预先植入的语音增强算法对所述音频转换模块传入的声信号进行增强处理;所述语音增强算法包括以下步骤:s1:定义所述麦克风阵列中与目标声源s1接近的麦克风为前向麦克风mic1,其采集到的声信号为m1(n),另一个麦克风mic2采集到的声信号为m2(n)。根据麦克风阵列的拓扑结构,则可分为线性阵列、平面阵列、体阵列等。

信息化麦克风阵列设计,麦克风阵列

    5)整理出,使得≪;6)根据收缩当前的搜索空间,更新搜索空间和新的区域边界;7)如果,或者并且,则确定该点坐标位置,保存结果并输出;8)如果只有,则舍弃结果;9)在中找到一个子集,使得中的任意值要大于的平均值;10)重复步骤3)和步骤4),在当前的搜索空间中随机选取个点,计算它们所对应的的值;11)将中的点放入子集中,并选取中值大的个点放入子集中,保存,放入下一次迭代时使用;12)令,进行下一次迭代,返回步骤5)。本发明的优点是:本发明提出了一套基于不同麦克风阵列拓扑结构分析的室内声源定位方法与多通道低通滤波与多通道自适应滤波融合的阵列校准方案。该方法能够在改变麦克风阵列拓扑结构时,进行对声源的定位,并且分析出其误差并与其他类型阵列作对比。同时使用基于随机区域收缩的相位变换加权可控响应功率定位算法,在室内高混响条件下能够较好地得到定位结果。用户可以通过自己的需求选择相应的麦克风阵列拓扑结构进行分析。在选择符合自身需求的麦克风阵列后,可以使用多通道低通滤波与多通道自适应滤波融合的阵列校准方案对接收信号的幅频特性进行校准并提高定位精度。为本发明实施例麦克风阵列室内说话人定位流程。音频采集装置为4×12的麦克风阵列,单个麦克风为底部出孔的mems麦克风。信息化麦克风阵列设计

在室内布置合适的麦克风阵列,说话人发声,录下说话人的语音。信息化麦克风阵列设计

    并且对接收到的声信号有很严格的要求,因此很难用于实际的语音声源定位系统;3.基于大输出功率的可控波束成型的方法,该方法已成为目前为流行的声源定位算法之一,这种算法在高混响下有很好的鲁棒性,而且定位精度高。此外,单通道语音增强方法很难抑制方向性干扰及进行降噪处理,因此多通道语音增强与处理必须采用远场波束形成方法,同时考虑不同的麦克阵拓扑,提升阵列的空间滤波效果。根据阵列信号处理理论可知,阵元的优化摆放对阵列处理系统性能具有重要影响。麦克风阵列拓扑结构可分为三类:一维阵列(如嵌套线型阵列、等间距线型阵列等线阵),二维阵列(如圆型阵列、方型阵列等平面阵),三维阵列(如星型阵列、球型阵列等立体阵)。当阵列拓扑结构不同时,例如阵列的维度、阵元的个数、阵元间距都会影响麦克风阵列定位算法的定位精度与运算速度。在实际的空间定位过程中,一维和二维的阵列定位效果并不好,因此研究合理的三维阵列拓扑结构具有实际性的意义。目前,基于麦克风阵列的室内移动声源定位研究均在麦克风阵列接收信号频率响应保持高度一致性的假设下进行。但是,在实际测试中,由于麦克风的制造本身存在公差。信息化麦克风阵列设计

信息来源于互联网 本站不为信息真实性负责