湖南未来麦克风阵列介绍

时间:2023年03月31日 来源:

    这涉及了语音交互用户场景的变化,当用户从手机切换到类似Echo智能音箱或者机器人的时候,实际上麦克风面临的环境就完全变了,这就如同两个人窃窃私语和大声嘶喊的区别。前几年,语音交互应用为普遍的就是以Siri为的智能手机,这个场景一般都是采用单麦克风系统。单麦克风系统可以在低噪声、无混响、距离声源很近的情况下获得符合语音识别需求的声音信号。但是,若声源距离麦克风距离较远,并且真实环境存在大量的噪声、多径反射和混响,导致拾取信号的质量下降,这会严重影响语音识别率。而且,单麦克风接收的信号,是由多个声源和环境噪声叠加的,很难实现各个声源的分离。这样就无法实现声源定位和分离,这很重要,因为还有一类声音的叠加并非噪声,但是在语音识别中也要抑制,就是人声的干扰,语音识别显然不能同时识别两个以上的声音。显然,当语音交互的场景过渡到以Echo、机器人或者汽车为主要场景的时候,单麦克风的局限就凸显出来。为了解决单麦克风的这些局限性,利用麦克风阵列进行语音处理的方法应时而生。麦克风阵列由一组按一定几何结构(常用线形、环形)摆放的麦克风组成,对采集的不同空间方向的声音信号进行空时处理。便携式可视化麦克风阵列装置可以被附接安装到无人机,或者其它可动装置或者附接到交通工具。湖南未来麦克风阵列介绍

湖南未来麦克风阵列介绍,麦克风阵列

    而且受使用时长以及室内复杂环境等多种复合因素的影响,导致麦克风阵列接收信号的频率响应特性与理论值存在较大偏差,这些偏差会使定位精度下降,因此,对麦克风阵列频率响应的校准对于室内移动声源定位精度的进一步提升具有重要意义。技术实现要素:本发明的目的是针对上述缺陷,而提供一种基于不同麦克风阵列拓扑结构分析的室内声源定位方法。该方法利用设置不同拓扑结构的麦克风阵列获取语音信号,进行基于相位变换加权的可控相应功率的定位算法,加上随机区域收缩的优化算法,从定位结果上分析了各个麦克风阵列性能的优劣,并且针对在真实室内环境中,麦克风阵列与说话人(声源)之间存在干扰的情况下,声源定位能力不足的实际问题,提出一种多通道低通滤波与多通道自适应滤波融合的阵列校准方案,使定位结果具有较高的精度。实现本发明目的的技术方案是:一种基于不同麦克风阵列拓扑结构分析的室内声源定位方法,包括如下步骤:(1)设置麦克风阵列室内声源定位系统,该系统由顺序连接的麦克风阵列拓扑结构分析模块、阵列自适应滤波校正模块和声源定位算法及分析模块构成;(2)提取语音信号:在室内布置合适的麦克风阵列,说话人发声,录下说话人的语音。湖南未来麦克风阵列介绍线性麦克风阵列加性麦克风阵列的输出是各阵元的加权和优波束方向。

湖南未来麦克风阵列介绍,麦克风阵列

    提取出每个麦克风所对应的音频信号、……;(3)将声源空间划分成多个网格,并依次求网格上每一个点的功率(,功率大的点即是声源定位的点=(;(4)任意一个点的总功率()为是麦克风阵列上所有麦克风对的信号两两做基于相位变换的广义互相关并求和:()=其中k、l第k、l个麦克风,表示相位变换的权重,τ()表示从声音从位置x到达第k个麦克风的时间;式中将定义为组合加权函数:考虑到计算()所涉及的对称性,并去掉一些固定能量项,则()随x变化的部分为:=(5)在整个房间内进行全局搜索,利用随机区域收缩算法(src)得到能量大的坐标点y;在所给定的初始值中随机找出一个n维的矩阵,在顺序过程中,逐步缩小范围,直到达到足够小的范围,找出峰值;从而计算出定位坐标点。步骤(4)中,为了简化计算可以替换为:=步骤(5)中,所述随机区域收缩算法的过程如下:1)先定义i为迭代的次数,表示第i次迭代时随机抽取的点数,表示下一代的子搜索空间中包含的点数,表示下一代子搜索空间。定义每计算一次便记为一次,表示第i次迭代后的次数,表示停止值,φ表示大被允许计算的次数。表示新的子搜索空间的边界;2)初始化迭代次数i=0;3)设置初始参数:、,;4)计算中所有的值。

    电容c4的另一端接地,电阻r7的另一端连接电阻r6的另一端、电容c1的一端,放大器u2的7脚连接电阻r9的另一端、电容c1的另一端;二级带通滤波电路由型号为op275的运算放大器和贴片电阻电容组成,通过构建二阶低通电路和二阶高通电路形成带通滤波,后使得系统的理论通带为160-12000hz,该频带满足ci滤波器组的频带要求同时省去50hz陷波电路的设计,在确保滤波、放大功能的同时,进一步减小了系统的硬件体积。电源管理电路包括:升压转换器u3、稳压电源u4、稳压器u5、插座j1、开关j2、电感l1、l2,、电容c9~c21、电阻r11~r13,升压转换器u3的1脚、2脚连接后接入电感l1的一端,升压转换器u3的11脚接地,升压转换器u3的3脚、4脚连接后与电阻r11的一端、电阻r12的一端、电容c13的一端、电容c9的一端、电容c10的一端、电容c11的一端连接后接入到电源,升压转换器u3的5脚连接电阻r11的另一端,电容c9的另一端、电容c10的另一端、电容c11的另一端互相连接后接地;升压转换器u3的6脚连接电容c12的一端,电容c12的另一端连接电阻r13的一端后接地,升压转换器u3的7脚、电阻r13的另一端、电阻r12的另一端、电容c13的另一端互相连接。根据声源和麦克风阵列距离的远近,可将声场模型分为两种:近场模型和远场模型。

湖南未来麦克风阵列介绍,麦克风阵列

    对声信号m1(n)、m2(n)进行分帧与加窗之后,再进行时频变换即得到时频分布信号m1(l,k)和m2(l,k),其中:l和k分别是频率点和时间窗的序号;s2:因为同一个声源的声信号到达两个麦克风mic1、mic2的时间存在延迟,计算延迟系数t(l,k);s3:将所述延迟系数与所述目标声源的理想延迟时间δ1进行比较,确定所述目标声源的能量所占成分;s4:基于所述延迟系数与所述目标声源的理想延迟时间δ1的比较结果,计算m1(l,k)的掩蔽权重b(l,k),得到增强信号的时频分布表达式:s5:对目标声源对应的所述增强信号进行傅里叶反变换,然后利用重叠相加法,可以得到增强后的信号此时获得的信号中方向性的竞争语音噪声已经被抑制。其进一步特征在于:所述一级放大电路包括:放大器u1、电容c5、c6、c7、c8、电阻r5、r10,所述放大器u1的1脚连接所述电阻r10的一端,所述放大器u1的2脚连接所述电阻r10的另一端后接地,所述放大器u1的3脚和16脚分别连接所述电阻r5的两端,所述放大器u1的7脚、所述电容c8的负极、所述电容c6的一端连接后接入电源,所述电容c6的另一端、所述电容c5的一端连接后接地,所述放大器u1的8脚所述电容c7的正极、所述电容c5的另一端互相连接后接入电源。可视化麦克风阵列装置,包括音频采集装置、视频采集装置、无线模块和供电装置,以及便携式操作终端。海南数字麦克风阵列介绍

这里只讨论有一定形状规则的麦克风阵列。湖南未来麦克风阵列介绍

    干扰噪声源1、干扰噪声源2...干扰噪声源num-1偏离正向的角度为θ2、θ3...θnum;本实施例中,num取值为3,即有两个竞争声源,则mic1采到的目标声源、干扰噪声源1、干扰噪声源2分别记作s1(n)、s2(n)和s3(n);则:前向麦克风mic1采集到的混合信号m1(n)为:m1(n)=s1(n)+s2(n)+s3(n)其中:s1(n)、s2(n)、s3(n)分别为通过麦克风mic1采集到的目标声源、干扰噪声源1、干扰噪声源2发出的声音信号;因为前向麦克风mic1更接近目标声源s1,所以麦克风mic2采集到的信号相对于前向麦克风mic1采集到的信号会有一定的延迟,则根据关系,可得麦克风mic2采集到的混合信号m2(n):其中,d为前向麦克风mic1和麦克风mic2之间的距离,本实施例中d的取值为15mm;c为声速,fs为采样频率;对时域信号进行分帧、加窗后再进行时频变换可得m1(l,k)和m2(l,k):如果在混合信号的一个时频单元内,当目标信号的能量占了主导,即在这个时频单元内存在如下关系:|s1(l,k)|>>|s2(l,k)|并且|s1(l,k)|>>|s3(l,k)|式中:l和k分别是频率点和时间窗的序号;则此混合信号的一个时频单元内,目标声源的信号占主导时,混合信号与目标信号的关系可以近似表示为:其中,δ1为目标声源的理想延迟时间。湖南未来麦克风阵列介绍

深圳鱼亮科技有限公司是一家服务型类企业,积极探索行业发展,努力实现产品创新。深圳鱼亮科技是一家有限责任公司(自然)企业,一直“以人为本,服务于社会”的经营理念;“诚守信誉,持续发展”的质量方针。公司始终坚持客户需求优先的原则,致力于提供高质量的智能家居,语音识别算法,机器人交互系统,降噪。深圳鱼亮科技自成立以来,一直坚持走正规化、专业化路线,得到了广大客户及社会各界的普遍认可与大力支持。

信息来源于互联网 本站不为信息真实性负责