福建新一代麦克风阵列

时间：2021年09月07日来源：

通过声音采集模块中的双麦克风结构的麦克风阵列、信号放大电路、带通滤波器实现针对多竞争声源的去噪功能，同时利用语音增强模块中的语音增强算法实现语音信号的去噪和增强处理；在本发明的技术方案中，通过双麦克风即可实现声音信号采集，采用极少的电器元件即可准确的在竞争声源中识别竞争声源，确保了本发明技术方案中的翻译设备的硬件体积更小，使本产品适于用户随身携带使用，更具实用性；通过语音增强算法实现了在收到混合声音的20ms内即可识别出干净的目标声源，确保了实时去噪的功能的实现，使本发明的技术方案适用于不同的同声翻译应用场景。说明为本发明的语音转文字及同声翻译系统的系统组成框；为本发明中的声音采集模块的结构框；本发明中的麦克风与声源位置的实施例；为本发明实施例中的一级放大电路的电路结构；本发明实施例中的二级放大电路和带通滤波器的电路结构；本发明实施例中的电源管理电路的电路结构。具体实施方式，本发明一种基于麦克风阵列的智能语音转文字及同声翻译系统，其包括：声音采集模块、音频转换模块、语音增强模块、翻译模块；声音采集模块智能地选取目标声源。线性麦克风阵列的输出是各阵元的加权和优波束方向，可调结构简单、方便布局，适用于车载、家电等场合。福建新一代麦克风阵列

供电装置为音频采集装置、视频采集装置和无线模块供电，便携式操作终端和无线模块无线电连接。本实施例的便携式可视化麦克风阵列装置，包括包体1、印刷电路板2、音频采集装置3、视频采集装置4、wifi模块5、电池6和便携式平板电脑7；包体的正面开有图像出孔8，在图像出孔8的位置安置一透光挡片9，用来防止灰尘弄脏镜头；包体1内缝制一夹层布料10，夹层布料10的下方开有一排线穿孔13，夹层布料10略带弹性，夹层布料10的长度和印刷电路板2的长度相同，夹层布料10的宽度和印刷电路板2的宽度相同，夹层布料10中心点和图像出孔8位置一致，以便于印刷电路板2能准确插放到合适位置；印刷电路板2正中心处开有视频采集装置安装孔11，视频采集装置4的镜头穿过视频采集装置安装孔11，再通过螺母和螺栓配合，安装到印刷电路板2背面；音频采集装置3焊接在印刷电路板2背面，在焊接音频采集装置3的位置开有声音出孔12；wifi模块5通过排线穿过夹层布料10上的排线穿孔13和印刷电路板2电连接，音频采集装置3将采集到的音频信号输出到wifi模块5，视频采集装置将采集到的视频信号输出到wifi模块5；wifi模块5选取raspberrypi4b作为主板。福建新一代麦克风阵列目前常用的麦克风阵列可以按布局形状分为：线性阵列，平面阵列，以及立体阵列。

n)、s2(n)、s3(n)、snum(n)分别为通过麦克风mic1采集到的所述目标声源、所述干扰噪声源1、所述干扰噪声源2、所述干扰噪声源num-1发出的声音信号；因为所述前向麦克风mic1更接近所述目标声源s1，所以麦克风mic2采集到的信号相对于所述前向麦克风mic1采集到的信号会有一定的延迟，则根据关系，可得麦克风mic2采集到的混合信号m2(n)：其中，d为所述前向麦克风mic1和麦克风mic2质检的距离，c为声速，fs为采样频率；b2：在混合信号的一个时频单元内，所述目标声源的信号占主导时，有如下关系：其中，δ1为所述目标声源的理想延迟时间，l和k分别是频率点和时间窗的序号；设，当所述目标声源占主导时，有如下关系：其中，l和k分别是频率点和时间窗的序号，pi为圆周率π；令：约等式右边的代数式为t(l,k)，则，根据两个麦克风mic1、mic2采集到的数据可计算得到每个频域点的t(l,k)；所述目标声源的理想延迟时间δ1的表达式为：步骤s4中的所述掩蔽权重b(l,k)的表达式为：其中，式中a1、a2、a3的取值范围是0～1之间的实数。本发明提供的一种基于麦克风阵列的智能语音转文字及同声翻译系统。

麦克风阵列波束形成，是对各阵元的输出进行时延或相位补偿、幅度加权处理，以形成指向特定方向的波束。在远场模型中，假设输入是一个平面波。设传播方向为θ，时域频率(弧度)为ω，声音在介质中的传播速度为c，对于在一个局部均匀的介质里传播的平面波，定义波束k为k=ωsinθ/c=2sinθ/λ，其中λ是对应于频率ω的波长。由于信号到达不同的传感器的时间不同，则阵列接收到的信号可表示为f(t)=[f(t-τ0)f(t-τ1)…f(t-τN-1)]T=[exp(jω(t-kτ0))exp(jω(t-kτ1))…exp(jω(t-kτN-1))]T其中τn为第n个阵元接收到的信号相对于参考点的时延，N为阵元个数，T表示转置。定义v(k)=[e-jωkτ0e-jωkτ1…e-jωkτN-1]T矢量v包含了阵列的空间特征，称为阵列流行矢量。则f(t)可表示为f(t)=ejωtv(k)。阵列处理器对一个平面波的响应为y(t,k)=HT(ω)v(k)ejωt其中H(ω)是滤波器系数向量的傅里叶变换。符号y(t,k)强调了输出和输入波数k的关系。时域上的相关性体现在输出是一个复指数，和输入平面波有相同的频率。在频域上式可表示为Y(ω,k)=HT(ω)v(k)。注意此处ω对应单一的输入频率，所以是窄带的。阵列的空时处理关系完全可以由上式的右端描述，称为阵列的频率-波数响应函数。麦克风阵列，麦克风按一定的形状规则布置形成的阵列，是对空间传播声音信号进行空间采样的一种装置。

对声信号m1(n)、m2(n)进行分帧与加窗之后，再进行时频变换即得到时频分布信号m1(l,k)和m2(l,k)，其中：l和k分别是频率点和时间窗的序号；s2：因为同一个声源的声信号到达两个麦克风mic1、mic2的时间存在延迟，计算延迟系数t(l,k)；s3：将所述延迟系数与所述目标声源的理想延迟时间δ1进行比较，确定所述目标声源的能量所占成分；s4：基于所述延迟系数与所述目标声源的理想延迟时间δ1的比较结果，计算m1(l,k)的掩蔽权重b(l,k)，得到增强信号的时频分布表达式：s5：对目标声源对应的所述增强信号进行傅里叶反变换，然后利用重叠相加法，可以得到增强后的信号此时获得的信号中方向性的竞争语音噪声已经被抑制。其进一步特征在于：所述一级放大电路包括：放大器u1、电容c5、c6、c7、c8、电阻r5、r10，所述放大器u1的1脚连接所述电阻r10的一端，所述放大器u1的2脚连接所述电阻r10的另一端后接地，所述放大器u1的3脚和16脚分别连接所述电阻r5的两端，所述放大器u1的7脚、所述电容c8的负极、所述电容c6的一端连接后接入电源，所述电容c6的另一端、所述电容c5的一端连接后接地，所述放大器u1的8脚所述电容c7的正极、所述电容c5的另一端互相连接后接入电源。语音信号由麦克风阵列直接获得，再进行分离可以得到多路单一麦克风语音信号。福建新一代麦克风阵列

对麦克风阵列频率响应的校准对于室内移动声源定位精度的进一步提升具有重要意义。福建新一代麦克风阵列

并且对接收到的声信号有很严格的要求，因此很难用于实际的语音声源定位系统；3.基于大输出功率的可控波束成型的方法，该方法已成为目前为流行的声源定位算法之一，这种算法在高混响下有很好的鲁棒性，而且定位精度高。此外，单通道语音增强方法很难抑制方向性干扰及进行降噪处理，因此多通道语音增强与处理必须采用远场波束形成方法，同时考虑不同的麦克阵拓扑，提升阵列的空间滤波效果。根据阵列信号处理理论可知，阵元的优化摆放对阵列处理系统性能具有重要影响。麦克风阵列拓扑结构可分为三类：一维阵列（如嵌套线型阵列、等间距线型阵列等线阵），二维阵列（如圆型阵列、方型阵列等平面阵），三维阵列（如星型阵列、球型阵列等立体阵）。当阵列拓扑结构不同时，例如阵列的维度、阵元的个数、阵元间距都会影响麦克风阵列定位算法的定位精度与运算速度。在实际的空间定位过程中，一维和二维的阵列定位效果并不好，因此研究合理的三维阵列拓扑结构具有实际性的意义。目前，基于麦克风阵列的室内移动声源定位研究均在麦克风阵列接收信号频率响应保持高度一致性的假设下进行。但是，在实际测试中，由于麦克风的制造本身存在公差。福建新一代麦克风阵列

深圳鱼亮科技有限公司是一家语音识别，音效算法，降噪算法，机器人，智能玩具，软件服务，教育培训，芯片开发，电脑，笔记本，手机，耳机，智能穿戴，进出口服务，云计算，计算机服务，软件开发，底层技术开发，软件服务进出口，品牌代理服务。的公司，致力于发展为创新务实、诚实可信的企业。深圳鱼亮科技作为语音识别，音效算法，降噪算法，机器人，智能玩具，软件服务，教育培训，芯片开发，电脑，笔记本，手机，耳机，智能穿戴，进出口服务，云计算，计算机服务，软件开发，底层技术开发，软件服务进出口，品牌代理服务。的企业之一，为客户提供良好的智能家居，语音识别算法，机器人交互系统，降噪。深圳鱼亮科技继续坚定不移地走高质量发展道路，既要实现基本面稳定增长，又要聚焦关键领域，实现转型再突破。深圳鱼亮科技始终关注通信产品行业。满足市场需求，提高产品价值，是我们前行的力量。

上一篇：语音服务标准「深圳鱼亮科技供应」

下一篇：重庆自主可控语音关键事件检测标准「深圳鱼亮科技供应」