河北新一代麦克风阵列

时间:2022年05月02日 来源:

    语音转写产品虽然能很好的识别单目标声源的人声并进行转写,但是一旦出现竞争性声源,则无法辨别目标声源,竞争声源的存在导致对目标声源的识别便产生紊乱,无法进行语音到文字的转写和翻译。技术实现要素:为了解决现有同声翻译设备中存在的竞争性声源中辨别目标声源困难、设备体积过大不易携带的问题,本发明提供一种基于麦克风阵列的智能语音转文字及同声翻译系统,其可以智能识别目标声源,去除或降低竞争性噪声,对目标声源进行语音增强后进行语音到文字的转写和翻译,且设备体积较小容易携带。本发明的技术方案是这样的:一种基于麦克风阵列的智能语音转文字及同声翻译系统,其包括:声音采集模块、音频转换模块、语音增强模块、翻译模块;所述声音采集模块智能地选取目标声源,将数据送入所述音频转换模块,进行模拟语音数据和数字语音数据之间的转换;所述语音增强模块通过数字信号处理器向所述音频转换模块中的音频编解码芯片发送控制信号,将所述音频转换模块传输过来的语音信号进行处理及其控制语音信号的传输;处理过的数字语音信号送入所述翻译模块,按照用户选择的目标语言进行实时翻译。受使用时长及室内复杂环境等多种因素的影响,导致麦克风阵列接收信号的频率响应特性与理论值存在较大偏差。河北新一代麦克风阵列

河北新一代麦克风阵列,麦克风阵列

    翻译后的文字数据、声音数据通过文字或者音频的方式传递给用户;其特征在于:所述声音采集模块包括麦克风阵列、信号放大电路、带通滤波器、电源管理电路;所述麦克风阵列包括两个麦克风,两个麦克风之间的间隔设置为15mm;所述信号放大电路包括两级放大电路,其中一级放大电路设置在所述麦克风阵列与所述带通滤波器之间,二级放大电路设置在所述带通滤波器之后;所述带通滤波器包括由二阶低通电路、二阶高通电路组成,所述一级放大电路传入的声信号,经过所述带通滤波器滤波后,声信号通过所述二级放大电路进行放大,使滤波后的信号达到预设的电压范围;由所述麦克风阵列采集的声信号通过所述一级放大电路、所述带通滤波器、所述二级放大电路进行放大、工频滤波处理、放大升压处理后送入所述音频转换模块中进行数模转换;所述电压管理电路同时为所述声音采集模块、所述音频转换模块、所述语音增强模块供电;所述语音增强模块中通过预先植入的语音增强算法对所述音频转换模块传入的声信号进行增强处理;所述语音增强算法包括以下步骤:s1:定义所述麦克风阵列中与目标声源s1接近的麦克风为前向麦克风mic1,其采集到的声信号为m1(n),另一个麦克风mic2采集到的声信号为m2(n)。河北新一代麦克风阵列麦克风阵列是由一定数目的麦克风组成。

河北新一代麦克风阵列,麦克风阵列

    什么是麦克风阵列麦克风阵列是由一定数目的麦克风组成,对声场的空间特性进行采样并滤波的系统。目前常用的麦克风阵列可以按布局形状分为:线性阵列,平面阵列,以及立体阵列。其几何构型是按设计已知,所有麦克风的频率响应一致,麦克风的采样时钟也是同步的。麦克风阵列的作用麦克风阵列一般用于:声源定位,包括角度和距离的测量抑制背景噪声、干扰、混响、回声信号提取信号分离声源定位技术利用麦克风阵列计算声源距离阵列的角度和距离,实现对目标声源的跟z。基于TDOA(TimeDifferenceOfArrival,到达时间差)的声源定位技术。估计信号到达两两麦克风之间的时间差,从而得到声源位置坐标的方程组。然后求解方程组即可得到声源的精确方位坐标。信号的提取与分离通过波束形成技术,在期望方向上有效地形成一个波束,拾取波束内的信号,从而达到同时提取声源和抑制噪声的目的。语音去混响混响(Reverberation)是指声波在室内传播时,被墙壁、天花板、地板等障碍物形成反射声,并和直达声形成叠加的现象。混响的作用混响是声学中重要的现象之一合适的混响会使得声音圆润动听、富有感动力。混响时间太长会使得声音含糊不清,听不清楚。

    通过声音采集模块中的双麦克风结构的麦克风阵列、信号放大电路、带通滤波器实现针对多竞争声源的去噪功能,同时利用语音增强模块中的语音增强算法实现语音信号的去噪和增强处理;在本发明的技术方案中,通过双麦克风即可实现声音信号采集,采用极少的电器元件即可准确的在竞争声源中识别竞争声源,确保了本发明技术方案中的翻译设备的硬件体积更小,使本产品适于用户随身携带使用,更具实用性;通过语音增强算法实现了在收到混合声音的20ms内即可识别出干净的目标声源,确保了实时去噪的功能的实现,使本发明的技术方案适用于不同的同声翻译应用场景。说明为本发明的语音转文字及同声翻译系统的系统组成框;为本发明中的声音采集模块的结构框;本发明中的麦克风与声源位置的实施例;为本发明实施例中的一级放大电路的电路结构;本发明实施例中的二级放大电路和带通滤波器的电路结构;本发明实施例中的电源管理电路的电路结构。具体实施方式,本发明一种基于麦克风阵列的智能语音转文字及同声翻译系统,其包括:声音采集模块、音频转换模块、语音增强模块、翻译模块;声音采集模块智能地选取目标声源。由音频采集装置3组成的4×12的麦克风阵列。

河北新一代麦克风阵列,麦克风阵列

    麦克风阵列具有对远场干扰噪声很强的抑制作用,应用于便携IT设备如PDA、GPS、NB、手机等在较大噪声环境中使用时表现出较好的效果。小型麦克风阵列由一组麦克风单元在一个小范围内按照一定空间分布组合而成,由于它在噪声环境下具有良好的信号采集性,因此越来越受到声学应用领域的关注。1.波束的形成麦克风阵列是指按一定距离排列放置的一组麦克风,通过声波抵达阵列中每个麦克风之间的微小时差的相互作用,麦克风阵列可以得到比单个的麦克风更好地指向性。在麦克风阵列的设计中首要的改进是引入了波束成形、阵列指向性与波束宽度的概念。通过对所有麦克风信号的综合处理,麦克风阵列可以组合成为所要求的强指向性麦克风,形成被称为“波束”的指向特性。麦克风阵列的波束可以经由特殊电路或程序算法软件控制,使其指向声源方向而加强音频采集效果。阵列算法处理后的指向性波束形成技术能精确的形成一个锥状窄波束,只接受说话人的声音同时抑制环境中的噪音与干扰。可以通过以下两种方法获得麦克风阵列单元之间相对位置的信息:(1)把一对麦克风同步采集到的信号进行互相关,寻找互相关信号的最大值,得到两信号之间的延时τ,再乘以声波传播速度C0得到相对位置间距:。声源定位技术利用麦克风阵列计算声源距离阵列的角度和距离,实现对目标声源的。河北新一代麦克风阵列

目前中远距离声音的获取主要依靠规模较大的麦克风阵列装置来获取。河北新一代麦克风阵列

    k)在a3×δ1以下时,目标信号在这些视频单元内占据成分较低,则对延迟系数t(l,k)在这个范围内的时频单元中的能量进行舍弃;终设计了一个掩蔽权重矩阵,掩蔽权重b(l,k)的表达式为:其中,掩蔽矩阵b(l,k)的维度与m1、m2的维度相同,式中a1、a2、a3的取值范围是在0~1间的实数;综上,通过本发明技术方案获得的掩蔽矩阵会更好的保留原始信号,并且去除噪声。对于同声传译系统来说,可以更好的提升系统的精度。s5:对增强信号进行傅里叶反变换,然后利用重叠相加法,可以得到增强后的信号此时获得的信号中方向性的竞争语音噪声已经被抑制。本实施例选用dsp作为处理器来实现上述算法。数据传输协议为iis协议,一个采样周期内同时传输左右声道的数据,数据长度为16bit;本实施例的系统采样频率为16khz,每次传输的采样数据为左右声道各256点,dsp实际处理的数据由上次采集数据和本次采集数据拼接而成,音频处理的帧移为16ms,帧长为32ms。一级放大电路包括:放大器u1、电容c5、c6、c7、c8、电阻r5、r10,放大器u1的1脚连接电阻r10的一端,放大器u1的2脚连接电阻r10的另一端后接地,放大器u1的3脚和16脚分别连接电阻r5的两端。河北新一代麦克风阵列

信息来源于互联网 本站不为信息真实性负责