北京量子语音关键事件检测

时间:2024年01月08日 来源:

    在本申请的示例性实施例中,所述对所述向量化语义表示w1进行span划分,得到多个语义片段可以包括:获取设定的span的大宽度max_span_width;根据span的宽度从1到max_span_width依次在所述向量化语义表示w1上进行选取,获得多个span的语义表示span_embedding。在本申请的示例性实施例中,可以根据设定的span的大宽度max_span_width=8对步骤s101得到的语义表示w1进行划分。划分方法可以包括:span的宽度从1至max_span_width依次在向量w1上进行选取,得到n个span的语义表示,即span_embedding。s103、对多个语义片段进行平均池化,得到每个span的表示w2。在本申请的示例性实施例中,因每个span的宽度不一样(span_embedding的维度可以为[sw,d1],其中sw取值为1~max_span_width),因此可以对这n个span的语义表示进行平均池化处理,从而得到这n个span的表示w2,w2的维度可以为[n,d1]。s104、使用自注意力机制对获得的每个span的表示w2进行计算,得到每个span的新的语义表示w3。在本申请的示例性实施例中,该自注意力机制可以为自注意力加权计算。在本申请的示例性实施例中,可以将步骤s103所得的span的表示w2通过自注意力机制(自注意力加权计算)计算得到新的表示w4。利用语音关键事件检测技术,我们可以实现音频数据的自动分类和标签化,方便后续的检索和分析。北京量子语音关键事件检测

北京量子语音关键事件检测,语音关键事件检测

    每种类型与某一数字对应,以便于计算机的处理,则可以分别标记为[0,1,2,3,4,...,29,30]。在本申请的示例性实施例中,因计算机无法直接处理中文,因此可以将句子(语句)中每一个单词转化为数字的映射。即,获得语句的向量化语义表示w1。在本申请的示例性实施例中,所述获得语句的向量化语义表示w1可以包括:通过双向lstm网络模型或bert模型获得语句的向量化语义表示w1。在本申请的示例性实施例中,在通过双向lstm网络获得语句的向量化语义表示w1之前,所述方法还可以包括:将语句中的m个字符随机初始化为一个维度为[m,n]的n维向量d,其中,对于从0到m-1的索引id,每个id对应一个不同的字符;对于长度为s的语句,该语句中每一个字符能够在向量d中找到对应的id,从而获得维度为[s,d]的向量。在本申请的示例性实施例中,通过双向lstm网络获得语句的向量化语义表示w1可以包括:将维度为[s,d]的向量输入预设的双向lstm神经网络,将所述双向lstm神经网络的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中,假设语料中一共有20000个不同的字符(汉字和/或单词,可以包括其他常用符号),每个字符可以随机初始化为一个300维的向量,则可以得到一个维度为[20000。深圳自主可控语音关键事件检测哪里买语音关键事件检测技术能够识别音频中的特定声音模式,如掌声、笑声或特定词汇。

北京量子语音关键事件检测,语音关键事件检测

    还可以在检测到发生异常事件时,确定所发生的异常事件的事件类型。即事件检测结果为:关于发生异常事件且所发生异常事件类型的结果。这样,电子设备可以根据检测模型的输出结果,确定目标防护舱内发生哪种异常事件。可选的,一种具体实现方式中:在上述步骤s304中,上述检测模型可以直接输出:所发生的异常事件的类型,这样,电子设备便可以直接确定目标防护舱内用户出现的异常事件的类型,并将该类型作为:关于目标防护舱的事件检测结果。例如,倒地事件;这样,电子设备便可以确定目标防护舱内出现用户意外倒地的事件。可选的,另一种具体实现方式中:在上述步骤s304中,在训练检测模型时,可以预先设定多种类型的异常事件,则上述检测模型可以直接输出:正常事件概率以及每种类型的异常事件的概率。其中,正常事件表示目标防护舱内未发生异常事件。这样,电子设备便可以将概率比较高的事件确定为目标防护舱内用户出现的事件的类型,并将该类型作为:关于目标防护舱的事件检测结果。显然,当正常事件概率比较高时,则可以确定目标防护舱内未发生异常事件,当某类型的异常事件的概率比较高时,则可以确定目标防护舱内发生该类型异常事件。例如,正常事件概率5%。

    并判断当前时刻所采集到的当前帧图像是否包括目标对象,由于目标对象为:能够表征用户进入目标防护舱的用户身体部位,则可以基于当前帧图像判断当前时刻是否有用户进入目标防护舱。则当判断结果为是时,便可以基于当前帧图像,确定待分析图像,进而将该待分析图像输入到预设的检测模型中,得到当前时刻,关于目标防护舱的事件检测结果。这样,由于检测模型是基于各个样本图像和各个样本图像的事件检测结果所训练得到的模型,因此,检测模型充分学习了样本图像和事件检测结果之间的对应关系。基于此,在本发明实施例中,利用采集到的真实图像来确定待分析图像,利用训练好的检测模型对待分析图像进行检测,便可以提高关于目标防护舱的事件检测结果的准确率。而上述事件检测结果中可以包括目标防护舱内所发生的事件类型,从而可以提高对防护舱内用户出现异常事件的检测准确率。需要说明的是,由于电子设备可以实时对目标防护舱内部发生的异常事件进行检测,则在上述本发明实施例提供的一种事件检测方法中,电子设备对实时获取的每一关于目标防护舱的图像后,判断该图像是否包括目标对象,并在判断结果为是时,执行后续步骤s303-s304。然而,可以理解的,在某些时刻。语音关键事件检测在国际上的运用如何?欢迎咨询!

北京量子语音关键事件检测,语音关键事件检测

    本申请提供了一种事件检测方法,如图1所示,所述方法可以包括s101-s105:s101、获得语句的向量化语义表示w1。在本申请的示例性实施例中,在获得语句的向量化语义表示w1之前,可以首先对要进行事件抽取的数据进行预处理。在本申请的示例性实施例中,所述方法还可以包括:预先将触发词的类型划分为x种,将事件主体的类型划分为y种,其中,x、y均为正整数;在获得语句的向量化语义表示w1之前,根据设定的span宽度,对语句进行span划分,以将语句划分为多个span,并对每个span进行标记;其中,每个标记表示x+y+1种类型中的任意一种,1表示所述触发词的类型和所述事件主体的类型以外的其他类型。在本申请的示例性实施例中,假设触发词的类型(可以称为事件类型)数为n_event=10,即x=10,事件主体的类型(可以称为实体类型)数为n_entity=20,即y=20,则一共有10+20=30种类型。在本申请的示例性实施例中,可以首先对数据进行span的划分。以单个句子为例,假如设定span的大宽度max_span_width=8,则可以得到多个span,需要对每个span进行标记,即确定每个span是否是触发词、事件主体还是其他类型(other类型)。在进行分类时,一共有30种类型,加上other类型一共31种。语音关键事件检测在音频编辑和音频处理领域也有应用,如自动剪辑音频中的特定部分或去除背景噪音等。广州电子类语音关键事件检测内容

语音关键事件检测在日常生活中有用吗?欢迎咨询!北京量子语音关键事件检测

    便可以得到一个第二样本图像组及样本图像组的事件检测结果。实施例三:上述步骤f2,基于场景图像检测模型输出的检测结果,确定关于目标防护舱的事件检测结果,可以包括以下步骤f21-f23:步骤f21:将至少包含光流图在内的第二类图像确定为辅助图像,第二类图像中各个图像的类型均为:基于每两帧连续的关于所述目标防护舱且包括所述目标对象的图像获取的光流图,光流图为当前帧图像对应的光流图;步骤f22:将辅助图像输入到预设的光流图检测模型中,得到光流图检测模型输出的检测结果;其中,光流图检测模型为:采用各个第二样本图像组和每个第二样本图像组的事件检测结果所训练得到的模型,且每一第二样本图像组中的图像与待分析图像的图像数据相同,各个第二样本图像组中的图像为:关于防护舱的光流图;步骤f23:将场景图像检测模型输出的检测结果和光流图检测模型输出的检测结果进行融合计算,基于融合计算的结果,确定关于目标防护舱的事件检测结果。也就是说,在本实施例三中,可以同时利用场景图像检测模型对类图像进行检测,得到一个检测结果,利用光流图检测模型对第二类图像进行检测,得到另一个检测结果,进而,将两个检测结果进行融合计算,并基于融合计算的结果。北京量子语音关键事件检测

信息来源于互联网 本站不为信息真实性负责