云南语音关键事件检测内容

时间:2024年02月02日 来源:

    如果是,基于所述当前帧图像,确定待分析图像,其中,所述待分析图像为:关于所述目标语音关键事件检测防护舱及所述目标对象的图像;将所述待分析图像输入到预设的检测模型中,得到关于所述目标防护舱的事件检测结果;其中,所述检测模型为:基于各个样本图像和每个样本图像的事件检测结果所训练得到的模型。第二方面,本发明实施例提供了一种事件检测装置,所述装置包括:图像获取模块,用于实时获取关于目标防护舱的图像,并将当前时刻所采集到的图像作为当前帧图像;图像检测模块,用于检测所述当前帧图像是否包含目标对象,其中,所述目标对象为:能够表征用户进入所述目标防护舱的用户身体部位;如果是,触发图像确定模块;所述图像确定模块,用于基于所述当前帧图像,确定待分析图像,其中,所述待分析图像为:关于所述目标防护舱及所述目标对象的图像;结果确定模块,用于将所述待分析图像输入到预设的检测模型中,得到关于所述目标防护舱的事件检测结果;其中,所述检测模型为:基于各个样本图像和每个样本图像的事件检测结果所训练得到的模型。第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口。语音关键事件检测在音频编辑和音频处理领域也有应用,如自动剪辑音频中的特定部分或去除背景噪音等。云南语音关键事件检测内容

云南语音关键事件检测内容,语音关键事件检测

    在本申请的示例性实施例中,所述对所述向量化语义表示w1进行span划分,得到多个语义片段可以包括:获取设定的span的大宽度max_span_width;根据span的宽度从1到max_span_width依次在所述向量化语义表示w1上进行选取,获得多个span的语义表示span_embedding。在本申请的示例性实施例中,可以根据设定的span的大宽度max_span_width=8对步骤s101得到的语义表示w1进行划分。划分方法可以包括:span的宽度从1至max_span_width依次在向量w1上进行选取,得到n个span的语义表示,即span_embedding。s103、对多个语义片段进行平均池化,得到每个span的表示w2。在本申请的示例性实施例中,因每个span的宽度不一样(span_embedding的维度可以为[sw,d1],其中sw取值为1~max_span_width),因此可以对这n个span的语义表示进行平均池化处理,从而得到这n个span的表示w2,w2的维度可以为[n,d1]。s104、使用自注意力机制对获得的每个span的表示w2进行计算,得到每个span的新的语义表示w3。在本申请的示例性实施例中,该自注意力机制可以为自注意力加权计算。在本申请的示例性实施例中,可以将步骤s103所得的span的表示w2通过自注意力机制(自注意力加权计算)计算得到新的表示w4。重庆移动语音关键事件检测供应随着深度学习技术的不断发展,语音关键事件检测的准确性和实时性将得到进一步提高。

云南语音关键事件检测内容,语音关键事件检测

    电子设备便可以基于该当前帧图像,确定待分析图像。由于是对目标防护舱内发生的事件进行检测,因此,也就是检测目标防护舱内的用户是否处于正常情况中。这样,电子设备所确定的待分析图像便可以为:关于目标防护舱内的用户的图像,进一步的,目标防护舱内的用户通过当前帧图像中的目标对象表征。因此,电子设备所确定的待分析图像即为:关于目标防护舱及目标对象的图像。例如,包括目标防护舱内部情况及目标对象的图像。需要说明的是,电子设备可以通过多种方式基于当前帧图像,确定待分析图像,对此,本发明实施例不做具体限定。可选的,一种具体实现方式中,上述步骤s303,可以为:将至少包含当前帧图像的类图像确定为待分析图像,其中,类图像中各图像均为关于目标防护舱,且包括目标对象的图像。由于电子设备实时获取的关于目标防护舱的图像均为目标图像采集设备所采集的、能够反映目标防护舱的内部空间在每个时刻的真实情况的图像,并且,由于是对目标防护舱内的用户是否处于正常情况中进行检测。因此,电子设备可以将这些关于目标防护舱,且包括目标对象的图像确定为待分析图像。从而,利用待分析图像,确定当前时刻,关于目标防护舱的事件检测结果。具体的。

    本申请提供了一种事件检测方法,如图1所示,所述方法可以包括s101-s105:s101、获得语句的向量化语义表示w1。在本申请的示例性实施例中,在获得语句的向量化语义表示w1之前,可以首先对要进行事件抽取的数据进行预处理。在本申请的示例性实施例中,所述方法还可以包括:预先将触发词的类型划分为x种,将事件主体的类型划分为y种,其中,x、y均为正整数;在获得语句的向量化语义表示w1之前,根据设定的span宽度,对语句进行span划分,以将语句划分为多个span,并对每个span进行标记;其中,每个标记表示x+y+1种类型中的任意一种,1表示所述触发词的类型和所述事件主体的类型以外的其他类型。在本申请的示例性实施例中,假设触发词的类型(可以称为事件类型)数为n_event=10,即x=10,事件主体的类型(可以称为实体类型)数为n_entity=20,即y=20,则一共有10+20=30种类型。在本申请的示例性实施例中,可以首先对数据进行span的划分。以单个句子为例,假如设定span的大宽度max_span_width=8,则可以得到多个span,需要对每个span进行标记,即确定每个span是否是触发词、事件主体还是其他类型(other类型)。在进行分类时,一共有30种类型,加上other类型一共31种。语音关键事件检测的劣处是什么?欢迎咨询!

云南语音关键事件检测内容,语音关键事件检测

    并为所得到的截图添加标签,其中,标签包括:采集当前帧图像的采集时间和所发生异常事件类型对应的类型标签。可选的,一种具体实现方式中,上述装置还包括:视频标记模块,用于当事件检测结果为关于发生异常事件且所发生异常事件类型的结果时,在关于目标防护舱的监控视频中,为当前帧图像添加第二标签,其中,第二标签包括:所发生异常事件类型对应的类型标签。相应于上述本发明实例提供的一种事件检测方法,本发明实施例还提供了一种电子设备,如图7所示,包括处理器701、通信接口702、存储器703和通信总线704,其中,处理器701,通信接口702,存储器703通过通信总线704完成相互间的通信,存储器703,用于存放计算机程序;处理器701,用于执行存储器703上所存放的程序时,实现上述本发明实施例提供的一种事件检测方法中的任一方法步骤。上述电子设备提到的通信总线可以是外设部件互连标准(peripheralcomponentinterconnect,pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中用一条粗线表示,但并不表示有一根总线或一种类型的总线。语音关键事件检测一般应用在什么行业?欢迎来电咨询!江苏新一代语音关键事件检测特征

语音关键事件检测技术能够识别音频中的特定声音模式,如掌声、笑声或特定词汇。云南语音关键事件检测内容

    虽然用户进入了目标防护舱,但是用户并没有在目标防护舱内停留,而是立刻离开了目标防护舱,又或者,在某个时刻,用户从目标防护舱前路过,而在此刻采集到的关于目标防护舱的图像恰好拍摄到用户投射到防护舱门上的影子。显然,在上述这些时刻,虽然电子设备获取的当前帧图像中存在目标对象,但是,电子设备可以确定在这些时刻目标防护舱内不会发生针对该目标对象所在的用户的异常事件,进而,不需要对这些时刻获取的关于目标防护舱的图像执行后续步骤s303-s304。因此,为了进一步节省电子设备的资源,减轻电子设备的运行负担,同时也为了避免误报,电子设备可以通过多种方式来确定执行步骤s303的条件。一种具体实现方式中,如图4所示,在上述步骤s303,基于当前帧图像,确定待分析图像之前,上述本发明实施例提供的一种事件检测方法还可以包括:s302a:判断当前帧图像和当前帧图像之前的连续预设数量帧图像,是否均包含目标对象,如果是,执行上述步骤s303。在本实现方式中,在获取到当前帧图像后,电子设备便可以利用图像识别算法判断当前帧图像和当前帧图像之前的连续预设数量帧图像,是否均包含目标对象。其中,当判断结果为是时。云南语音关键事件检测内容

信息来源于互联网 本站不为信息真实性负责