天津自主可控语音关键事件检测介绍

时间:2022年05月03日 来源:

    使用自注意力机制对获得的每个span的表示w2进行计算,得到每个span的新的语义表示w3;对所述新的语义表示w3进行span分类,确定每个span是否为一个事件的触发词或事件主体。通过该实施例方案,能够同时抽取事件触发词和事件的主体,可获取更加有用的信息,具有较强的实际应用价值;在数据处理和建模的过程中不使用现有的自然语言处理工具,使得操作简单,也避免了因使用自然语言处理工具而导致的误差累积的问题,同时也更加符合真实应用场景;通过划分span的方式,完美解决了序列标注存在的问题,效率更高,适用性更强。本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的其他优点可通过在说明书以及附图中所描述的方案来实现和获得。附图说明附图用来提供对本申请技术方案的理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。图1为本申请实施例的事件检测方法流程图;图2为本申请实施例的事件检测装置组成框图。具体实施方式本申请描述了多个实施例,但是该描述是示例性的,而不是限制性的。语音关键事件检测的劣处是什么?天津自主可控语音关键事件检测介绍

天津自主可控语音关键事件检测介绍,语音关键事件检测

    并为所得到的截图添加标签,其中,标签包括:采集当前帧图像的采集时间和所发生异常事件类型对应的类型标签。可选的,一种具体实现方式中,上述装置还包括:视频标记模块,用于当事件检测结果为关于发生异常事件且所发生异常事件类型的结果时,在关于目标防护舱的监控视频中,为当前帧图像添加第二标签,其中,第二标签包括:所发生异常事件类型对应的类型标签。相应于上述本发明实例提供的一种事件检测方法,本发明实施例还提供了一种电子设备,如图7所示,包括处理器701、通信接口702、存储器703和通信总线704,其中,处理器701,通信接口702,存储器703通过通信总线704完成相互间的通信,存储器703,用于存放计算机程序;处理器701,用于执行存储器703上所存放的程序时,实现上述本发明实施例提供的一种事件检测方法中的任一方法步骤。上述电子设备提到的通信总线可以是外设部件互连标准(peripheralcomponentinterconnect,pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中用一条粗线表示,但并不表示有一根总线或一种类型的总线。天津自主可控语音关键事件检测介绍语音关键事件检测主要对哪些领域有大作用?

天津自主可控语音关键事件检测介绍,语音关键事件检测

    监控人员往往需要花费很久的时间才能在监控视频中准确定位到异常事件所对应的视频内容。这样,为了减少监控人员在查看视频时所耗费的时间,当事件检测结果为关于发生异常事件且所发生异常事件类型的结果时,电子设备可以采取多种方式对异常事件所发生的时间进行标记。一种具体实现方式中,上述本发明实施例提供的一种事件检测方法还可以包括如下步骤b1:步骤b1:对当前帧图像进行截图,并为所得到的截图添加标签,其中,标签包括:采集当前帧图像的采集时间和所发生异常事件类型对应的类型标签。当电子设备确定当前时刻目标防护舱内出现的异常事件的类型后,便可以对当前帧图像进行截图,并通过标签对所得到的截图进行标记,该标签中包括:当前时刻的时间信息和当前时刻目标防护舱内出现的异常事件的类型的类型标签。这样,当监控人员需要查看目标防护舱的监控视频中与该异常事件对应的视频内容时,便可以直接通过异常事件的类型标签,确定该事件类型对应的截图的标签,进而,根据该标签中的时间信息,确定该异常事件发生的时间。进一步的,监控人员便可以根据所确定的时间,直接调取与该时间对应的监控视频的视频内容。这样。

    在本申请的示例性实施例中,在通过双向lstm网络获得语句的向量化语义表示w1之前,所述方法还可以包括:将语句中的m个字符随机初始化为一个维度为[m,n]的n维向量d,其中,对于从0到m-1的索引id,每个id对应一个不同的字符;对于长度为s的语句,该语句中每一个字符能够在向量d中找到对应的id,从而获得维度为[s,d]的向量。在本申请的示例性实施例中,通过双向lstm网络获得语句的向量化语义表示w1可以包括:将维度为[s,d]的向量输入预设的双向lstm神经网络,将所述双向lstm神经网络的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中,通过bert模型获得语句的向量化语义表示w1可以包括:将语句直接输入所述bert模型,将所述bert模型的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中,所述向量化语义表示w1的维度可以为[s,d1];其中,当通过双向lstm网络获得语句的向量化语义表示w1时,d1为2*lstm隐层节点数;当通过bert模型获得语句的向量化语义表示w1时,d1=768。在本申请的示例性实施例中,所述方法还可以包括:预先将触发词的类型划分为x种,将事件主体的类型划分为y种,其中,x、y均为正整数;在获得语句的向量化语义表示w1之前。语音关键事件检测如何适应环境的变化?

天津自主可控语音关键事件检测介绍,语音关键事件检测

    目标对象为:能够表征用户进入目标防护舱的用户身体部位;可以理解的,在某些时刻,目标防护舱内可能并不存在用户,则可以确定在这些时刻目标防护舱内不会发生异常事件。因此,为了节省电子设备的资源,减轻电子设备的运行负担,在获取到当前帧图像后,电子设备便可以利用图像识别算法对当前帧图像进行检测,判断当前帧图像是否包含目标对象。其中,当判断结果为是时,电子设备可以确定存在用户进入目标防护舱,则在当前时刻,目标防护舱内可能发生异常事件,这样,电子设备便可以继续执行步骤s303。需要说明的是,电子设备可以采用任一能够检测出当前帧图像中是否包含目标对象的图像识别算法执行上述步骤s302,对此,本发明实施例不做具体限定。此外,根据实际情况中,根据采集关于目标防护舱的图像的图像采集设备的安装位置,上述目标对象所指示的具体的用户身体部位可以不同。例如,当图像采集设备安装在舱顶时,该目标对象可以是用户的头肩部;当图像采集设备安装在舱壁时,目标对象可以是用户的全身图像。这都是合理的。s303:基于当前帧图像,确定待分析图像;其中,待分析图像为:关于目标防护舱及目标对象的图像。在判断得到当前帧图像中包括目标对象后。语音关键事件检测的主要功能。天津自主可控语音关键事件检测介绍

语音关键事件检测的难点有哪些?天津自主可控语音关键事件检测介绍

    便可以极大地减少监控人员在查看视频时所耗费的时间。另一种具体实现方式中,上述本发明实施例提供的一种事件检测方法还可以包括如下步骤c2:步骤c2:在关于目标防护舱的监控视频中,为当前帧图像添加第二标签,其中,第二标签包括:所发生异常事件类型对应的类型标签。当用于采集关于目标防护舱的图像的图像采集设备和用于对目标防护舱进行监控的摄像头为同一设备时,电子设备实时获取的关于目标防护舱的图像即为关于目标防护舱的监控视频中的每个视频帧。这样,当电子设备确定当前时刻目标防护舱内出现的异常事件的类型后,便可以通过第二标签对当前帧图像进行标记,该第二标签中包括:当前时刻目标防护舱内出现的异常事件的类型的类型标签。这样,当监控人员需要查看目标防护舱的监控视频中与该异常事件对应的视频内容时,便可以直接通过异常事件的类型标签,在监控视频的进度条上查找该类型标签对应的视频帧的录制时间。进一步的,监控人员便可以根据所查找到的时间,直接调取与该时间对应的监控视频的视频内容。这样,便可以极大地减少监控人员在查看视频时所耗费的时间。以上可见,应用本发明实施例提供的方案,实时获取目标防护舱的图像。天津自主可控语音关键事件检测介绍

信息来源于互联网 本站不为信息真实性负责