自主可控语音关键事件检测标准

时间：2024年01月10日来源：

用于将场景图像检测模型输出的检测结果和光流图检测模型输出的检测结果进行融合计算，基于融合计算的结果，确定关于目标防护舱的事件检测结果。可选的，一种具体实现方式中，上述结果确定单元包括：乘积计算子单元，用于根据场景图像检测模型和光流图检测模型的权重，计算场景图像检测模型输出的检测结果和场景图像检测模型的权重的乘积，并计算光流图检测模型输出的检测结果与光流图检测模型的权重的第二乘积；结果确定子单元，用于计算乘积和第二乘积的和值，基于和值，确定关于目标防护舱的事件监测结果。可选的，一种具体实现方式中，事件检测结果为：关于未发生异常事件的结果，或者，关于发生异常事件且所发生异常事件类型的结果。可选的，一种具体实现方式中，上述装置还包括：事件判断模块，用于当事件检测结果为关于发生异常事件且所发生异常事件类型的结果时，判断目标防护舱当前时刻发生的事件类型是否包括预设类型的事件；如果是，触发报警模块；报警模块，用于生成并发出与预设类型对应的报警信号。可选的，一种具体实现方式中，上述装置还包括：图像截取模块，用于当事件检测结果为关于发生异常事件且所发生异常事件类型的结果时，对当前帧图像进行截图。在语音数据中，关键事件检测可以帮助我们定位到重要的音频段，如会议中的关键决策或演讲中的关键观点。自主可控语音关键事件检测标准

确定关于目标防护舱的事件检测结果；其中，光流图检测模型为：采用各个第二样本图像组和每个第二样本图像组的事件检测结果所训练得到的模型，且每一第二样本图像组中的图像与待分析图像的图像数量相同，各个第二样本图像组中的图像为：关于防护舱的光流图。可选的，一种具体实现方式中，上述装置还包括：光流图确定模块，用于每获取到一帧图像，利用该帧图像和该帧图像的前一帧图像，得到该帧图像对应的光流图；则在本实现方式中，上述结果确定子模块包括：辅助图像确定单元，用于将至少包含光流图在内的第二类图像确定为辅助图像，第二类图像中各个图像的类型均为：基于每两帧连续的关于目标防护舱且包括目标对象的图像获取的光流图，光流图为当前帧图像对应的光流图；辅助图像检测单元，用于将辅助图像输入到预设的光流图检测模型中，得到光流图检测模型输出的检测结果；其中，光流图检测模型为：采用各个第二样本图像组和每个第二样本图像组的事件检测结果所训练得到的模型，且每一第二样本图像组中的图像与待分析图像的图像数量相同，各个第二样本图像组中的图像为：关于防护舱的光流图；结果确定单元。云南自主可控语音关键事件检测特征语音关键事件检测就找鱼亮科技，服务体系完善！

在本申请的示例性实施例中，所述对所述向量化语义表示w1进行span划分，得到多个语义片段可以包括：获取设定的span的大宽度max_span_width；根据span的宽度从1到max_span_width依次在所述向量化语义表示w1上进行选取，获得多个span的语义表示span_embedding。在本申请的示例性实施例中，可以根据设定的span的大宽度max_span_width＝8对步骤s101得到的语义表示w1进行划分。划分方法可以包括：span的宽度从1至max_span_width依次在向量w1上进行选取，得到n个span的语义表示，即span_embedding。s103、对多个语义片段进行平均池化，得到每个span的表示w2。在本申请的示例性实施例中，因每个span的宽度不一样(span_embedding的维度可以为[sw,d1],其中sw取值为1～max_span_width)，因此可以对这n个span的语义表示进行平均池化处理，从而得到这n个span的表示w2，w2的维度可以为[n,d1]。s104、使用自注意力机制对获得的每个span的表示w2进行计算，得到每个span的新的语义表示w3。在本申请的示例性实施例中，该自注意力机制可以为自注意力加权计算。在本申请的示例性实施例中，可以将步骤s103所得的span的表示w2通过自注意力机制(自注意力加权计算)计算得到新的表示w4。

控制器可以根据接收到的图像确定是否存在溺水现象发生，并在确定存在溺水现象发生时，向告警装置输出告警指令。告警装置在接收到告警指令后执行告警操作，从而可以提醒救生人员。因此，本实用新型实施例中的方案能够及时准确地检测到溺水事件的发生，并及时地通知救生员进行救援。说明是本实用新型实施例中的一种溺水事件检测系统的结构；本实用新型实施例中的一种摄像头安装位置；是本实用新型实施例中的另一种溺水事件检测系统的结构示意图。具体实施方式现有技术中，为有效解决溺水问题，通常在游泳场馆中安装有摄像头，摄像头通常安装在游泳池的上方，以实时采集游泳池内的图像。后台工作人员在监控室查看摄像头实时采集到的图像，并依次确认是否有游泳者出现溺水现象。然而，当游泳池内的游泳者较多时，后台工作人员获知每一个游泳者的当前状态的时间较长，难以及时发现发生溺水的游泳者。综上，现有的解决溺水问题的方案存在效率低下和准确度较低的技术问题。在本实用新型中，n个摄像头实时采集图像，控制器可以实时获取n个摄像头采集到的图像。控制器可以根据接收到的图像确定是否存在溺水现象发生，并在确定存在溺水现象发生时。在安全监控领域，语音关键事件检测可以用于检测和识别异常声音事件，如求救声等。

通信接口用于上述电子设备与其他设备之间的通信。存储器可以包括随机存取存储器(randomaccessmemory，ram)，也可以包括非易失性存储器(non-volatilememory，nvm)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。上述的处理器可以是通用处理器，包括处理器(centralprocessingunit，cpu)、网络处理器(networkprocessor，np)等；还可以是数字信号处理器(digitalsignalprocessing，dsp)、集成电路(applicationspecificintegratedcircuit，asic)、现场可编程门阵列(field-programmablegatearray，fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。本发明实施例还提供了一种计算机可读存储介质，该计算机可读存储介质内存储有计算机程序，该计算机程序被处理器执行时实现上述本发明实施例提供的一种事件检测方法中的任一方法步骤。需要说明的是，在本文中，诸如和第二等之类的关系术语用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含。语音关键事件检测用到了哪些技术？欢迎咨询！云南自主可控语音关键事件检测特征

语音关键事件检测是未来语音识别和智能交互领域的重要研究方向之一。自主可控语音关键事件检测标准

该m+1帧图像便可以组成一个样本图像组，并进一步确定该样本图像组的事件检测结果为：采集该m+1帧图像时，该防护舱内发生的事件类型。具体的，当待分析图像为：当前帧图像，则场景图像检测模型为：采用各个样本图像和每个样本图像的事件检测结果所训练得到的模型，且每个样本图像为一帧场景图像。其中，针对至少一个防护舱，在该防护舱中发生各类事件时，采集一帧关于该防护舱的图像，并将采集该图像时，该防护舱内发生的事件类型作为该图像的事件检测结果，这样，便可以得到一个样本图像组及样本图像组的事件检测结果。实施例二：待分析图像为上述第二类图像，即待分析图像为：至少包含光流图的光流图；则上述步骤s303，包括如下步骤g1-g2：步骤g1：将待分析图像输入到预设的光流图检测模型中，得到光流图检测模型输出的检测结果；步骤g2：基于光流图检测模型输出的检测结果，确定关于目标防护舱的事件检测结果。其中，由于待分析图像为目标防护舱的场景图像对应的光流图，则在本实施例二中，所采用的检测模型即为预设的光流图检测模型，且用于训练该光流图检测模型的各个第二样本图像组中所包括的图像即为光流图。需要说明的是。自主可控语音关键事件检测标准

上一篇：江西移动语音关键事件检测设计

下一篇：天津语音关键事件检测供应