湖北光纤数据语音关键事件检测设计

时间:2023年03月17日 来源:

    也就是说,安装在防护舱内的用于监控防护舱内情况的摄像头,可以作为本发明实施例中关于防护舱的图像的数据来源。这样,可以通过一个设备实现多种功能,可以极大地节省成本。当然,也可以在防护舱的相关位置上安装专门用于实时采集关于防护舱的图像的图像采集设备。这都是合理的。其中,为了获得较高的关于目标防护舱的事件检测结果的准确率,人们希望所获得的关于防护舱的图像能够尽可能的包括防护舱内更多的区域,即人们希望图像采集设备的拍摄区域能够尽可能地覆盖到防护舱内更多的空间。例如,如图2所示,可以将安装在防护舱顶部的摄像头作为本发明实施例中关于防护舱的图像的数据来源。其中,摄像机的镜头可以垂直于舱顶,也可以倾斜于舱顶,与舱顶形成一定的角度,例如,不小于60度。这都是合理的。当然,在实际应用中,作为关于防护舱的图像的数据来源的图像采集设备也可以安装在其他位置,只要能够保证能够基于该图像采集设备所采集到的关于防护舱的图像,确定当前时刻,关于目标防护舱的事件检测结果即可。下面,对本发明实施例提供的一种事件检测方法,进行介绍。图3为本发明实施例提供的一种事件检测方法的流程示意图。需要说明的是。语音关键事件检测的不足之处。湖北光纤数据语音关键事件检测设计

湖北光纤数据语音关键事件检测设计,语音关键事件检测

    基于光流图检测模型输出的检测结果,确定关于目标防护舱的事件检测结果,可以包括以下步骤g21-g23:步骤g21:将至少包含当前帧图像的类图像确定为辅助图像;步骤g22:将辅助图像输入到预设的场景检测模型中,得到场景检测模型输出的检测结果;步骤g23:将场景图像检测模型输出的检测结果和光流图检测模型输出的检测结果进行融合计算,基于融合计算的结果,确定当前时刻,关于目标防护舱的事件检测结果。其中,关于类图像的相关描述内容、场景检测模型的相关描述内容、场景图像检测模型输出的检测结果和光流图检测模型输出的检测结果进行融合的融合过程等,可以参见上述的以第二类图像作为辅助图像时的相关描述内容。相对应上述本发明实施例提供的一种事件检测方法,本发明实施例还提供了一种事件检测装置。图6为本发明实施例提供的一种事件检测装置的结构示意图,如图6所示,该装置可以包括如下模块:图像获取模块610,用于实时获取关于目标防护舱的图像,并将当前时刻所采集到的图像作为当前帧图像;图像检测模块620,用于检测当前帧图像是否包含目标对象,其中,目标对象为:能够表征用户进入目标防护舱的用户身体部位;如果是,触发图像确定模块;图像确定模块630。上海数字语音关键事件检测服务标准语音关键事件检测的应用步骤是如何的?

湖北光纤数据语音关键事件检测设计,语音关键事件检测

    每种类型与某一数字对应,以便于计算机的处理,则可以分别标记为[0,1,2,3,4,...,29,30]。在本申请的示例性实施例中,因计算机无法直接处理中文,因此可以将句子(语句)中每一个单词转化为数字的映射。即,获得语句的向量化语义表示w1。在本申请的示例性实施例中,所述获得语句的向量化语义表示w1可以包括:通过双向lstm网络模型或bert模型获得语句的向量化语义表示w1。在本申请的示例性实施例中,在通过双向lstm网络获得语句的向量化语义表示w1之前,所述方法还可以包括:将语句中的m个字符随机初始化为一个维度为[m,n]的n维向量d,其中,对于从0到m-1的索引id,每个id对应一个不同的字符;对于长度为s的语句,该语句中每一个字符能够在向量d中找到对应的id,从而获得维度为[s,d]的向量。在本申请的示例性实施例中,通过双向lstm网络获得语句的向量化语义表示w1可以包括:将维度为[s,d]的向量输入预设的双向lstm神经网络,将所述双向lstm神经网络的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中,假设语料中一共有20000个不同的字符(汉字和/或单词,可以包括其他常用符号),每个字符可以随机初始化为一个300维的向量,则可以得到一个维度为[20000。

    便可以得到一个第二样本图像组及样本图像组的事件检测结果。实施例三:上述步骤f2,基于场景图像检测模型输出的检测结果,确定关于目标防护舱的事件检测结果,可以包括以下步骤f21-f23:步骤f21:将至少包含光流图在内的第二类图像确定为辅助图像,第二类图像中各个图像的类型均为:基于每两帧连续的关于所述目标防护舱且包括所述目标对象的图像获取的光流图,光流图为当前帧图像对应的光流图;步骤f22:将辅助图像输入到预设的光流图检测模型中,得到光流图检测模型输出的检测结果;其中,光流图检测模型为:采用各个第二样本图像组和每个第二样本图像组的事件检测结果所训练得到的模型,且每一第二样本图像组中的图像与待分析图像的图像数据相同,各个第二样本图像组中的图像为:关于防护舱的光流图;步骤f23:将场景图像检测模型输出的检测结果和光流图检测模型输出的检测结果进行融合计算,基于融合计算的结果,确定关于目标防护舱的事件检测结果。也就是说,在本实施例三中,可以同时利用场景图像检测模型对类图像进行检测,得到一个检测结果,利用光流图检测模型对第二类图像进行检测,得到另一个检测结果,进而,将两个检测结果进行融合计算,并基于融合计算的结果。语音关键事件检测和摄像头有联系吗?

湖北光纤数据语音关键事件检测设计,语音关键事件检测

    300]的向量d,其中对于索引id从0至19999,每个id对应一个不同的汉字。那么对于一句话(长度为s)中的每一个字符,都可以在d中找到对应的id,从而获取对应的向量,因此可以得到一个维度为[s,300]的向量。然后可以使用双向lstm神经网络得到句子的语义表示向量w1。在本申请的示例性实施例中,通过bert模型获得语句的向量化语义表示w1可以包括:将语句直接输入所述bert模型,将所述bert模型的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中,使用bert模型时,可以将句子直接输入至bert模型,bert模型的输出即可以作为句子的向量化语义表示w1。在本申请的示例性实施例中,所述向量化语义表示w1的维度可以为[s,d1];其中,当通过双向lstm网络获得语句的向量化语义表示w1时,d1为2*lstm隐层节点数;当通过bert模型获得语句的向量化语义表示w1时,d1=768。在本申请的示例性实施例中,设以上两种方法得到的语义表示为w1,则,1的维度为[s,d1],其中s为句子长度;如果使用双向lstm网络获得语句的向量化语义表示w1,则d1为2*lstm隐层节点数,如果使用bert模型获得语句的向量化语义表示w1,则d1=768。s102、对所述向量化语义表示w1进行span划分,得到多个语义片段。语音关键事件检测用到了哪些技术?云南量子语音关键事件检测是什么

语音关键事件检测的社会的作用有哪些?湖北光纤数据语音关键事件检测设计

    在本申请的示例性实施例中,在通过双向lstm网络获得语句的向量化语义表示w1之前,所述方法还可以包括:将语句中的m个字符随机初始化为一个维度为[m,n]的n维向量d,其中,对于从0到m-1的索引id,每个id对应一个不同的字符;对于长度为s的语句,该语句中每一个字符能够在向量d中找到对应的id,从而获得维度为[s,d]的向量。在本申请的示例性实施例中,通过双向lstm网络获得语句的向量化语义表示w1可以包括:将维度为[s,d]的向量输入预设的双向lstm神经网络,将所述双向lstm神经网络的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中,通过bert模型获得语句的向量化语义表示w1可以包括:将语句直接输入所述bert模型,将所述bert模型的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中,所述向量化语义表示w1的维度可以为[s,d1];其中,当通过双向lstm网络获得语句的向量化语义表示w1时,d1为2*lstm隐层节点数;当通过bert模型获得语句的向量化语义表示w1时,d1=768。在本申请的示例性实施例中,所述方法还可以包括:预先将触发词的类型划分为x种,将事件主体的类型划分为y种,其中,x、y均为正整数;在获得语句的向量化语义表示w1之前。湖北光纤数据语音关键事件检测设计

深圳鱼亮科技有限公司成立于2017-11-03,是一家专注于智能家居,语音识别算法,机器人交互系统,降噪的****,公司位于龙华街道清华社区建设东路青年创业园B栋3层12号。公司经常与行业内技术**交流学习,研发出更好的产品给用户使用。公司主要经营智能家居,语音识别算法,机器人交互系统,降噪,公司与智能家居,语音识别算法,机器人交互系统,降噪行业内多家研究中心、机构保持合作关系,共同交流、探讨技术更新。通过科学管理、产品研发来提高公司竞争力。公司与行业上下游之间建立了长久亲密的合作关系,确保智能家居,语音识别算法,机器人交互系统,降噪在技术上与行业内保持同步。产品质量按照行业标准进行研发生产,绝不因价格而放弃质量和声誉。在市场竞争日趋激烈的现在,我们承诺保证智能家居,语音识别算法,机器人交互系统,降噪质量和服务,再创佳绩是我们一直的追求,我们真诚的为客户提供真诚的服务,欢迎各位新老客户来我公司参观指导。

信息来源于互联网 本站不为信息真实性负责