天津电子类语音关键事件检测

时间:2023年06月22日 来源:

    如果是,基于所述当前帧图像,确定待分析图像,其中,所述待分析图像为:关于所述目标语音关键事件检测防护舱及所述目标对象的图像;将所述待分析图像输入到预设的检测模型中,得到关于所述目标防护舱的事件检测结果;其中,所述检测模型为:基于各个样本图像和每个样本图像的事件检测结果所训练得到的模型。第二方面,本发明实施例提供了一种事件检测装置,所述装置包括:图像获取模块,用于实时获取关于目标防护舱的图像,并将当前时刻所采集到的图像作为当前帧图像;图像检测模块,用于检测所述当前帧图像是否包含目标对象,其中,所述目标对象为:能够表征用户进入所述目标防护舱的用户身体部位;如果是,触发图像确定模块;所述图像确定模块,用于基于所述当前帧图像,确定待分析图像,其中,所述待分析图像为:关于所述目标防护舱及所述目标对象的图像;结果确定模块,用于将所述待分析图像输入到预设的检测模型中,得到关于所述目标防护舱的事件检测结果;其中,所述检测模型为:基于各个样本图像和每个样本图像的事件检测结果所训练得到的模型。第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口。语音关键事件检测对社会的好处说明。天津电子类语音关键事件检测

天津电子类语音关键事件检测,语音关键事件检测

    本申请提供了一种事件检测方法,如图1所示,所述方法可以包括s101-s105:s101、获得语句的向量化语义表示w1。在本申请的示例性实施例中,在获得语句的向量化语义表示w1之前,可以首先对要进行事件抽取的数据进行预处理。在本申请的示例性实施例中,所述方法还可以包括:预先将触发词的类型划分为x种,将事件主体的类型划分为y种,其中,x、y均为正整数;在获得语句的向量化语义表示w1之前,根据设定的span宽度,对语句进行span划分,以将语句划分为多个span,并对每个span进行标记;其中,每个标记表示x+y+1种类型中的任意一种,1表示所述触发词的类型和所述事件主体的类型以外的其他类型。在本申请的示例性实施例中,假设触发词的类型(可以称为事件类型)数为n_event=10,即x=10,事件主体的类型(可以称为实体类型)数为n_entity=20,即y=20,则一共有10+20=30种类型。在本申请的示例性实施例中,可以首先对数据进行span的划分。以单个句子为例,假如设定span的大宽度max_span_width=8,则可以得到多个span,需要对每个span进行标记,即确定每个span是否是触发词、事件主体还是其他类型(other类型)。在进行分类时,一共有30种类型,加上other类型一共31种。浙江量子语音关键事件检测介绍语音关键事件检测在我国是如何发展的?

天津电子类语音关键事件检测,语音关键事件检测

    在本申请的示例性实施例中,在通过双向lstm网络获得语句的向量化语义表示w1之前,所述方法还可以包括:将语句中的m个字符随机初始化为一个维度为[m,n]的n维向量d,其中,对于从0到m-1的索引id,每个id对应一个不同的字符;对于长度为s的语句,该语句中每一个字符能够在向量d中找到对应的id,从而获得维度为[s,d]的向量。在本申请的示例性实施例中,通过双向lstm网络获得语句的向量化语义表示w1可以包括:将维度为[s,d]的向量输入预设的双向lstm神经网络,将所述双向lstm神经网络的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中,通过bert模型获得语句的向量化语义表示w1可以包括:将语句直接输入所述bert模型,将所述bert模型的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中,所述向量化语义表示w1的维度可以为[s,d1];其中,当通过双向lstm网络获得语句的向量化语义表示w1时,d1为2*lstm隐层节点数;当通过bert模型获得语句的向量化语义表示w1时,d1=768。在本申请的示例性实施例中,所述方法还可以包括:预先将触发词的类型划分为x种,将事件主体的类型划分为y种,其中,x、y均为正整数;在获得语句的向量化语义表示w1之前。

    并为所得到的截图添加标签,其中,标签包括:采集当前帧图像的采集时间和所发生异常事件类型对应的类型标签。可选的,一种具体实现方式中,上述装置还包括:视频标记模块,用于当事件检测结果为关于发生异常事件且所发生异常事件类型的结果时,在关于目标防护舱的监控视频中,为当前帧图像添加第二标签,其中,第二标签包括:所发生异常事件类型对应的类型标签。相应于上述本发明实例提供的一种事件检测方法,本发明实施例还提供了一种电子设备,如图7所示,包括处理器701、通信接口702、存储器703和通信总线704,其中,处理器701,通信接口702,存储器703通过通信总线704完成相互间的通信,存储器703,用于存放计算机程序;处理器701,用于执行存储器703上所存放的程序时,实现上述本发明实施例提供的一种事件检测方法中的任一方法步骤。上述电子设备提到的通信总线可以是外设部件互连标准(peripheralcomponentinterconnect,pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中用一条粗线表示,但并不表示有一根总线或一种类型的总线。语音关键事件检测的好处有哪些?

天津电子类语音关键事件检测,语音关键事件检测

    确定关于目标防护舱的事件检测结果;其中,光流图检测模型为:采用各个第二样本图像组和每个第二样本图像组的事件检测结果所训练得到的模型,且每一第二样本图像组中的图像与待分析图像的图像数量相同,各个第二样本图像组中的图像为:关于防护舱的光流图。可选的,一种具体实现方式中,上述装置还包括:光流图确定模块,用于每获取到一帧图像,利用该帧图像和该帧图像的前一帧图像,得到该帧图像对应的光流图;则在本实现方式中,上述结果确定子模块包括:辅助图像确定单元,用于将至少包含光流图在内的第二类图像确定为辅助图像,第二类图像中各个图像的类型均为:基于每两帧连续的关于目标防护舱且包括目标对象的图像获取的光流图,光流图为当前帧图像对应的光流图;辅助图像检测单元,用于将辅助图像输入到预设的光流图检测模型中,得到光流图检测模型输出的检测结果;其中,光流图检测模型为:采用各个第二样本图像组和每个第二样本图像组的事件检测结果所训练得到的模型,且每一第二样本图像组中的图像与待分析图像的图像数量相同,各个第二样本图像组中的图像为:关于防护舱的光流图;结果确定单元。语音关键事件检测的效果如何?安徽信息化语音关键事件检测

语音关键事件检测的难点有哪些?天津电子类语音关键事件检测

    确定关于目标防护舱的事件检测结果;其中,场景图像检测模型为:采用各个样本图像组和每个样本图像组的事件检测结果所训练得到的模型,且每一样本图像组中的图像与待分析图像的图像数量相同,各个样本图像组中的图像为:所采集到的关于防护舱的图像。可选的,一种具体实现方式中,上述装置包括:光流图确定模块,用于每当获取到一帧图像时,利用该帧图像和该帧图像的前一帧图像,得到该帧图像对应的光流图;则在本实现方式中,上述图像确定模块630包括:第二图像确定子模块,用于将至少包含光流图在内的第二类图像确定为待分析图像,其中,第二类图像中各个图像的类型均为:基于每两帧连续的关于目标防护舱且包括目标对象的图像获取的光流图,光流图为当前帧图像对应的光流图。可选的,一种具体实现方式中,第二类图像为:包括光流图和光流图之前的连续n帧光流图的多张图像;其中,n为正整数;或,第二类图像为:光流图。可选的,一种具体实现方式中,上述结果确定模块640包括:第二图像检测子模块,用于将待分析图像输入到预设的光流图检测模型中,得到光流图检测模型输出的检测结果;第二结果确定子模块,用于基于光流图检测模型输出的检测结果。天津电子类语音关键事件检测

深圳鱼亮科技有限公司是一家集研发、生产、咨询、规划、销售、服务于一体的服务型企业。公司成立于2017-11-03,多年来在智能家居,语音识别算法,机器人交互系统,降噪行业形成了成熟、可靠的研发、生产体系。Bothlent目前推出了智能家居,语音识别算法,机器人交互系统,降噪等多款产品,已经和行业内多家企业建立合作伙伴关系,目前产品已经应用于多个领域。我们坚持技术创新,把握市场关键需求,以重心技术能力,助力通信产品发展。Bothlent为用户提供真诚、贴心的售前、售后服务,产品价格实惠。公司秉承为社会做贡献、为用户做服务的经营理念,致力向社会和用户提供满意的产品和服务。智能家居,语音识别算法,机器人交互系统,降噪产品满足客户多方面的使用要求,让客户买的放心,用的称心,产品定位以经济实用为重心,公司真诚期待与您合作,相信有了您的支持我们会以昂扬的姿态不断前进、进步。

信息来源于互联网 本站不为信息真实性负责