上海移动语音关键事件检测设计

时间：2024年01月31日来源：

上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中，在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分；例如，一个物理组件可以具有多个功能，或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器，如数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器技术、cd-rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是。语音关键事件检测技术可以帮助听力障碍者更好地理解和感知周围的声音环境。上海移动语音关键事件检测设计

直至电子设备判断预设时长内采集到的连续多帧图像中均包含相同的目标对象后，电子设备继续获得下一帧图像，即预设时长后的当前时刻对应的当前帧图像，并判断该当前帧图像中是否包括预设时长内采集到的连续多帧图像所包含的目标对象。这样，当判断结果为是时，电子设备便可以继续执行后续步骤s303。当前，光流法是图像分析领域中被重点关注的一种方法，所谓光流是指图像亮度模式的表观运动。可以理解的，当用户在防护舱中进行各类金融活动时，用户的某些身体部位也是运动的，例如，手指等。光流表达了图像的变化，可以引申出光流场。所谓光流场是指图像中所有像素点构成的一种二维(2d)瞬时速度场，其中的二维速度矢量是景物中可见点的三维速度矢量在成像表面的投影。这样，光流不包含了被观察物体的运动信息，而且还包含有关景物三维结构的丰富信息。因此，在本发明实施例中也可以引入光流法。可选的，一种具体实现方式中，上述本发明实施例提供的一种事件检测方法中，还可以包括如下步骤d1：步骤d1：每当获取到一帧图像时，利用该帧图像和该帧图像的前一帧图像，得到该帧图像对应的光流图；由于光流包含被观察物体的运动信息，因此，光流图表征的是两帧图像之间的变化。深圳信息化语音关键事件检测哪里买语音关键事件检测一般应用在什么行业？欢迎来电咨询！

并且对于本领域的普通技术人员来说显而易见的是，在本申请所描述的实施例包含的范围内可以有更多的实施例和实现方案。尽管在附图中示出了许多可能的特征组合，并在具体实施方式中进行了讨论，但是所公开的特征的许多其它组合方式也是可能的。除非特意加以限制的情况以外，任何实施例的任何特征或元件可以与任何其它实施例中的任何其他特征或元件结合使用，或可以替代任何其它实施例中的任何其他特征或元件。本申请包括并设想了与本领域普通技术人员已知的特征和元件的组合。本申请已经公开的实施例、特征和元件也可以与任何常规特征或元件组合，以形成由权利要求限定的独特的发明方案。任何实施例的任何特征或元件也可以与来自其它发明方案的特征或元件组合，以形成另一个由权利要求限定的独特的发明方案。因此，应当理解，在本申请中示出和/或讨论的任何特征可以单独地或以任何适当的组合来实现。因此，除了根据所附权利要求及其等同替换所做的限制以外，实施例不受其它限制。此外，可以在所附权利要求的保护范围内进行各种修改和改变。此外，在描述具有代表性的实施例时，说明书可能已经将方法和/或过程呈现为特定的步骤序列。然而。

300]的向量d，其中对于索引id从0至19999，每个id对应一个不同的汉字。那么对于一句话(长度为s)中的每一个字符，都可以在d中找到对应的id，从而获取对应的向量，因此可以得到一个维度为[s,300]的向量。然后可以使用双向lstm神经网络得到句子的语义表示向量w1。在本申请的示例性实施例中，通过bert模型获得语句的向量化语义表示w1可以包括：将语句直接输入所述bert模型，将所述bert模型的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中，使用bert模型时，可以将句子直接输入至bert模型，bert模型的输出即可以作为句子的向量化语义表示w1。在本申请的示例性实施例中，所述向量化语义表示w1的维度可以为[s，d1]；其中，当通过双向lstm网络获得语句的向量化语义表示w1时，d1为2*lstm隐层节点数；当通过bert模型获得语句的向量化语义表示w1时，d1＝768。在本申请的示例性实施例中，设以上两种方法得到的语义表示为w1，则,1的维度为[s,d1]，其中s为句子长度；如果使用双向lstm网络获得语句的向量化语义表示w1，则d1为2*lstm隐层节点数，如果使用bert模型获得语句的向量化语义表示w1，则d1＝768。s102、对所述向量化语义表示w1进行span划分，得到多个语义片段。语音关键事件检测用到了哪些技术？欢迎咨询！

便可以得到一个第二样本图像组及样本图像组的事件检测结果。实施例三：上述步骤f2，基于场景图像检测模型输出的检测结果，确定关于目标防护舱的事件检测结果，可以包括以下步骤f21-f23：步骤f21：将至少包含光流图在内的第二类图像确定为辅助图像，第二类图像中各个图像的类型均为：基于每两帧连续的关于所述目标防护舱且包括所述目标对象的图像获取的光流图，光流图为当前帧图像对应的光流图；步骤f22：将辅助图像输入到预设的光流图检测模型中，得到光流图检测模型输出的检测结果；其中，光流图检测模型为：采用各个第二样本图像组和每个第二样本图像组的事件检测结果所训练得到的模型，且每一第二样本图像组中的图像与待分析图像的图像数据相同，各个第二样本图像组中的图像为：关于防护舱的光流图；步骤f23：将场景图像检测模型输出的检测结果和光流图检测模型输出的检测结果进行融合计算，基于融合计算的结果，确定关于目标防护舱的事件检测结果。也就是说，在本实施例三中，可以同时利用场景图像检测模型对类图像进行检测，得到一个检测结果，利用光流图检测模型对第二类图像进行检测，得到另一个检测结果，进而，将两个检测结果进行融合计算，并基于融合计算的结果。语音关键事件检测技术怎么样？欢迎来电咨询！广东量子语音关键事件检测介绍

语音关键事件检测算法的性能评估通常包括准确率、召回率和F1分数等指标。上海移动语音关键事件检测设计

缺点在于：首先处理繁琐，其次这些工具在处理的过程中本身具有一定的误差，因此在后续建模分析的过程中会存在误差累积的问题。3、基于序列标注的一系列模型很难解决事件主体存在交叉的情况，比如“北京的法院”为一个事件主体(机构)，但是“北京”本身也是一种主体/实体(地名)。技术实现要素：本申请提供了一种事件检测方法和装置，能够获取更加有用的信息，具有较强的实际应用价值；在数据处理和建模的过程中操作简单，避免了因使用自然语言处理工具而导致的误差累积的问题；通过划分span的方式，完美解决了序列标注存在的问题，效率更高，适用性更强。本申请提供了一种事件检测方法，所述方法可以包括：获得语句的向量化语义表示w1；对所述向量化语义表示w1进行span划分，得到多个语义片段；对多个语义片段进行平均池化，得到每个span的表示w2；使用自注意力机制对获得的每个span的表示w2进行计算，得到每个span的新的语义表示w3；对所述新的语义表示w3进行span分类，确定每个span是否为一个事件的触发词或事件主体。在本申请的示例性实施例中，所述获得语句的向量化语义表示w1可以包括：通过双向lstm网络模型或bert模型获得语句的向量化语义表示w1。上海移动语音关键事件检测设计

上一篇：上海数字语音关键事件检测供应

下一篇：云南新一代语音关键事件检测哪里买