[发明专利]触发视频分析的音频事件在审
申请号: | 201811517782.0 | 申请日: | 2018-12-12 |
公开(公告)号: | CN110033787A | 公开(公告)日: | 2019-07-19 |
发明(设计)人: | J·黄;W·贝尔特曼;V·巴尔布拉查;Z·里夫林;D·加贝尔;S·唐宁;N·比斯沃;B·拉温德拉恩 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G10L25/48 | 分类号: | G10L25/48;G10L25/18 |
代理公司: | 北京尚诚知识产权代理有限公司 11322 | 代理人: | 龙淳 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种用于在安全系统中使用音频触发器进行监视的系统、装置、方法和计算机可读介质。该方法包括经由麦克风接收音频输入流。将音频输入流分成音频段。对音频段进行滤波以获得高能量音频段。如果高能量音频段包括语音,则确定语音是否被识别为系统用户的语音。如果高能量音频段不包括语音,则将高能量音频段分类为感兴趣声音或非感兴趣声音。基于作为感兴趣声音的高能量音频段的分类、作为系统用户语音的语音的语音识别以及语境数据来确定是否开启视频。 | ||
搜索关键词: | 音频段 高能量 语音 系统用户 音频输入 计算机可读介质 安全系统 视频分析 音频事件 语境数据 语音识别 麦克风 触发器 分类 触发 滤波 视频 监视 | ||
【主权项】:
1.一种具有音频分析的安全系统,包括:网络接口电路,用于经由麦克风接收音频输入流;处理器,耦合到所述网络接口电路;一个或多个存储设备,耦合到所述处理器,所述一个或多个存储设备包括指令,所述指令在由所述处理器执行时使所述系统:将所述音频输入流分成音频段;对所述音频段进行滤波以获得高能量音频段;如果高能量音频段包括语音,则确定所述语音是否被识别为系统用户的语音;如果所述高能量音频段不包括语音,则将所述高能量音频段分类为感兴趣声音或非感兴趣声音;并且基于作为所述感兴趣声音的高能量音频段的分类、作为系统用户语音的语音的语音识别以及语境数据来确定是否开启视频。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811517782.0/,转载请声明来源钻瓜专利网。