[发明专利]多人场景下的控制方法、装置、设备及存储介质有效
申请号: | 202010014526.0 | 申请日: | 2020-01-07 |
公开(公告)号: | CN111243585B | 公开(公告)日: | 2022-11-22 |
发明(设计)人: | 戚耀文 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司;上海小度技术有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/08;G10L15/25;G10L15/02;G10L17/02;G10L17/22;G10L21/0208 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 胡艾青;臧建明 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 场景 控制 方法 装置 设备 存储 介质 | ||
本申请公开了多人场景下的控制方法、装置、设备及存储介质,涉及计算机技术领域。具体实现方案为:通过阵列麦克风采集多个方向上的声音特征,并通过摄像头采集至少一个人物的神态特征,根据多个方向上的声音特征和至少一个人物的神态特征,在至少一个人物中确定目标人物,执行目标人物发出的语音命令。本申请的方法,实现了智能设备在多人场景中获取最优监听用户并执行用户指令的功能,提高了设备的智能化。
技术领域
本申请涉及计算机技术领域,尤其涉及一种人工智能技术。
背景技术
目前,智能音箱和智能电视等电子设备的技术不断成熟,电子设备的唤醒方式影响了设备的使用是否方便及智能化。
现有技术中常常通过语音的方式进行唤醒,当设备接收到一个指定用户发出的特定的唤醒词时,设备被唤醒,执行用户指令中对应的操作。
然而现有技术只能在同一时间接收一个人的信息,当同时有多个用户发出命令,电子设备无法被唤醒执行相应的操作,这种唤醒方式使得电子设备无法在多人场景下使用,影响了设备的智能化。
发明内容
本申请提供一种多人场景下的控制方法、装置、设备及存储介质,从而扩展了电子设备的应用场景,提高了电子设备的智能化。
第一方面,本申请提供一种应用于多人场景下的控制方法,包括:通过阵列麦克风采集多个方向上的第一声音特征,并通过摄像头采集至少一个人物的第一神态特征;根据多个方向上的第一声音特征和至少一个人物的第一神态特征,在至少一个人物中确定第一目标人物;执行第一目标人物发出的语音命令。其中,本申请提供的是多人场景下的控制方法,相对于一对一的唤醒及交互方法,其应用场景更加广泛,唤醒方式更加智能,解决了在多人说话的场景中设备无法识别用户的问题。并且电子设备可以结合人物的声音特征和神态特征来确定目标人物,从而可以提高电子设备的人物识别成功率。
可选的,执行第一目标人物发出的语音命令之后,还包括:通过阵列麦克风采集多个方向上的第二声音特征,并通过摄像头采集至少一个人物的第二神态特征;根据多个方向上的第二声音特征和至少一个人物的第二神态特征,在至少一个人物中确定第二目标人物;若第二目标人物与第一目标人物不同,则执行第二目标人物发出的语音命令。即本申请提供的技术方案还适用于插话场景。
可选的,还包括:若第二目标人物与第一目标人物不同,则清除第一目标人物发出的语音命令,从而可以节省电子设备的存储空间。
可选的,通过阵列麦克风采集多个方向上的第二声音特征,并通过摄像头采集至少一个人物的第二神态特征,包括:若获取到目标唤醒词,则通过阵列麦克风采集多个方向上的第二声音特征,并通过摄像头采集至少一个人物的第二神态特征。相反地,若未获取到目标唤醒词,则不通过阵列麦克风采集多个方向上的第二声音特征,并不通过摄像头采集至少一个人物的第二神态特征,从而可以降低电子设备的功耗。
可选的,还包括:获取第一目标人物的标识;显示第一目标人物的标识和第一目标人物发出的语音命令,从而可以提高电子设备的智能性。
可选的,根据多个方向上的第一声音特征和至少一个人物的第一神态特征,在至少一个人物中确定第一目标人物,包括:对多个方向上的第一声音特征和各个人物的声音特征进行匹配,以确定当前正在讲话的至少一个人物;根据至少一个人物的第一神态特征,在至少一个人物中确定第一目标人物。即电子设备可以结合人物的声音特征和神态特征来确定目标人物,从而可以提高电子设备的人物识别成功率。
可选的,任一个人物的第一神态特征包括:该人物的眼神特征和\或口型特征,相应的,根据至少一个人物的第一神态特征,在至少一个人物中确定第一目标人物,包括:若根据至少一个人物各自的眼神特征确定存在一个人物的眼神方向朝着摄像头,和\或,根据该人物的口型特征确定该人物正在发出语音命令,则将该人物确定为第一目标人物。即电子设备可以根据人物的眼神特征和\或口型特征来确定目标人物,从而可以提高电子设备的人物识别成功率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司;上海小度技术有限公司,未经百度在线网络技术(北京)有限公司;上海小度技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010014526.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:并行总线的通信方法、系统及主站、从站
- 下一篇:施工技术管理系统及方法