[发明专利]人机语音交互的实现方法及装置、电子设备、存储介质在审
申请号: | 202110055877.0 | 申请日: | 2021-01-15 |
公开(公告)号: | CN112733763A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 孙鹏;李骊 | 申请(专利权)人: | 北京华捷艾米科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08;A61M21/02;G16H40/67 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李慧引 |
地址: | 100193 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人机 语音 交互 实现 方法 装置 电子设备 存储 介质 | ||
本申请公开了一种人机语音交互的实现方法及装置、电子设备、存储介质,其中,所述方法包括:采集目标用户的彩色图像以及深度图像;从所述彩色图像中提取出所述目标用户的人脸关键信息,以及从所述深度图像中提取出所述目标用户的身体姿态信息;基于所述目标用户的人脸关键信息以及所述目标用户的身体姿态信息,识别所述目标用户是否处于任意一个目标状态;其中,所述目标状态包括目标情绪状态以及极端行为状态;所述目标情绪状态指代指定的不良情绪状态;若识别出所述目标用户处于任意一个目标状态,则启动语音对话模式,并向指定联系人发送提示信息。从而在用户出现不良情绪或者做出极端行为时,及时地自动与用户进行语音交互。
技术领域
本申请涉及语音交互技术领域,特别涉及一种人机语音交互的实现方法及装置、电子设备、存储介质。
背景技术
抑郁症是全球四大疾病之一,据统计全球目前有超过3亿人患有抑郁症,每年都有出现许多抑郁症患者自残、或者自杀的事件。
对于抑郁症患者,需要经常有人与其进行沟通,特别在出现情绪低落或者抑郁时,与他人进行沟通,能有效地避免患者做出自残等极端行为。但是,有患者出现抑郁的时间点不一定,而大部分情况下又无法保证有人在身边,并且患者也相对排斥与他人沟通。所以,相对较好的方式,则是与设备进行语音交互。
但是,现今的设备的语音交互方式,主要都是针对使用设备的逻辑实现的语音交互,并且都需要人为主动先发起唤醒词进行唤醒后,才能语音交互,而抑郁症患者情绪较差时,不可能主动发起唤醒词进行语音交互,所以现有人机语音交互方式并不能很好的适用于抑郁症患者。
发明内容
基于上述现有技术的不足,本申请提供了一种人机语音交互的实现方法及装置、电子设备、存储介质,以解决现有的方式需要人为主动唤醒,不适用于抑郁症患者的问题。
为了实现上述目的,本申请提供了以下技术方案:
本申请第一方面提供了一种人机语音交互的实现方法,包括:
采集目标用户的彩色图像以及深度图像;
从所述彩色图像中提取出所述目标用户的人脸关键信息,以及从所述深度图像中提取出所述目标用户的身体姿态信息;
基于所述目标用户的人脸关键信息以及所述目标用户的身体姿态信息,识别所述目标用户是否处于任意一个目标状态;其中,所述目标状态包括目标情绪状态以及极端行为状态;所述目标情绪状态指代指定的不良情绪状态;
若识别出所述目标用户处于任意一个目标状态,则启动语音对话模式,并向指定联系人发送提示信息。
可选地,在上述的人机语音交互的实现方法中,所述基于所述目标用户的人脸关键信息以及所述目标用户的身体姿态信息,识别所述目标用户是否处于任意一个目标状态,包括:
基于所述目标用户的人脸关键信息,识别所述目标用户是否处于所述目标情绪状态,以及基于所述目标用户的身体姿态信息,识别所述目标用户是否处于所述极端行为状态。
可选地,在上述的人机语音交互的实现方法中,所述基于所述目标用户的人脸关键信息,识别所述目标用户是否处于所述目标情绪状态,包括:
将所述目标用户的人脸关键信息输入第一神经网络模型中进行计算,得到第一数值;其中,若所述第一数值大于第一预设阈值,则识别出所述目标用户处于所述目标情绪状态;所述第一神经网络模型预先通过在各个指定的不同情绪状态下采集到的人脸关键信息训练得到。
可选地,在上述的人机语音交互的实现方法中,基于所述目标用户的身体姿态信息,识别所述目标用户是否处于所述极端行为状态,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京华捷艾米科技有限公司,未经北京华捷艾米科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110055877.0/2.html,转载请声明来源钻瓜专利网。