[发明专利]人机交互方法、装置、计算机设备和存储介质有效
申请号: | 201810108122.0 | 申请日: | 2018-02-02 |
公开(公告)号: | CN108363557B | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 刘国华 | 申请(专利权)人: | 刘国华 |
主分类号: | G06F3/16 | 分类号: | G06F3/16;G06F16/332;G10L15/08;G10L15/20;G10L15/22 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 易皎鹤 |
地址: | 518051 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人机交互 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种人机交互方法、装置、计算机设备和存储介质,其中方法包括:检测当前输出音量,当输出音量小于预设第一阈值时,启动语音识别功能,采集用户语音消息,同时检测用户语音音量的大小,响应用户语音操作,当用户语音音量大于预设第二阈值时,调小输出音量,返回检测当前输出音量的步骤。整个过程中,通过设备本身输出音量大小控制语音识别功能的开启,以便准确响应用户语音操作,并且在用户语音大于一定时,减小输出音量,以便凸显以及准确采集用户后续语音消息,给用户操作来带便捷,可以实现良好的人机交互。
技术领域
本申请涉及人机交互技术领域,特别是涉及一种人机交互方法、装置、计算机设备和存储介质。
背景技术
人机交互是指人与设备之间使用某种对话语言,以一定的交互方式,为完成确定任务的人与设备之间的信息交换过程。
随着科学技术的发展,人机交互技术的应用领域越来越宽广,小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室,用户都可以通过人机交互界面与系统交流,并进行操作。目前在人机交互技术中,主流的人机交互方式主要包括3种,第一种是传统按键方式;第二种是特定语音词激活方式,如:在对话前先说“小冰你好”,设备才识别后面所听到的语音;第三种是“举手发言”,即先用一个特定手势动作来让设备启动语音识别。
上述人机交互方式,虽然在一定程度上可以实现人机交互功能,但是由于交互方式单一,需要预先设定一定特定手势动作,交互过程并不十分自然,在一定程度上给用户操作带来不便。
发明内容
基于此,有必要针对上述技术问题,提供一种能够给用户带来便捷操作的人机交互方法、装置、计算机设备和存储介质。
一种人机交互方法,所述方法包括:
检测当前输出音量,当输出音量小于预设第一阈值时,启动语音识别功能;
当侦听到用户语音时,采集用户语音消息;
检测用户语音音量,并响应用户语音操作;
当用户语音音量大于预设第二阈值时,减小输出音量,返回所述检测当前输出音量的步骤。
在其中一个实施例中,所述检测当前输出音量之后还包括:
当所述输出音量大于预设第一阈值时,关闭语音识别功能。
在其中一个实施例中,所述检测当前输出音量之后还包括:
当未检测到用户人脸时,关闭语音识别功能。
在其中一个实施例中,所述当所述输出音量小于预设第一阈值时,启动语音识别功能包括:
当所述输出音量小于预设第一阈值且检测到人脸时,启动语音识别功能。
在其中一个实施例中,所述当所述输出音量小于预设第一阈值且检测到人脸时,启动语音识别功能的步骤包括:
当所述输出音量小于预设第一阈值时,启动人脸头部姿态检测;
当检测到正脸时,启动语音识别功能。
在其中一个实施例中,所述当所述输出音量小于预设第一阈值且检测到人脸时,启动语音识别功能的步骤包括:
当所述输出音量小于预设第一阈值时,获取用户与设备处于相对正视状态下的正视图像数据;
实时采集用户当前图像数据,将当前采集的图像数据与所述正视图像数据比较;
当所述当前采集的图像数据和所述正视图像数据一致时,判定用户与设备处于相对正视状态,启动语音识别功能。
在其中一个实施例中,所述响应用户语音操作包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于刘国华,未经刘国华许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810108122.0/2.html,转载请声明来源钻瓜专利网。