[发明专利]一种基于视线追踪的语音控制方法、汽车及可读存储介质在审
申请号: | 202110833688.1 | 申请日: | 2021-07-22 |
公开(公告)号: | CN113561988A | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 覃永进;陈长健;崔硕;杨建;冯俊 | 申请(专利权)人: | 上汽通用五菱汽车股份有限公司 |
主分类号: | B60W50/08 | 分类号: | B60W50/08;B60R16/037;G06F3/01;G06K9/00 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 薛福玲 |
地址: | 545007 广西壮*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 视线 追踪 语音 控制 方法 汽车 可读 存储 介质 | ||
本发明公开了一种基于视线追踪的语音控制方法、汽车及可读存储介质,其中,方法包括:获取汽车内人员的人脸图像信息,并通过人脸识别功能识别人脸图像信息中的眼部信息;监测眼部信息,并根据眼部信息动态追踪汽车内人员的视线位置;当视线位置落入预设控制区域时,获取汽车内人员的语音信息,并根据语音信息确定对应的控制指令;根据控制指令控制汽车中对应的控制器,以通过控制器控制汽车对应的部件执行控制操作。本发明通过获取车内人员的人脸图像信息,可实时对车内人员的视线位置进行追踪,从而在车内人员发出语音控制信息且视线落入预设控制区域时,对汽车对应的部件执行控制操作,简化了车载语音控制功能操作。
技术领域
本发明涉及汽车应用领域,尤其涉及的是一种基于视线追踪的语音控制方法、汽车及可读存储介质。
背景技术
随着社会的不断发展,汽车已经成为每个家庭必备的出行工具,汽车的舒适性已经成为用户越来越关注的问题;人们在使用车辆的过程中,需要对车辆的各项功能进行控制,例如,开关空调、控制车窗开启和关闭、控制摄像头对车内外进行拍照等操作;然而,这些操作会影响开车过程中的操作,因此,需要车辆语音功能进行辅助控制。
目前,智能车辆越来越多,车辆的语音控制功能也越来越成为智能车辆的标配;而现有的车辆语音控制功能,需要用户在唤醒车机交互系统后,才能使用语音控制功能,并向车辆控制系统发送相应的控制指令;而且,语音控制功能的指令相对固定化,所以需要非常精准的语音才能实现对车辆语音控制。
因此,现有技术还有待改进。
发明内容
本发明要解决的技术问题在于,针对现有技术缺陷,本发明提供一种基于视线追踪的语音控制方法、汽车及可读存储介质,以解决现有的车辆语音控制功能操作繁琐的技术问题。
本发明解决技术问题所采用的技术方案如下:
第一方面,本发明提供一种基于视线追踪的语音控制方法,基于视线追踪的语音控制方法包括以下步骤:
获取汽车内人员的人脸图像信息,并通过人脸识别功能识别所述人脸图像信息中的眼部信息;
监测所述眼部信息,并根据所述眼部信息动态追踪所述汽车内人员的视线位置;
当所述视线位置落入预设控制区域时,获取所述汽车内人员的语音信息,并根据所述语音信息确定对应的控制指令;
根据所述控制指令控制所述汽车中对应的控制器,以通过所述控制器控制所述汽车对应的部件执行控制操作。
在一种实现方式中,所述获取汽车内人员的人脸图像信息,之前包括:
预先获取用于人脸识别的人脸识别数据,并根据所述人脸识别数据建立对应的人脸识别模型。
在一种实现方式中,所述获取汽车内人员的人脸图像信息,并通过人脸识别功能识别所述人脸图像信息中的眼部信息,包括:
监测所述汽车的启动状态;
当监测到所述汽车启动时,通过所述汽车内的摄像头获取所述汽车内人员的人脸图像信息,得到所述汽车内人员对应的3D头部姿态模型;
根据所述3D头部姿态模型获取所述汽车内人员的眼部信息。
在一种实现方式中,所述当监测到所述汽车启动时,通过所述汽车内的摄像头获取所述汽车内人员的人脸图像信息,得到所述汽车内人员对应的3D头部姿态模型,包括:
通过所述汽车内的第一摄像头获取第一人脸图像信息,并通过所述汽车内的第二摄像头获取第二人脸图像信息;
通过AI视觉应用程序对所述第一人脸图像信息和所述第二人脸图像信息进行处理,分别提取所述第一人脸图像信息和所述第二人脸图像信息中的图像特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上汽通用五菱汽车股份有限公司,未经上汽通用五菱汽车股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110833688.1/2.html,转载请声明来源钻瓜专利网。