[发明专利]基于目光连接的声音命令下达装置和方法有效
申请号: | 201410461030.2 | 申请日: | 2014-09-11 |
公开(公告)号: | CN104253944B | 公开(公告)日: | 2018-05-01 |
发明(设计)人: | 陈飞 | 申请(专利权)人: | 陈飞;鲍可捷 |
主分类号: | H04N5/232 | 分类号: | H04N5/232 |
代理公司: | 厦门市首创君合专利事务所有限公司35204 | 代理人: | 杨依展 |
地址: | 310000 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 目光 连接 声音 命令 下达 装置 方法 | ||
技术领域
本发明涉及一种基于目光连接的声音命令下达装置和方法。
背景技术
语音识别中有一个难点,就是声音采集装置无法判断用户什么时候在和其它对象聊天,什么时候是向语音系统下达命令,目前采用的手段多为通过设定按钮来开启录音,这种方式带来很多不便,而且既然要按下按钮,在操作步骤简单的场景,下达语音命令就有些多余,直接制作不同的按钮按下即可。
发明内容
本发明提供了基于目光连接的声音命令下达装置和方法,其克服了背景技术中声音命令下达装置和方法所存在的不足。
本发明解决其技术问题的所采用的技术方案之一是:
基于目光连接的声音命令下达装置,包括至少一声音采集器、一第一摄像机、一第一分析器、至少一装设有第二摄像机和光线发射器的自动云台、一第二分析器和一控制器;
该第一摄像机用于捕捉摄制可视空间内的图像以获第一视频数据,该第一分析器信号连接第一摄像机以用于分析第一视频数据,判断是否有人脸朝向第一摄像机且持续停留超过设定时间t1,如有则标定该人脸所处方位且至少将方位信息传输给控制器;
该控制器信号连接自动云台和光线发射器,该控制器依据方位信息调整自动云台使第二摄像机摄制人脸以获第二视频数据,控制光线发射器以向人眼发射光线,以获得人眼的反光图像;该第二分析器信号连接第二摄像机且分析第二视频数据,以获人脸实时三维坐标,且依据人眼图像和经人眼反射的反光图像及位置判断人眼是否正在注视摄像机;
该控制器信号连接第二分析器以判断人眼注视是否超过设定时间t2,如是则认定目光连接且向对应实时三维坐标的声音采集器发送命令以控制声音采集器采集声音。
一实施例之中:该光线发射器包括多个发射光源,所发射的光线为固定距离的多个发射光源组合发射,以获得人眼的包含多个反光点的反光图像。
一实施例之中:该自动云台的第二摄像机和光线发射器的发射光源相对固定在一起,并保持相对固定的距离,确保采集到的反光点图像的稳定和可计算性。
一实施例之中:该第一摄像机为广角摄像机,该第一分析器为广角图像采集分析器;该第二摄像机为长可变焦摄像机,第二分析器为长焦图像采集分析器。
一实施例之中:该第一分析器将该方位信息和人脸图像传输给控制器;该第二摄像机依据控制器传输的人脸图像进行捕捉及自动变焦调整,使摄制图像调至合适大小。
一实施例之中:还包括一显示装置和一数据库,该数据库内保存有包括与人脸信息一一对应在内的用户信息;该第二分析器还获取人脸信息,控制器获取人脸信息且依据人脸信息获取用户其它信息,并在显示装置上显示该用户相关的其它信息。
一实施例之中:该光线发射器发射出的光线为摄像机能捕捉且不刺激人眼的光线。
一实施例之中:还包括语义分析装置,信号连接控制器和声音采集器。
本发明解决其技术问题的所采用的技术方案之二是:
基于目光连接的声音命令下达方法,包括:
步骤11,捕捉摄制可视空间内的图像以获第一视频数据;
步骤12,分析第一视频数据,判断是否有人脸朝向第一摄像机且持续停留超过设定时间t1,如有则标定该人脸所处方位且获方位信息,然后执行步骤2,否则继续执行步骤11;
步骤2,依据方位信息调整第二摄像机,使第二摄像机摄制人脸以获第二视频数据,控制光线发射器以向人眼发射光线,所发射的光线为与第二摄像机固定距离的至少一个发射光源组合发射,以获得人眼反射的反光图像;
步骤3,分析第二视频数据,以获人脸实时三维坐标,且依据人眼图像和经人眼反射的反光图像及位置判断人眼是否正在注视摄像机;
步骤4,判断人眼注视是否超过设定时间t2,如是则认定目光连接;
步骤5,向对应实时三维坐标的声音采集器发送命令,声音采集器采集声音,识别声音以获语义内容,将语义内容提供给其它需要语义内容的设备访问,并判断对话是否结束,如结束则执行步骤11,如未结束,则忽略对话期间第一视频数据中转向摄像机组的人脸相关信息。
一实施例之中:该步骤3中,通过分析第二视频数据,还获取人脸图像;
该步骤5中,控制器依据人脸图像从数据库中获取对应的用户信息,还通过显示器显示对话过程中需要显示的提前设定的与该用户相关的其它信息。
本发明解决其技术问题的所采用的技术方案之三是:
基于目光连接的声音命令下达方法,包括:
步骤11,捕捉摄制可视空间内的图像以获第一视频数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陈飞;鲍可捷,未经陈飞;鲍可捷许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410461030.2/2.html,转载请声明来源钻瓜专利网。