[发明专利]图像采集的控制方法、装置及采集终端在审
申请号: | 201910746092.0 | 申请日: | 2019-08-13 |
公开(公告)号: | CN110505399A | 公开(公告)日: | 2019-11-26 |
发明(设计)人: | 王光强;林宏伟;薛新丽;王之奎;贾其燕 | 申请(专利权)人: | 聚好看科技股份有限公司 |
主分类号: | H04N5/232 | 分类号: | H04N5/232;G10L17/06;G01S5/18;H04N7/15 |
代理公司: | 44232 深圳市隆天联鼎知识产权代理有限公司 | 代理人: | 朱黎<国际申请>=<国际公布>=<进入国 |
地址: | 266100 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 摄像头 采集 采集终端 声纹识别 图像采集 图像 发言人跟踪 拍摄画面 有效解决 焦距 拍摄 盲区 应用 | ||
1.一种图像采集的控制方法,应用于采集终端,其特征在于,所述方法包括:
对采集的音频进行声纹识别,通过所述声纹识别确定发言人是否变化;
若发言人变化,则根据所采集的音频定位所述音频所对应发言人在空间中的位置;
根据所定位到的位置,对所述采集终端中的摄像头进行调整,调整后,所述音频所对应发言人位于所述摄像头的拍摄画面中央,所述调整包括调整所述摄像头的拍摄角度和/或调整所述摄像头的焦距;
通过调整后的摄像头进行图像采集获得所述音频所对应发言人的图像。
2.根据权利要求1所述的方法,其特征在于,所述对所述音频进行声纹识别,通过所述声纹识别判断发言人是否变化,包括:
从所述音频中提取声纹特征;
计算所提取声纹特征相对于上一所采集音频所对应声纹特征的声纹相似度;
根据所述声纹相似度确定发言人是否变化。
3.根据权利要求1所述的方法,其特征在于,所述采集终端包括一个参考声音采集模块和至少三个非参考声音采集模块,所述根据所采集的音频定位所述音频所对应发言人在空间中的位置,包括:
根据所述参考声音采集模块和所述非参考声音采集模块所分别采集到所述音频的时间,计算得到每一所述非参考声音采集模块相对于所述参考声音采集模块采集到所述音频的时延;
根据所述参考声音采集模块、所述非参考声音采集模块的布置位置和所述时延进行计算,获得所述音频所对应发言人的位置坐标。
4.根据权利要求1所述的方法,其特征在于,所述根据所定位到的位置,对所述采集终端中的摄像头进行调整,包括:
根据所定位到的位置,确定所述音频所对应发言人相对于所述摄像头的距离和方位;
根据所确定的距离调整所述摄像头的焦距,以及根据所确定的方位调整所述摄像头的拍摄角度。
5.根据权利要求1所述的方法,其特征在于,所述通过调整后的摄像头进行图像采集获得所述音频所对应发言人的图像,包括:
根据调整后的摄像头所采集的图像,进行发言人识别,在所述图像中定位所述发言人的人像;
根据所定位到的人像对所述图像进行剪裁,获得所述发言人的图像。
6.根据权利要求5所述的方法,其特征在于,所述根据调整后的摄像头所采集的图像,进行发言人识别,在所述图像中定位所述发言人的人像,包括:
根据调整后的摄像头所采集的图像,为所采集图像中的每一人像对指定器官进行像素点提取;
根据所提取的像素点进行动作识别,确定所提取像素点所表征的动作;
将所表征动作与预定动作相符的像素点所在人像确定为发言人的人像。
7.根据权利要求1所述的方法,其特征在于,所述通过调整后的摄像头进行图像采集获得所述音频所对应发言人的图像之后,所述方法还包括:
将所述采集终端所显示的图像替换为所述发言人的图像。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
检测在间隔设定时间段后是否仍未采集到音频;
若为是,则控制所述摄像头旋转至预设拍摄角度;
若为否,则执行所述对采集的音频进行声纹识别的步骤。
9.一种图像采集的控制装置,应用于采集终端,其特征在于,所述装置包括:
声纹识别模块,用于对采集的音频进行声纹识别,通过所述声纹识别确定发言人是否变化;
定位模块,用于若声纹识别模块判断发言人变化,则根据所采集的音频定位所述音频所对应发言人在空间中的位置;
控制模块,用于根据所定位到的位置,对所述采集终端中的摄像头进行调整,调整后,所述音频所对应发言人位于所述摄像头的拍摄画面中央,所述调整包括调整所述摄像头的拍摄角度和/或调整所述摄像头的焦距;
图像采集模块,用于通过调整后的摄像头进行图像采集获得所述音频所对应发言人的图像。
10.一种采集终端,其特征在于,包括:
处理器;及
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如权利要求1至8中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于聚好看科技股份有限公司,未经聚好看科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910746092.0/1.html,转载请声明来源钻瓜专利网。