[发明专利]基于声音定位的目标跟踪方法、电子设备及可读存储介质有效
申请号: | 202211092986.0 | 申请日: | 2022-09-08 |
公开(公告)号: | CN115174818B | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 陈涛;裴炜冬;郑永勤;廖家仙 | 申请(专利权)人: | 深圳市维海德技术股份有限公司 |
主分类号: | H04N23/611 | 分类号: | H04N23/611;H04N23/695;G10L21/0216;G10L25/51;G06V10/74;G06V40/10;G06V40/16;G06V40/40 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 丁志新 |
地址: | 518100 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 声音 定位 目标 跟踪 方法 电子设备 可读 存储 介质 | ||
1.一种基于声音定位的目标跟踪方法,其特征在于,所述基于声音定位的目标跟踪方法包括:
获取目标教室区域的讲台区域的可见光图像,通过目标检测得到所述可见光图像下的各人脸检测框、各人头检测框和各人身检测框;
对各所述人脸检测框与各所述人头检测框进行重叠度匹配,得到第二匹配代价矩阵;
获取所述第二匹配代价矩阵中的第二最优匹配代价值,将所述第二最优匹配代价值作为第二匹配结果;
对各所述人头检测框与各所述人身检测框进行重叠度匹配和相似度匹配,得到第三匹配代价矩阵;
获取所述第三匹配代价矩阵中的第三最优匹配代价值,将所述第三最优匹配代价值作为第三匹配结果;
依据所述第二匹配结果和所述第三匹配结果,进行多框合并,得到所述可见光检测框;
获取所述讲台区域的红外图像,通过目标检测得到所述红外图像下的各行人检测框;
对各所述可见光检测框和各所述行人检测框进行目标匹配,得到各活体对象;
采集各所述活体对象的音频信号,依据各所述音频信号的声学参数,定位目标跟踪对象所处的目标声源位置;
依据所述目标声源位置,对所述目标跟踪对象进行目标特写跟踪。
2.如权利要求1所述基于声音定位的目标跟踪方法,其特征在于,所述对各所述可见光检测框和各所述行人检测框进行目标匹配,得到各所述活体对象的步骤包括:
对各所述可见光检测框和各所述行人检测框进行相似度匹配,得到第一匹配代价矩阵;
获取所述第一匹配代价矩阵中的第一最优匹配代价值,将所述第一最优匹配代价值作为第一匹配结果;
依据所述第一匹配结果,确定对应的各目标可见光检测框和各目标行人检测框,将所述目标可见光检测框与目标行人检测框内共同的目标行人作为所述活体对象。
3.如权利要求1所述基于声音定位的目标跟踪方法,其特征在于,所述采集各所述活体对象的音频信号,依据各所述音频信号的声学参数,定位目标跟踪对象所处的目标声源位置的步骤包括:
通过麦克风阵列模块采集各所述音频信号;
对各所述音频信号进行增强处理,得到与各所述音频信号对应的拾音波束;
依据各所述拾音波束的声学参数,定位所述目标声源位置。
4.如权利要求3所述基于声音定位的目标跟踪方法,其特征在于,所述依据各所述拾音波束的声学参数,定位所述目标声源位置的步骤包括:
获取各所述拾音波束的接收时间,依据各所述接收时间,确定各所述拾音波束的接收先后顺序;
依据所述接收先后顺序,确定水平目标声源方位;
依据所述水平目标声源方位,定位所述目标声源位置。
5.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至4中任一项所述的基于声音定位的目标跟踪方法的步骤。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有实现基于声音定位的目标跟踪方法的程序,所述实现基于声音定位的目标跟踪方法的程序被处理器执行以实现如权利要求1至4中任一项所述基于声音定位的目标跟踪方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市维海德技术股份有限公司,未经深圳市维海德技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211092986.0/1.html,转载请声明来源钻瓜专利网。