[发明专利]动态最佳位点校准有效
申请号: | 201910588434.0 | 申请日: | 2019-07-02 |
公开(公告)号: | CN110677803B | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | P.萨哈;S.K.S.赛伊;A.达斯古普塔;P.查克拉博蒂;D.马吉姆德 | 申请(专利权)人: | 哈曼国际工业有限公司 |
主分类号: | H04S7/00 | 分类号: | H04S7/00;G06N3/08;G06N3/04;G06V20/52;G06V10/82 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 高巍 |
地址: | 美国康*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 动态 最佳 校准 | ||
1.一种用于动态最佳位点校准的方法,所述方法包括:
接收收听环境的图像;
基于所述图像生成人群密度图;以及
基于所述人群密度图设置与音频系统相关联的至少一个音频参数,其中基于所述至少一个音频参数生成至少一个音频输出信号;
其中设置所述至少一个音频参数包括:
通过至少部分地基于所述收听环境的物理尺寸而将所述人群密度图中的像素位置转换为真实世界坐标系,基于所述人群密度图在所述收听环境中确定目标位置,其中所述收听环境的物理尺寸包括从舞台的中心点到所述目标位置的距离;
确定所述至少一个音频参数的值以配置所述音频系统来在所述目标位置处产生最佳位点;以及
至少部分地基于所述值设置所述至少一个音频参数。
2.如权利要求1所述的方法,其中所述最佳位点的位置对应于所述人群密度图的质心。
3.如权利要求1所述的方法,所述方法还包括:经由卷积神经网络增强所述收听环境的所述图像以生成增强的图像,其中用以下各者来训练所述卷积神经网络:(i)以第一光级照亮的所述收听环境的第一训练图像;以及(ii)以大于所述第一光级的第二光级照亮的所述收听环境的第二训练图像。
4.如权利要求3所述的方法,其中生成所述人群密度图还包括:
经由至少一个机器学习算法检测包括在所述收听环境的所述图像中的个人的至少一个物理特征;
至少部分地基于所述个人的所述物理特征而确定人群密度;以及
使用所述人群密度生成所述人群密度图。
5.如权利要求1所述的方法,其中所述至少一个音频参数包括所述音频输出的信号的相位和功率中的至少一者。
6.如权利要求1所述的方法,所述方法还包括:响应于所述人群密度图的变化动态地修改所述至少一个音频参数。
7.一种用于动态最佳位点校准的系统,所述系统包括:
存储器,所述存储器存储应用程序;以及
处理器,所述处理器耦合到所述存储器,并且当执行所述应用程序时,被配置为:
接收收听环境的图像;
至少部分地基于所述图像生成人群密度图;以及
至少部分地基于所述人群密度图设置与所述系统相关联的至少一个音频参数;
其中设置所述至少一个音频参数包括:
通过至少部分地基于所述收听环境的物理尺寸而将所述人群密度图中的像素位置转换为真实世界坐标系,至少部分地基于所述人群密度图确定在所述收听环境中的最佳位点位置,其中所述收听环境的物理尺寸包括从舞台的中心点到所述目标位置的距离;
确定所述至少一个音频参数的至少一个值以配置音频系统来在所述最佳位点位置处产生最佳位点;以及
至少部分地基于所述至少一个值而设置所述至少一个音频参数。
8.如权利要求7所述的系统,其中所述处理器还被配置为经由卷积神经网络增强所述收听环境的所述图像以生成增强的图像,其中用以下各者来训练所述卷积神经网络:(i)以第一光级照亮的所述收听环境的第一训练图像;以及(ii)以大于所述第一光级的第二光级照亮的所述收听环境的第二训练图像。
9.如权利要求7所述的系统,其中所述处理器还被配置为:响应于所述人群密度图的变化而实时动态地修改所述至少一个音频参数。
10.如权利要求7所述的系统,其中所述人群密度图包括热图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈曼国际工业有限公司,未经哈曼国际工业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910588434.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于处理音频的方法和装置
- 下一篇:用于数字信号处理的系统和方法