[发明专利]信号处理装置、方法和程序在审
申请号: | 202080064274.0 | 申请日: | 2020-09-04 |
公开(公告)号: | CN114402390A | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 难波隆一;阿久根诚;及川芳明 | 申请(专利权)人: | 索尼集团公司 |
主分类号: | G10L25/84 | 分类号: | G10L25/84;H04R3/00 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 余刚 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信号 处理 装置 方法 程序 | ||
本技术涉及一种使获得高质量目标声音成为可能的信号处理装置、方法和程序。该信号处理装置设置有:区间检测单元,用于在移动体周围存在其它移动体的状态下,基于收集移动体周围的声音所获得的收录信号以及从安装在移动体的传感器输出的传感器信号,检测收录信号中包含的移动体发出的声音的时间区间。本技术可以适用于记录系统。
技术领域
本技术涉及一种信号处理装置、方法和程序,并且具体地,涉及一种使获得高质量目标声音成为可能的信号处理装置、方法和程序。
背景技术
为了再现从诸如鸟瞰视图和漫步视图的自由视点生成的声场,重要的是以高SN比(信噪比)收录来自目标声源的声音,并且同时需要获取指示相应声源的位置和方位的信息。
来自目标声源的声音的具体示例包括来自人类的语音、人类的一般动作声音(例如行走声音和跑步声音)以及运动、游戏等内容特有的动作声音(例如踢球声音)。
此外,作为与用户行为识别相关联的技术,例如,已经提出了通过分析由多个距离测量传感器检测到的距离测量传感器数据来获得一个或多个用户的行为识别结果的技术(例如,见PTL1)。
[引文列表]
[专利文献]
[PTL1]
JP2017-205213A
发明内容
[技术问题]
同时,在从自由视点收录运动、戏剧等作为内容的情况下,在收录空间中包括多个声源。这些声源在某种情况下可能会做出复杂的动作。在这种情况下,难以以高SN比获得目标声源的声音。因此,难以获得高质量的目标声音。
本技术是在考虑到上述情况开发的,并且旨在获得高质量的目标声音。
[问题的解决方案]
根据本技术的一个方面的信号处理装置包括区间检测单元,该区间检测单元被配置为检测包含从移动体发出的声音的时间区间,并且该声音被包括在通过在移动体周围存在其它移动体的状态下收集移动体周围的声音而获得的收录信号中,基于收录信号和从附接到移动体的传感器输出的传感器信号来检测时间区间。
根据本技术的一个方面的信号处理方法或程序包括检测包含从移动体发出的声音的时间区间的步骤,并且该声音被包括在通过在移动体周围存在其它移动体的状态下收集移动体周围的声音而获得的收录信号中,基于收录信号和从附接到移动体的传感器输出的传感器信号来检测时间区间。
根据本技术的方面,基于收录信号和从附接到移动体的传感器输出的传感器信号,检测包含从移动体发出的声音的时间区间,并且该声音被包括在通过在移动体周围存在其它移动体的状态下收集移动体周围的声音而获得的收录信号中。
附图说明
图1是描绘收录系统的配置示例的示图。
图2是解释对象和对象声源的示图。
图3是描绘声源分类区间信息的示例的示图。
图4是解释声源分类区间信息的生成的示图。
图5是解释移除目标对象的选择的示图。
图6是解释收录处理的流程图。
图7是解释数据生成处理的流程图。
图8是描绘收录系统的配置示例的示图。
图9是解释数据生成处理的流程图。
图10是描绘收录系统的配置示例的示图。
图11是解释收录处理的流程图。
图12是解释数据生成处理的流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼集团公司,未经索尼集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080064274.0/2.html,转载请声明来源钻瓜专利网。