[发明专利]一种基于两级模型的个性化头相关传输函数预测方法在审

专利信息
申请号: 202210115522.0 申请日: 2022-02-07
公开(公告)号: CN114510975A 公开(公告)日: 2022-05-17
发明(设计)人: 王晶;邱音良;谢湘 申请(专利权)人: 北京理工大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62
代理公司: 北京正阳理工知识产权代理事务所(普通合伙) 11639 代理人: 邬晓楠
地址: 100081 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 两级 模型 个性化 相关 传输 函数 预测 方法
【说明书】:

本发明涉及一种基于两级模型的个性化头相关传输函数预测方法,属于虚拟三维音频、沉浸式音频技术领域。本发明的一种基于两级模型的个性化头相关传输函数预测方法:首先,基于已知的头相关传输函数数据库中的人体参数、头相关传输函数数据以及角度信息对决策树模型以及Transformer神经网络模型逐级进行训练,并顺序连接,得到训练好的两级模型;然后,采集待预测人员的人体参数,将人体参数作为训练好的两级模型的输入,得到该人员的个性化头相关传输函数数据,由此实现个性化头相关传输函数预测。本发明通过两级模型降低平均预测误差,提高预测结果的精度;利用开源小型数据库,简化试验测量过程;通过Transformer模型避免训练中的过拟合现象。

技术领域

本发明涉及一种基于两级模型的个性化头相关传输函数预测方法,属于虚拟三维音频、沉浸式音频技术领域。

背景技术

近年来,以虚拟现实为代表的沉浸式系统一直在不断发展,为了得到更好的沉浸式体验,人们对三维音频的要求逐渐提高。通过对人类听觉系统的研究,目前能够使用头相关传输函数来模拟声音传输到耳朵的过程,通过头相关传输函数能够得到极佳的沉浸式体验。而头相关传输函数与人体密切相关,不同的人的头相关传输函数差异很大,所以需要得到使用者的个性化头相关传输函数。

一般通过以下几种方法获取个性化头相关传输函数:1、传统声学测量法,通过在无回声环境下将一个或几个扬声器放置在需要测量的方向上,并在听者耳道入口处放置麦克风,记录相应的脉冲响应能够得到听者的头相关传输函数;传统声学测量法需要复杂的实验设备,同时对实验环境要求高。2、数值模拟法,基于声学衍射理论,使用简化的人类模型来确定,例如无头模型、球形头模型、椭圆头模型以及雪人模型;数值模拟法需要精细的人体建模,无法快速得到个性化头相关传输函数。3、基于感知反馈法,依照听音人员的自我选择,基于反馈调整目前数据库中的头相关传输函数;基于感知反馈法测试流程长,且依赖于个人的听音经验,不适合所有人。4、基于人体参数预测法,通过建立回归模型,得到人体参数与头相关传输函数的关系,但不同的预测方法所得到的精度有所差异。

我国公开号为CN108596016A(公开日:2018年9月28日)的专利一种基于深度神经网络的个性化头相关传输函数建模方法,公开一种基于深度神经网络的个性化头相关传输函数建模方法,基于空间主成分分析对头相关传输函数数据进行分解,将分解得到的系数等用于建模,同时使用人体参数数据参与建模;该方法需要头相关传输函数数据库的精度较高,测量比较复杂;我国公开号为CN109145360A(公开日:2019年1月4日)的专利基于稀疏约束的头相关传输函数个性化建模系统,公开一种基于稀疏约束的头相关传输函数个性化建模系统,通过将预先获取的人体参数和头相关传输函数数据分别构第一负稀疏模型和第二负稀疏模型,确定二者的权重映射关系,其他对象的人体参数能够使用该映射关系预测个性化头相关传输函数,该方法需要基于大型头相关传输函数数据库,处理速度较慢。

发明内容

针对现有个性化头相关传输函数预测误差较大,导致对头相关传输函数数据库的规模以及精度要求较高的技术缺陷,本发明的目的是提出一种基于两级模型的个性化头相关传输函数预测方法,由人体参数通过两级模型预测个性化头相关传输函数,不需使用大型头相关传输函数数据库做训练,且增加个性化头相关传输函数的预测准确率。

本发明的目的是通过以下技术方案实现的:

本发明的一种基于两级模型的个性化头相关传输函数预测方法:首先,基于已知头相关传输函数数据库中的人体参数、头相关传输函数数据以及角度信息对决策树模型以及Transformer神经网络模型逐级进行训练,并顺序连接,得到训练好的两级模型;然后,采集待预测人员的人体参数,将人体参数作为训练好的两级模型的输入,得到该人员的个性化头相关传输函数数据,由此实现个性化头相关传输函数预测;

本发明的一种基于两级模型的个性化头相关传输函数预测方法,包括以下步骤:

步骤1、获取人体参数数据以及头相关传输函数数据:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210115522.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top