[发明专利]一种基于两级模型的个性化头相关传输函数预测方法在审
申请号: | 202210115522.0 | 申请日: | 2022-02-07 |
公开(公告)号: | CN114510975A | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 王晶;邱音良;谢湘 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京正阳理工知识产权代理事务所(普通合伙) 11639 | 代理人: | 邬晓楠 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 两级 模型 个性化 相关 传输 函数 预测 方法 | ||
1.一种基于两级模型的个性化头相关传输函数预测方法,其特征在于:首先,基于提前测量的已知数据库中的人体参数、头相关传输函数数据以及角度信息对决策树模型以及Transformer神经网络模型逐级进行训练,得到训练好的两级模型;然后,采集待预测人员的人体参数,将人体参数作为训练好的两级模型的输入,得到该人员的个性化头相关传输函数数据,由此实现个性化头相关传输函数预测。
2.根据权利要求1所述的一种基于两级模型的个性化头相关传输函数预测方法,其特征在于:包括以下步骤,
步骤1、获取人体参数数据以及头相关传输函数数据:
在已知头相关传输函数数据库中,获取人体参数数据以及多个角度下各个频率点的头相关传输函数幅度值;
步骤2、构建并训练决策树模型:
构建决策树模型,构建的决策树数量与头相关传输函数频率点数量相同;
步骤3、训练Transformer神经网络模型:
将步骤2中每一个人在每个角度下的头相关传输函数幅度值中间预测向量以及对应的角度作为输入,将已知头相关传输函数数据库中的对应的头相关传输函数幅度值向量作为输出,对Transformer神经网络模型进行训练;
步骤4、构建两级模型:
将步骤2中构建并训练好的决策树模型以及步骤3中训练好的Transformer神经网络模型顺序连接,构成两级模型;
步骤5、预测个性化头相关传输函数数据:
获取待预测人员的人体参数,将人体参数以及需要预测的角度通过步骤4中的两级模型进行预测,两级模型的输出即为对应角度下的个性化头相关传输函数预测数据。
3.根据权利要求2所述的一种基于两级模型的个性化头相关传输函数预测方法,其特征在于:以步骤1中得到的已知头相关传输函数数据库中的每一个人对应的人体参数以及角度作为输入量,该角度下每一个频率点对应的单个头相关传输函数幅度值作为输出量,对决策树模型进行训练。
4.根据权利要求3所述的一种基于两级模型的个性化头相关传输函数预测方法,其特征在于:决策树模型的输出作为每一个人对应的多个角度下头相关传输函数幅度值中间预测向量。
5.根据权利要求1、2、3或4所述的一种基于两级模型的个性化头相关传输函数预测方法,其特征在于:还包括步骤6:根据音频内容以及回放方式的需要,使用步骤5得出的个性化头相关传输函数数据进行渲染,得到更符合待预测人员听觉感知的三维音频。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210115522.0/1.html,转载请声明来源钻瓜专利网。