|
钻瓜专利网为您找到相关结果 3803368个,建议您 升级VIP下载更多相关专利
- [发明专利]一种基于双层融合深度网络的语音情感识别方法-CN202210419568.1在审
-
李飞;李斌建;李汀
-
南京邮电大学
-
2022-04-21
-
2022-07-12
-
G10L25/63
- 本发明涉及一种基于双层融合深度网络的语音情感识别方法,为了获得丰富的交叉模态的信息本发明利用了语音和文本两个模态的特征向量进行寻优融合,捕捉复杂的关联在音频和文本之间进行情感识别。首先将语音和文本信息通过预处理,得到音频和文本特征向量,通过FBP特征融合模块,将音频特征,文本特征做多模态交叉融合,将融合后的特征向量分别经过LSTM,GRU,DNN三个子模型组成的level‑1初级特征编码网络,然后level‑1三个子网络的输出做二次融合,编码高级特征,融合的方法是hadmard积,最后将融合后的特征输入到level‑2的BiLSTM编码网络,最后接分类输出层,预测情感类别。本次提出的融合算法在公开数据集IEMOCAP上实验结果显示达到了80.38%WA和78.62%UA,实现了目前语音情感识别领域较好的结果。
- 一种基于双层融合深度网络语音情感识别方法
- [发明专利]一种基于ViT的多视角3D重建方法及系统-CN202210882614.1在审
-
付彦伟;曹辰捷
-
复旦大学
-
2022-07-26
-
2022-12-02
-
G06T17/00
- 本发明涉及一种基于ViT的多视角3D重建方法及系统,该方法包括:S1、获取指定场景多视角2D图片以及对应的相机参数;S2、选取参考图片以及源图片;构建融合ViT与特征金字塔网络FPN的特征抽取模型,进行特征抽取;S3、构建代价矩阵,并基于分类损失分层级优化不同层级的代价矩阵预测的深度图;S4、采用动态多尺度策略对构建的多视角重建MVS模型进行训练;S5、从测试集中选取参考图片及对应的源图片,采用预训练好的多视角重建MVS模型,对深度图进行预测,并采用深度融合算法对预测得到的多视角深度图进行深度融合和点云重建。与现有技术相比,本发明通过引入预训练的ViT,提升了MVS中特征抽取的鲁棒性,提高了最终3D重建的效果。
- 一种基于vit视角重建方法系统
|