[发明专利]提升使用CNN网络结构的语音任务的性能的方法有效
申请号: | 201910930279.6 | 申请日: | 2019-09-29 |
公开(公告)号: | CN110544472B | 公开(公告)日: | 2021-12-31 |
发明(设计)人: | 陈华官;张志齐 | 申请(专利权)人: | 上海依图信息技术有限公司 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L17/06;G10L17/18;G10L25/30 |
代理公司: | 上海市汇业律师事务所 31325 | 代理人: | 唐嘉伟 |
地址: | 200126 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种提升使用CNN网络结构的语音任务的性能的方法,该方法是在语音频谱图中增加位置嵌入。本发明通过在语音频谱图中增加位置嵌入,使得CNN网络在做卷积时能够利用频率信息做一些差异性的处理,从而提升了使用CNN网络结构的语音识别、声纹识别、语言分类等频率的绝对位置信息比较重要的语音任务的性能。 | ||
搜索关键词: | 提升 使用 cnn 网络 结构 语音 任务 性能 方法 | ||
【主权项】:
1.提升使用CNN网络结构的语音任务的性能的方法,其特征在于,在语音频谱图中增加位置嵌入。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海依图信息技术有限公司,未经上海依图信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910930279.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种车载电器智能控制装置
- 下一篇:语音交互方法和装置