[发明专利]一种语音深度神经网络模型输出音素概率的方法有效
申请号: | 202011495085.7 | 申请日: | 2020-12-17 |
公开(公告)号: | CN112668310B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 梁骏;汪文轩;王坤鹏;陈谢;姚欢;卢燕 | 申请(专利权)人: | 杭州国芯科技股份有限公司 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/279;G06F3/06;G06N3/047;G06N3/08 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱亚冠 |
地址: | 310012 浙江省杭州市文*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种语音深度神经网络模型输出音素概率的方法。现有低信噪比的实际使用场景里,语音深度神经网络模型的输出音素的概率的可信度不高。本发明方法首先将每个原始音素分别根据音素类别增加一个置信度信息,然后将置信度信息与设定阈值比较:大于等于阈值时,则该原始音素对应的概率保持不变;小于阈值时,在修正前原始音素的概率基础上加修正值,作为输出音素概率。最后深度神经网络输出音素概率,作为解码依据。采用本发明方法,经过音素置信度修正后,修正音素概率中辅音的语音概率提高,增加了文字识别的能力,音素置信度修正保持了元音的语音概率,减小误激活的情况发生。 | ||
搜索关键词: | 一种 语音 深度 神经网络 模型 输出 音素 概率 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州国芯科技股份有限公司,未经杭州国芯科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011495085.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种过滤电视无效节目的方法
- 下一篇:一种发光雕塑及其制造方法