[发明专利]端到端语音识别模型处理方法、语音识别方法及相关装置在审
申请号: | 202111574334.6 | 申请日: | 2021-12-21 |
公开(公告)号: | CN114299930A | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 吴振宗;刘柏基;陈宇;徐易楠;康世胤;许佳 | 申请(专利权)人: | 广州虎牙科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/16;G10L15/26 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 张欣欣 |
地址: | 511495 广东省广州市番禺*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 端到端 语音 识别 模型 处理 方法 相关 装置 | ||
本发明提供的端到端语音识别模型处理方法、语音识别方法及相关装置,方法包括:获取预设词表和文本语料集;其中,所述预设词表用于维护任意一种直播领域中的热词、所述热词对应的发音路径和建模单元;根据所述文本语料集,训练初始的语言模型的模型参数,得到所述直播领域对应的目标语言模型;根据所述热词的发音路径和建模单元,更新所述目标语言模型,并确定更新后的目标语言模型中所述热词的权重;根据更新后的所述目标语言模型,生成端到端语音识别模型。由于在生成的目标语音识别模型中包含了直播领域中的热词的权重,因而使得模型能够实在语音识别过程中自动选取最佳权重对应热词,提高了热词的识别准确率。
技术领域
本发明涉及语音识别技术领域,具体而言,涉及一种端到端语音识别模型处理方法、语音识别方法及相关装置。
背景技术
语音识别是人工智能领域的常见处理内容,比如在人机交互、语音转文字等场景中,语音识别是不可或缺的处理内容。
对于实际用在产品上的语音识别软件,对于同一个发音,在特定领域,比如游戏领域,模型能够识别特定领域的专有名词。然而,目前常用的端到端语音识别模型对于特定领域内的热词,也就是专业名词、专业术语的识别效果很差。
如何提高端到端语音识别模型针对特定领域的热词的识别准确率,是需要解决的技术问题。
发明内容
本发明的目的之一在于提供一种端到端语音识别模型处理方法、语音识别方法及相关装置,其能够提高特定领域的热词的识别准确率。
本发明的实施例可以这样实现:
第一方面,本发明提供一种端到端语音识别模型的处理方法,包括:获取预设词表和文本语料集;其中,所述预设词表用于维护任意一种直播领域中的热词、所述热词对应的发音路径和建模单元;根据所述文本语料集,训练初始的语言模型的模型参数,得到所述直播领域对应的目标语言模型;根据所述热词的发音路径和建模单元,更新所述目标语言模型,并确定更新后的目标语言模型中所述热词的权重;根据更新后的所述目标语言模型,生成端到端语音识别模型。
第二方面,本发明提供一种语音识别方法,所述方法包括:获取待识别语音;确定所述待识别语音对应的直播领域,并将所述待识别语音输入到所述直播领域对应的端到端语音识别模型,得到所述待识别语音对应的文本;其中,所述直播领域对应的端到端语音识别模型包括语言模型;所述语言模型是基于文本训练集、预设词表中热词的权重和发音路径得到的,所述预设词表用于维护所述直播领域中的热词、所述热词对应的发音路径。
第三方面,本发明提供一种端到端语音识别模型处理装置,包括:获取模块,用于获取预设词表和文本语料集;其中,所述预设词表用于维护任意一种直播领域中的热词、所述热词对应的发音路径和建模单元;训练模块,用于根据所述文本语料集,训练初始的语言模型的模型参数,得到所述直播领域对应的目标语言模型;更新模块,用于根据所述热词的发音路径和建模单元,更新所述目标语言模型,并确定更新后的目标语言模型中所述热词的权重;生成模块,用于根据更新后的所述目标语言模型,生成端到端语音识别模型。
第四方面,本发明提供一种语音识别装置,包括:获取模块,用于获取待识别语音;识别模块,用于确定所述待识别语音对应的直播领域,将所述待识别语音输入到所述直播领域对应的端到端语音识别模型,得到所述待识别语音对应的文本;其中,所述直播领域对应的端到端语音识别模型包括语言模型;所述语言模型是基于文本训练集、预设词表中热词的权重、发音路径和建模单元得到的,所述预设词表用于维护所述直播领域中的热词、所述热词对应的发音路径。
第五方面,本发明提供一种电子设备,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机程序,所述处理器可执行所述计算机程序以实现前述实施方式任一项所述的方法和/或前述实施方式所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州虎牙科技有限公司,未经广州虎牙科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111574334.6/2.html,转载请声明来源钻瓜专利网。