[发明专利]使用校正的术语的声学模型训练有效
| 申请号: | 201780047138.9 | 申请日: | 2017-06-20 |
| 公开(公告)号: | CN109791761B | 公开(公告)日: | 2023-04-25 |
| 发明(设计)人: | O.卡普拉洛瓦;E.A.切雷帕诺夫;D.奥斯马科夫;M.鲍姆尔;G.斯科贝尔特森 | 申请(专利权)人: | 谷歌有限责任公司 |
| 主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/22;G10L15/32 |
| 代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 金玉洁 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 使用 校正 术语 声学 模型 训练 | ||
1.一种计算机实现的方法,包括:
接收对应于话语的第一音频数据;
获得第一音频数据的第一转录;
接收指示(i)对第一转录的一个或多个术语的选择和(ii)替换术语中的一个或多个的数据;
确定替换术语中的一个或多个被分类为选择的术语中的一个或多个的校正;
响应于确定替换术语中的一个或多个被分类为选择的术语中的一个或多个的校正,获得对应于第一转录的一个或多个术语的第一音频数据的第一部分;以及
使用与第一转录的一个或多个术语相关联的第一音频数据的第一部分来训练声学模型用于识别替换术语中的一个或多个;
接收对应于话语的第二音频数据,所述第二音频数据包括对应于第一音频数据的第一部分的第二部分;
获得第二音频数据的第二转录;
从第二音频数据中辨别第二部分;
使用训练的声学模型获得第二部分的校正的转录;以及
获得将第二转录和校正的转录合并的转录。
2.如权利要求1所述的方法,还包括:
获得响应于将第二转录和校正的转录合并的转录的搜索结果;以及
提供搜索结果中的一个或多个。
3.如权利要求1-2中任一项所述的方法,其中,确定替换术语中的一个或多个被分类为选择的术语中的一个或多个的校正包括确定选择的术语中的一个或多个与替换术语中的一个或多个之间的语音相似性。
4.如权利要求3所述的方法,其中,确定所述语音相似性包括计算选择的术语中的一个或多个中的每一个与替换术语中的一个或多个中的每一个之间的语音距离。
5.如权利要求1,2和4中任一项所述的方法,其中,确定替换术语中的一个或多个被分类为选择的术语中的一个或多个的校正包括确定选择的术语中的一个或多个当中的连接。
6.如权利要求1,2和4中任一项所述的方法,其中,确定替换术语中的一个或多个被分类为选择的术语中的一个或多个的校正包括确定选择的术语中的一个或多个是连续的。
7.如权利要求1,2和4中任一项所述的方法,其中,确定替换术语中的一个或多个被分类为选择的术语中的一个或多个的校正包括确定选择的术语中的一个或多个中的每一个包括阈值数量的字符。
8.一种计算机实现的系统,包括:
处理器,被配置为施行计算机程序指令;以及
用所述计算机程序指令编码的计算机存储介质,当由所述处理器施行所述计算机程序指令时,使所述系统执行操作,所述操作包括:
接收对应于话语的第一音频数据;
获得第一音频数据的第一转录;
接收指示(i)对第一转录的一个或多个术语的选择和(ii)替换术语中的一个或多个的数据;
确定替换术语中的一个或多个被分类为选择的术语中的一个或多个的校正;
响应于确定替换术语中的一个或多个被分类为选择的术语中的一个或多个的校正,获得对应于第一转录的一个或多个术语的第一音频数据的第一部分;以及
使用与第一转录的一个或多个术语相关联的第一音频数据的第一部分来训练声学模型用于识别替换术语中的一个或多个;
接收对应于话语的第二音频数据,所述第二音频数据包括对应于第一音频数据的第一部分的第二部分;
获得第二音频数据的第二转录;
从第二音频数据中辨别第二部分;
使用训练的声学模型获得第二部分的校正的转录;以及
获得将第二转录和校正的转录合并的转录。
9.如权利要求8所述的系统,其中所述操作包括:
获得响应于将第二转录和校正的转录合并的转录的搜索结果;以及
提供搜索结果中的一个或多个。
10.如权利要求8-9中任一项所述的系统,其中,确定替换术语中的一个或多个被分类为选择的术语中的一个或多个的校正包括确定选择的术语中的一个或多个与替换术语中的一个或多个之间的语音相似性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780047138.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:信号处理装置、信号处理方法和程序
- 下一篇:语音接口设备的噪声降低





