[发明专利]跟进话音查询预测有效
申请号: | 201780042496.0 | 申请日: | 2017-06-23 |
公开(公告)号: | CN109844740B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | B.贝扎迪;D.奥斯马科夫;M.鲍姆尔;G.斯科贝尔特辛 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06F40/20 | 分类号: | G06F40/20;G10L15/18 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邵亚丽 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 跟进 话音 查询 预测 | ||
用于预测对话语的初始转录的跟进查询的方法、系统和装置,其包括编码在计算机存储介质上的计算机程序。在一些实施方式中,识别与用户的初始话语的转录预关联的一个或多个跟进查询。获得新的或修改的语言模型,其中与一个或多个跟进查询相关联的相应概率相对于初始语言模型增加。然后接收与用户的后续话语相对应的后续音频数据。使用新的或修改的语言模型处理后续音频数据,以生成后续话语的转录。然后提供后续话语的转录以输出给用户。
技术领域
本说明书涉及自动语音识别(automated speech recognition,ASR)。
背景技术
语音识别是指使用自动语音识别器(automated speech recognizer,ASR)将口语单词转录成文本。在传统ASR系统中,接收到的音频被转换成计算机可读的声音,然后和与给定语言相关联的单词词典进行比较。
发明内容
一般来说,本说明书中描述的主题的一个创新方面可以体现在通过识别可能后续由用户提供的一组跟进(follow-up)话音查询,并调整语言模型以增加与跟进话音查询相关联的相应概率来提高话音识别准确性的方法中。例如,在从用户接收到初始查询(例如,文本查询)或其他类型的用户输入之后,预测与初始话音查询预关联的一组预测的跟进查询。ASRM然后可以调整与预测的跟进查询相关联的语言模型内的相应概率,使得对来自用户的后续(subsequent)话音查询的处理更有可能将后续话音查询转录为预测的跟进话音查询之一。在这点上,一旦用户已经提供了初始查询,所描述的方法使得ASRM能够更准确地说明与后续话音查询提交相关联的概率的变化。
实施方式可以包括一个或多个以下特征。例如,计算机实施的方法可以包括:识别与用户的初始话语的转录预关联的一个或多个跟进查询;获得新的或修改的语言模型,其中与一个或多个跟进查询相关联的相应概率相对于初始语言模型增加;接收与用户的后续话语相对应的后续音频数据;使用新的或修改的语言模型处理后续音频数据,以生成后续话语的转录;以及提供后续话语的转录以输出给用户。
在一些实施方式中,计算机实施的方法可以包括:识别和与用户的初始话语的转录相关联的一个或多个搜索结果预关联的一个或多个跟进查询;获得新的或修改的语言模型,其中与一个或多个跟进查询相关联的相应概率相对于初始语言模型增加;接收与用户的后续话语相对应的后续音频数据;使用新的或修改的语言模型处理后续音频数据,以生成与后续话语的转录相关联的一个或多个搜索结果;以及提供与跟进话语的转录相关联的一个或多个搜索结果以输出给用户。
在一些实施方式中,计算机实施的方法可以包括:识别和与一个或多个搜索结果相关联的数据预关联的一个或多个跟进查询,该搜索结果与用户的初始话语的转录相关联;获得新的或修改的语言模型,其中与一个或多个跟进查询相关联的相应概率相对于初始语言模型增加;接收与用户的后续话语相对应的后续音频数据;使用新的或修改的语言模型处理后续音频数据,以生成和与后续话语的转录相关联的一个或多个搜索结果相关联的数据;以及提供和与后续话语的转录相关联的一个或多个搜索结果相关联的数据以输出给用户。
其他版本包括对应的系统和计算机程序,其被配置为执行在计算机存储设备上编码的方法的动作。
一个或多个实施方式可以包括以下可选特征。例如,在一些实施方式中,该方法可以进一步包括:接收与用户的初始话语相对应的初始音频数据;以及使用初始语言模型处理音频数据以生成初始话语的转录。
在一些实施方式中,获得新的或修改的语言模型包括:访问包括一个或多个跟进查询映射的数据库,每个跟进查询映射针对(i)用户话语的先前转录、(ii)与用户相关联的先前搜索结果、以及(iii)和与用户相关联的先前搜索结果相关联的数据来指定候选跟进查询的列表;确定用户的初始话语的转录的一个或多个术语包括在一个或多个跟进查询映射内;以及调整初始语言模型以增加与候选跟进查询的列表相关联的相应概率,该候选跟进查询的列表与包括在一个或多个跟进查询映射内的用户的初始话语的转录的一个或多个术语相对应。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780042496.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于在多种信号中模式识别的方法
- 下一篇:在自动聊天中生成响应