[发明专利]确定语音关系有效
申请号: | 201710985501.3 | 申请日: | 2017-10-20 |
公开(公告)号: | CN107967916B | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 尼基·钱德鲁·拉奥;塞苏雷什·克里希纳库马兰 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/34 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 周亚荣;安翔 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定 语音 关系 | ||
本申请涉及确定语音关系。提供了确定语音关系的系统和方法。例如,能够接收指示由用户输入的输入文本短语的数据。能够确定对应于输入文本短语的口语呈现的音频输出。能够确定输入文本短语的音频输出的文本转录。文本转录能够是音频输出的文本表示。文本转录能够与多个测试短语相比较来标识文本转录与至少一个测试短语之间的匹配。
技术领域
本公开总体上涉及确定两个或两个以上短语之间的语音关系。
背景技术
言语识别已经变为与计算设备交互的广泛采用并且频繁使用的模式。言语输入可以比传统输入模式(诸如通过键盘键入)更方便并且更高效。例如,移动计算设备可以提供言语识别服务作为通过触摸屏上的虚拟键盘键入字符的备选输入模式。一些计算设备被配置成从用户接受声音命令,例如作为在计算设备上执行某些动作的快捷方式。以这种方式,这样的计算设备能够被配置成解译声音命令,并且基于声音命令解译而执行一个或多个动作。
在一些实例中,计算应用或服务的开发者能够选择能够由一个或多个用户使用以调用计算设备上的计算应用或服务的声音命令。确保这样的所选择的声音命令与已保留以调用其他计算应用或服务的其他声音命令语音上不同能够是重要的。以这种方式,向开发者或其他方指示由开发者或其他方所选择的声音命令是否与一个或多个所保留的声音命令语音上类似能够是有益的。
发明内容
本公开的实施例的各方面和优点将在以下描述中部分地阐述或者可以从描述学习或者可以通过实施例的实践学习。
本公开的一个示例方面涉及一种确定两个或两个以上短语之间的语音关系的计算机实现的方法。方法包括通过一个或多个计算设备接收指示由用户输入的输入文本短语的数据。方法还包括通过一个或多个计算设备确定对应于输入文本短语的口语呈现的音频输出。方法还包括通过一个或多个计算设备确定输入文本短语的音频输出的文本转录。文本转录包括音频输出的文本表示。方法还包括通过一个或多个计算设备将文本转录与多个测试短语相比较来标识文本转录与至少一个测试短语之间的匹配。
本公开的其他示例方面涉及用于确定语音关系的系统、装置、有形非瞬态计算机可读介质、用户界面、存储器设备和电子设备。
各种实施例的这些和其他特征、方面和优点将参考以下描述和随附的权利要求变得更好理解。并入本说明书中并且构成其一部分的附图图示了本公开的实施例,并且连同说明书用于解释相关的原理。
附图说明
在参考附图的说明书中阐述涉及本领域的普通技术人员的实施例的详细讨论,其中:
图1描绘了根据本公开的示例实施例的用于确定语音关系的示例系统的概述;
图2描绘了根据本公开的示例实施例的示例用户界面;
图3描绘了根据本公开的示例实施例的确定语音关系的示例方法的流程图;以及
图4描绘了根据本公开的示例实施例的示例系统。
具体实施方式
现在将详细参考实施例,其中的一个或多个示例被图示在附图中。通过实施例的解释而非本公开的限制的方式提供每个示例。实际上,对于本领域的技术人员而言将明显的是,可以对实施例做出各种修改和变型而不脱离本公开的范围或精神。例如,被图示或被描述为一个实施例的一部分的特征可以与另一实施例一起被用于产生又一实施例。因此,本公开的各方面旨在覆盖这样的修改和变型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710985501.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:显示装置及其控制方法
- 下一篇:通过神经网络机器学习的车辆周围音频分类