[发明专利]用于数字助理服务中的语音匹配的方法和系统有效
申请号: | 201810072173.2 | 申请日: | 2018-01-25 |
公开(公告)号: | CN108874766B | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | A·斯吉林;M·J·亨特;G·埃弗曼 | 申请(专利权)人: | 苹果公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/10;G10L15/22;G10L15/26;G06F16/432;G06F40/20 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华;张宁 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 数字 助理 服务 中的 语音 匹配 方法 系统 | ||
1.一种用于提供数字助理服务的方法,包括:
在具有存储器和一个或多个处理器的一个或多个电子设备处:
接收来自用户的言语输入;
确定所述言语输入是否包括对媒体项目的用户请求;
根据确定所述言语输入包括对媒体项目的用户请求,从媒体项目的储存库来确定候选媒体项目;
基于第一分数和第二分数之间的差值来确定是否要将所述候选媒体项目提供给所述用户,其中所述第一分数指示所述候选媒体项目的语音表示和所述言语输入的语音表示之间的匹配度,以及其中所述第二分数是与所述言语输入的所述语音表示相关联的预期分数;以及
根据确定要将所述候选媒体项目提供给所述用户,将所述候选媒体项目提供给所述用户。
2.根据权利要求1所述的方法,其中所述言语输入包含非结构化自然语言信息。
3.根据权利要求1所述的方法,其中确定所述言语输入是否包括对媒体项目的用户请求包括:
基于所述言语输入来获得字词序列;以及
确定所述字词序列是否包括对媒体项目的所述用户请求的表示。
4.根据权利要求3所述的方法,其中基于所述言语输入来获得所述字词序列包括基于统计语言模型来执行所述言语输入的言语到文本转换。
5.根据权利要求3所述的方法,其中确定所述字词序列是否包括对媒体项目的所述用户请求的表示包括确定所述字词序列是否包括一个或多个预先确定的字词。
6.根据权利要求3所述的方法,其中确定所述字词序列是否包括对媒体项目的所述用户请求的表示包括确定所述字词序列是否对应于一个或多个预先确定的语法。
7.根据权利要求3所述的方法,其中确定所述字词序列是否包括对媒体项目的所述用户请求的表示包括确定所述字词序列是否包括一个或多个停用字词。
8.根据权利要求1所述的方法,其中从媒体项目的储存库来确定所述候选媒体项目包括:
生成表示所述言语输入的语音符号序列;
基于表示所述言语输入的所述语音符号序列来确定一个或多个参考语音符号序列;以及
基于所确定的一个或多个参考语音符号序列来确定候选媒体项目。
9.根据权利要求8所述的方法,其中生成表示所述言语输入的语音符号序列包括:
基于从所述言语输入的言语到文本转换获得的字词序列来生成表示所述言语输入的所述语音符号序列。
10.根据权利要求8所述的方法,其中所述参考语音符号序列表示从一个或多个词典获得的字词序列。
11.根据权利要求8所述的方法,其中基于表示所述言语输入的所述语音符号序列来确定所述一个或多个参考语音符号序列包括:
针对表示所述言语输入的所述语音符号序列中的每个语音符号来确定表示所述言语输入的所述语音符号序列中的所述语音符号是否与相同的参考语音符号匹配。
12.根据权利要求8所述的方法,其中基于表示所述言语输入的所述语音符号序列来确定所述一个或多个参考语音符号序列包括:
针对表示所述言语输入的所述语音符号序列中的每个语音符号来确定表示所述言语输入的所述语音符号序列中的所述语音符号是否与不同的参考语音符号对应。
13.根据权利要求12所述的方法,其中确定表示所述言语输入的所述语音符号序列中的所述语音符号是否与不同的参考语音符号对应包括:
确定是否在表示所述言语输入的语音符号序列的生成期间执行一个或多个预先确定的操作。
14.根据权利要求13所述的方法,其中所述一个或多个预先确定的操作包括替换操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苹果公司,未经苹果公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810072173.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:词向量处理方法及装置
- 下一篇:一种用于公安系统的四维模型智能比对系统及方法