[发明专利]识别提供凭据的语音输入有效
申请号: | 201710109781.1 | 申请日: | 2017-02-27 |
公开(公告)号: | CN107195306B | 公开(公告)日: | 2021-08-13 |
发明(设计)人: | M·艾克巴卡克;B·汉森;G·埃弗曼 | 申请(专利权)人: | 苹果公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/22;G10L15/197;G06F21/31 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 提供 凭据 语音 输入 | ||
1.一种用于识别提供一个或多个用户凭据的语音输入的方法,包括:
在具有显示器、一个或多个处理器和存储器的用户设备处:
接收语音输入,所述语音输入包括一个或多个字符、一个或多个短语、和一个或多个字词的组合;
基于单个语音输入,识别第一字符、用于识别第二字符的短语、以及字词,其中识别所述第一字符、所述短语、或所述字词包括:
识别所述语音输入的话语;
确定所述话语的类型;以及
基于所述话语的所确定的类型,获得对应于所述话语的所述第一字符、由所述短语识别的所述第二字符、或所述字词的表示;
响应于所述识别,将所述第一字符、所述第二字符和所述字词转换为文本;以及
使得利用所述显示器以对应于所述第一字符、所述第二字符和所述字词在所述语音输入中的次序的序列来显示所述文本。
2.根据权利要求1所述的方法,其中所述第一字符包括字母、数字、控制字符或空格中的至少一者。
3.根据权利要求2所述的方法,其中所述控制字符包括由标点字词所识别的标点符号。
4.根据权利要求1所述的方法,其中所述短语包括用于辅助识别所述第二字符的拼写字词。
5.根据权利要求1所述的方法,其中所述字词包括多个字符。
6.根据权利要求5所述的方法,其中所述多个字符表示域扩展名或首字母缩略词中的至少一者。
7.根据权利要求1所述的方法,其中基于所述单个语音输入,识别所述第一字符、用于识别所述第二字符的所述短语、和所述字词包括:
基于存储在所述用户设备中的一个或多个语音识别模型,识别所述第一字符、用于识别所述第二字符的所述短语、或所述字词中的至少一者。
8.根据权利要求1所述的方法,其中基于所述语音输入,识别所述第一字符、用于识别所述第二字符的所述短语、和所述字词包括:
向服务器提供表示所述语音输入的数据;以及
从所述服务器接收表示所述第一字符、用于识别所述第二字符的所述短语、或所述字词中的至少一者的数据,
其中基于所述语音输入,识别所述第一字符、用于识别所述第二字符的所述短语、以及所述字词包括
基于存储在所述服务器中的一个或多个语言模型,识别所述第一字符、用于识别所述第二字符的所述短语、或所述字词中的至少一者。
9.根据权利要求1所述的方法,其中确定所述话语的类型包括执行以下各项中的至少一者:
确定所述话语的类型是否对应于字符;
确定所述话语的类型是否对应于用于识别字符的短语;以及
确定所述话语的类型是否对应于字词。
10.根据权利要求9所述的方法,其中确定所述话语的类型是否对应于字符包括:
针对所述话语,确定所述话语是否对应于控制字符;
根据确定所述话语对应于控制字符,针对所述话语确定所述话语是否对应于标点字词;以及
其中基于所述话语的所确定的类型,获得所述字符的表示包括:
根据确定所述话语对应于标点字词,获得对应于所述标点字词的标点符号的表示,
根据确定所述话语不对应于标点字词,获得不同于标点字词的所述控制字符的表示。
11.根据权利要求1所述的方法,其中基于所述单个语音输入,识别所述第一字符、用于识别所述第二字符的所述短语、以及所述字词进一步包括:
获得所述表示的置信水平;
确定所述置信水平是否大于或等于阈值;并且
其中将所述第一字符、所述第二字符和所述字词转换为文本包括:
根据确定所述置信水平大于或等于所述阈值,将对应于所述话语的所述第一字符、由所述短语识别的所述第二字符、或所述字词的所述表示转换为文本;
根据确定所述置信水平小于所述阈值,提供一个或多个候选表示、错误消息或它们的组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苹果公司,未经苹果公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710109781.1/1.html,转载请声明来源钻瓜专利网。