[发明专利]用于车辆的基于声学和域的语音识别在审
申请号: | 201710055930.0 | 申请日: | 2017-01-25 |
公开(公告)号: | CN107016995A | 公开(公告)日: | 2017-08-04 |
发明(设计)人: | 季安;斯科特·安德鲁·安曼;布丽奇特·弗朗西丝·莫拉·理查森;约翰·爱德华·胡伯;弗朗索斯·沙雷特;兰杰尼·兰加拉詹;金塔拉斯·文森特·普斯科瑞斯;阿里·哈萨尼 | 申请(专利权)人: | 福特全球技术公司 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L15/18;G10L15/22;G10L25/51 |
代理公司: | 北京铭硕知识产权代理有限公司11286 | 代理人: | 王秀君,鲁恭诚 |
地址: | 美国密歇根*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 车辆 基于 声学 语音 识别 | ||
技术领域
本公开涉及用于语音识别的基于声学和域的方法。
背景技术
语音识别系统可以将可听见的声音解释成从车辆乘客发起的命令、指令或信息。当环境噪声覆盖掉语音时,可能难以辨别语音。车辆状态信息可用于改善语音的识别。然而,在特定情况下车辆状态信息可能妨碍准确的语音识别。
发明内容
一种用于车辆的语音识别系统包括:处理器,被配置为经由特定域语言模型和声学模型识别语音,并被配置为:响应于所述声学模型具有的针对识别的语音的置信度落入相对于所述特定域语言模型的置信度而定义的预定范围内,仅经由所述声学模型识别语音。
一种语音识别系统包括:处理器,被配置为具有特定域语言模型和声学模型,并被配置为:响应于接收到包含语音的信号,使用被馈入车辆状态输入的机器学习算法产生特定域置信度,并基于特定域置信度与声学模型置信度的合成而选择与特定域语言模型和声学模型的潜在结果关联的多个语音识别路径中的一个。
根据本发明的一个实施例,被馈入车辆状态输入的机器学习算法是人工神经网络。
根据本发明的一个实施例,用于被馈入车辆状态输入的机器学习算法的车辆状态输入包括天气状况或交通状况。
根据本发明的一个实施例,用于被馈入车辆状态输入的机器学习算法的车辆状态输入包括在车辆接近度内的移动装置。
根据本发明的一个实施例,用于被馈入车辆状态输入的机器学习算法的车辆状态输入包括会话历史。
根据本发明的一个实施例,处理器还被配置为具有解码器算法以确定声学模型置信度。
一种语音识别方法包括:通过处理器,执行根据从多个识别假设中选择的识别假设而从包含语音的信号中识别的车辆命令,其中,每个识别假设是基于包括多个特定域语言模型置信度中的一个和多个声学模型置信度中的一个的共同的语音域对的乘积的,所述多个特定域语言模型置信度是根据将机器学习算法应用于车辆状态输入而被推导出的。
根据本发明的一个实施例,机器学习算法是人工神经网络。
根据本发明的一个实施例,人工神经网络具有与车辆命令相关的输出。
根据本发明的一个实施例,所述方法还包括:基于所述多个声学模型置信度中的所述一个落入相对于所述多个特定域语言模型置信度中的所述一个而定义的预定范围内,在产生所述乘积之前按比例减小所述多个特定域语言模型置信度中的所述一个。
根据本发明的一个实施例,所述车辆状态输入包括天气或交通。
根据本发明的一个实施例,所述车辆状态输入包括在车辆接近度内的移动装置。
根据本发明的一个实施例,所述车辆状态输入包括会话历史。
附图说明
图1是描绘具有自动语音识别系统的车辆的示例的示意图;
图2是描绘自动语音识别系统的示例的示意图;
图3是自动语音识别系统的流程图;
图4是具有一种以上的声学模型假设的自动语音识别系统的流程图;
图5是具有针对声学模型和特定域语言模型的置信度(confidence score)的示例值的示图;
图6是用于确定特定域语言模型的置信度的机器学习算法。
具体实施方式
在此描述了本公开的实施例。然而,应该理解的是,所公开的实施例仅仅是示例,并且其它实施例可采用各种替代形式。附图不必按比例绘制;可夸大或最小化一些特征以示出特定组件的细节。因此,在此公开的具体结构和功能细节不应被解释为具有限制性,而仅仅作为用于教导本领域技术人员以多种方式利用本发明的代表性基础。本领域普通技术人员将理解的是,参照任一附图示出并描述的各种特征可与在一个或更多个其它附图中示出的特征相结合,以产生未被明确示出或描述的实施例。示出的特征的组合提供用于典型应用的代表性实施例。然而,针对特定应用或实施方式,可期望与本公开的教导一致的特征的各种组合和修改。
自动或手动的语音识别已经成为现代车辆中的重要的附件功能。语音识别可在车辆和乘客之间提供免提输入和交互。各种类型的车辆可利用语音识别。例如,飞行器、水运工具、航天器或陆基车辆可受益于识别来自乘客的语音指令。这些车辆可包括可使用人机界面访问或调用的多个功能。人机界面可包括自动语音识别系统,自动语音识别系统将人类语音解码或翻译成车辆或辅助系统能够理解的指令。来自车辆系统或环境的环境噪声可降低利用声学模型的自动语音识别系统的准确度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福特全球技术公司,未经福特全球技术公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710055930.0/2.html,转载请声明来源钻瓜专利网。