[发明专利]交互语音识别系统有效
申请号: | 200710196357.1 | 申请日: | 2007-11-30 |
公开(公告)号: | CN101192406A | 公开(公告)日: | 2008-06-04 |
发明(设计)人: | L·柯尼希;R·扎姆;A·戈森贝格尔 | 申请(专利权)人: | 哈曼贝克自动系统股份有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/28;G10L15/08;G01C21/36 |
代理公司: | 北京纪凯知识产权代理有限公司 | 代理人: | 沙捷 |
地址: | 德国卡*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 交互 语音 识别 系统 | ||
技术领域
本发明涉及用来识别输入的口述短语的交互语音识别方法,交互语音识别系统,以及计算机可读介质。
背景技术
随着由语音操作的应用系统的迅速普及,对可靠的语音识别系统的需求变得越来越重要。
语音识别系统的难题在于不同的说话者性别、年龄、口音、说话者词汇、噪声水平和不同的环境。
通常,语音识别系统首先将数字化的语音信号转换为一组有用的特征,如频率或固定速率(典型为每10-20毫秒一次)的能量水平。进一步,人类语音通常包括单音素(single phone)的序列。语音上相似的音素被分组成音位(phoneme),音位可区分不同的发声(utterance)。在语音识别中,语言的音位是通过隐藏马尔可夫模型(HMM)建模的,借此隐藏马尔可夫模型的每个状态是通过概率密度函数描述的。隐藏马尔可夫模型适合于语音识别,因为语音信号可被看作是10-20毫秒范围内的短时间静止信号。通过组合多个隐藏马尔可夫模型,可识别最可能的词。
语音识别中遇到的主要问题之一是输入词随时间的变化。例如,在各种语言中,元音是以不同速度发出的。另一个问题是词的拼写相似或语音相似,这可以仅通过考虑先前输入的词的上下文或者通过请求用户进行补充输入来解决。
许多论文和许多专利中都讨论并提出了语音识别系统。在US2006/0074661中,提供了一种导航设备,其对用户的自由发言进行语音识别,其中从字典数据库中搜索包括在被识别语音的内容中的关键词,然后将这些词显示为“兴趣点(Point of Interest)”搜索的关键词。大多数错误出现在误识别的词的第一个音符中。该提出的设备使得可以通过用户操作来校正关键词的误识别。如果需要校正关键词,则显示这些词并且请求用户从显示的词中选择正确的关键词。
在例如基于车辆的导航设备中,由于在语音输入的情况中有误识别的可能性,所以识别结果需要通过语音输出或触摸面板上显示的键盘或导航设备中设置的遥控装置来确认。在传统语音识别系统中,整个口述短语被声学地输出,或者被可视地输出在用户必须从中选择的显示器上。因此,整个口述的地址必须通过语音再次输入,并且系统试图再一次识别该地址或者用户必须读取显示器上的整个地址并确认正确的地址。
如果有一个词没有被识别,则整个口述输入的重复,通常会需要进一步的用户交互以便正确地检测整个口述短语。然而,甚至是在操作触摸面板上的软键盘或操作遥控装置的方法中,许多动作仍必须重复地执行以校正误识别,并且这在诸如汽车的环境中可能是麻烦和危险的。进一步,该方法丧失了免手操作的简单操作和便利性,而这些是语音识别的优点。
而且,由于需要更多存储容量来存储大量地址、媒体库等而导致的成本增加的问题,在当前的语音识别系统中还没有得到满意的解决。
解决这些缺点将极大地有益于提高用户友好性和减小由于智能存储管理而导致的语音识别系统的成本。
发明内容
因此,需要改进系统的存储管理。联系到该需要,将系统存储器的成本保持在最低也会是合乎需要的。为了增强例如道路交通方面的安全性,进一步的需要是将用户交互减小至最低水平。
这些需要中的至少一个是通过独立权利要求的主题解决的。有利实施例由从属权利要求界定。
本发明的一个方面是将参考项目(term)与输入的口述短语的项目进行匹配。取决于存储容量,形成匹配的参考项目的各种可选的串接(concatenation)。例如,只要有足够的存储容量可用于为每个先前匹配的参考项目加载各个参考项目列表,就可以保持这些串接。如果然后将会超出存储容量,则可以请求用户进行补充输入以减小所存储的匹配参考项目的串接的数目,并随之减小存储器中为了加载与剩余的匹配参考项目/串接相对应的列表而所需的空间。
本发明的一个优点是可提供节省资源的语音识别系统。进一步,在超出存储容量的情况下,语音识别系统可仅需要用户对初始输入的口述短语的单个项目进行补充输入,而无需请求完全重复口述短语。系统对补充用户输入的请求可以例如考虑语音和拼写相似性这二者。
语音识别系统的下面的实施例可以例如在基于车辆的环境中的导航系统中或在移动装置(如个人数字助理、手持装置、移动电话等)中实现。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈曼贝克自动系统股份有限公司,未经哈曼贝克自动系统股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710196357.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:太阳光反射装置
- 下一篇:广播接收设备和广播接收方法