[发明专利]为后续的离线语音识别记录语音信息的记录装置有效

专利信息
申请号: 01802542.0 申请日: 2001-06-25
公开(公告)号: CN1389059A 公开(公告)日: 2003-01-01
发明(设计)人: H·F·巴托斯克 申请(专利权)人: 皇家菲利浦电子有限公司
主分类号: H04M11/10 分类号: H04M11/10;H04M3/50;G10L15/26;G10L19/00
代理公司: 中国专利代理(香港)有限公司 代理人: 邹光新,傅康
地址: 荷兰艾*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 后续 离线 语音 识别 记录 信息 装置
【说明书】:

技术领域

发明涉及一种记录装置,用于记录口述语音信息,然后将记录下来的口述语音信息传输给语音识别装置进行离线语音识别,这个装置包括用于接收口述语音信息的接收装置,用记录装置的记录模式记录收到的口述语音信息的记录装置,以及在记录装置的传输模式将记录下来的口述语音信息传输给语音识别装置的传输装置,这个语音识别装置用于识别语音信息所表达的文本信息,识别出来的文本信息的质量取决于收到的语音信息的质量。

先有技术

上述定义的这种类型的记录装置在GB-A-2323693中可以找到,它是用离线语音识别业务的计算机服务器形成的。对于离线语音识别业务的使用,用户可以通过电话呼叫计算机服务器,对电话进行口述。计算机服务器的接收装置跟电话线和储存收到的语音信号的硬盘形成的记录装置连接。

在用户结束口述以后,记录下来的语音信号被传输给语音识别装置进行离线语音识别。语音识别装置识别语音信号表达的文本信息,离线语音识别业务的操作员随后更正识别出来的文本信息中的错误。接下来,识别出来并且经过了更正的文本信息通过电子邮件发送给离线语音识别业务的用户,这一服务的费用由用户支付。

在已知的记录装置里,已经证明了如果离线语音识别业务的用户在某些情况下进行长时间口述,而不接收任何反馈说明收到并记录下来的语音信号的质量是否足以让语音识别装置能够成功地处理随后传输过来的语音信号,就不太好。当离线语音识别业务的用户碰到这种情况,记录下来的他的口述语音信号因为例如电话线路不好而不能被语音识别装置进行处理的时候,这个用户就再也不会使用离线语音识别业务,这对于离线语音识别业务的业务提供商而言是很大的经济损失。

已知记录装置的另一个缺点是,如果识别出来的文本信息质量很差,离线语音识别业务的操作员要更正许多明显的错误。于是如果离线语音识别业务的用户在口述过程中被告知收到的语音信息的质量很差,离线语音识别业务的成本就能够明显降低。

发明概述

本发明的一个目的是提供一种记录装置,利用这种装置,离线语音识别业务的用户在口述期间已经收到反馈信号,这个信号说明在离线语音识别中收到的语音信号的质量是否足以让电路中的语音识别装置高质量地识别文本信息。

这个目的是利用第一段中定义的那种类型的记录装置来达到的,在其中提供了语音质量测量装置,用于测量记录模式中收到的语音信息的质量,在语音识别装置处理语音信息的时候,是否足以识别出预定质量的文本信息,这些语音信息由传输装置在传输模式中传输,其中有反馈装置,用于反馈记录装置记录模式中的反馈信息,这些反馈信息说明语音质量测量装置的测量结果。

这就使得记录装置的用户在口述过程中已经收到反馈信号,这个反馈信号说明收到的语音信息的质量是否足以被语音识别装置成功地处理。

口述记录机有指示灯用来让用户了解记录下来的语音信号的记录电平。于是用户可以更大声音或者更小声音地说话,以便使记录下来的语音信号的电平更合适。但是这样只监视收到的语音信号的一个或者多个参数不足以可靠地达到上述目的。

此外,采用在线语音识别方法的语音识别装置使得用户能够对着麦克风进行口述,经过了很短时间的处理以后,用户能够在监视器上获得识别出来的文字。如果用户发现识别出来的文字的质量很差,用户就可以在口述过程中根据处理过的语音信号的记录电平相应地改变他的声音大小,或者改变语音识别装置麦克风的音频特性。

在已知的口述记录机和已知的在线语音识别装置里只给出收到和处理过的语音信号的一个参数,它跟收到的语音信息是否适合随后的语音识别这样的质量测量结果没有一点关系。此外,利用已知的口述记录机和已知的语音识别装置,除了单纯给出处理过的语音信号的记录电平以外,没有任何信息说明怎样才能够提高离线语音识别的质量,这对于纯粹记录口述用于以后重播声音或者在线语音识别一点也没有必要。这样,现有技术口述记录机和语音识别装置都没有解决本发明中记录装置的问题。

根据权利要求2和权利要求3,为了做到这一点,对记录装置要记录的语音信号的记录质量进行测量,检查它的信噪比和电平是否足够高。

根据权利要求4,为了做到这一点,需要检查用户口述的速度有多快,如果口述速度太快,就通过反馈信息请求用户降低口述速度,从而获得高质量的识别效果。

根据权利要求5,为了做到这一点,需要检查用户口述得是否清楚或者是否能够听懂,如果口述不太清楚,就用反馈信息请求用户口述得清楚一点,以便获得高质量识别效果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家菲利浦电子有限公司,未经皇家菲利浦电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/01802542.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top