[发明专利]语音识别训练处理、控制方法及装置有效
申请号: | 200910086974.5 | 申请日: | 2009-06-12 |
公开(公告)号: | CN101923856A | 公开(公告)日: | 2010-12-22 |
发明(设计)人: | 祝宁;杨玮玮 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;H04L12/66;H04M7/00 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 刘芳 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 训练 处理 控制 方法 装置 | ||
技术领域
本发明涉及通信技术领域,尤其涉及一种语音识别训练处理、控制方法及装置。
背景技术
随着网络融合的不断发展,下一代网络(Next Generation Network,以下简称:NGN)也随之产生。它是以软交换为核心的,能够提供包括语音、数据、视频和多媒体业务的基于分组技术的综合开放的网络架构,代表了通信网络发展的方向。
图1为现有技术中NGN网络架构的结构示意图,如图1所示,NGN网络结构主要包括:媒体网关(Media Gateway,以下简称:MG)以及媒体网关控制器(Media Gateway Controller,以下简称:MGC)。其中,MGC用于实现呼叫状态的管理以及对MG承载资源的控制;MG用于将媒体流由一种格式转换为另一种格式。例如,将电路交换网中的E1时隙中的媒体流转换为IP网络中的实时传输协议(Realtime Transport Protocol,以下简称:RTP)媒体流,并在MGC的信令控制下实现媒体流的建立、修改、释放以及资源管理。同时,MG还具有网络地址转换的功能。在图1所示的NGN网络架构上可以实现专人语音识别。在具体实现时,MG上预先保存有统一资源标识符(Uniform Resource Identifier,以下简称:URI),该URI对应着专门的发音人的发音语法和发音特点。MG在接收到专人通过用户终端发送的语音识别请求时,即可根据该URI对专人的语音进行识别处理,从而实现语音信号到机器可识别信号的转换。
在实现本发明的过程中,发明人发现现有技术至少存在如下缺陷:现有的MG无法实现语音识别训练。
发明内容
本发明实施例提供一种语音识别训练处理、控制方法及装置,以解决现有技术中MG无法实现语音识别训练的问题,实现在MG和MGC分离架构下,MG在MGC的控制下能够实现语音识别训练操作的技术效果。
本发明实施例提供一种语音识别训练处理方法,包括:
接收媒体网关控制器发送的语音训练开始请求和语音识别请求;
根据所述语音训练开始请求和所述语音识别请求中携带的信息进行语音识别训练处理,获取识别训练处理结果;
将所述识别训练处理结果反馈给所述媒体网关控制器。
本发明实施例提供一种语音识别训练控制方法,包括:
向媒体网关发送语音训练开始请求和语音识别请求;
接收所述媒体网关根据所述语音训练开始请求和所述语音识别请求中携带的信息进行语音识别训练处理后,反馈的识别训练处理结果。
本发明实施例提供一种媒体网关,包括:
接收模块,用于接收媒体网关控制器发送的语音训练开始请求和语音识别请求;
语音识别训练模块,用于根据所述语音训练开始请求和所述语音识别请求中携带的信息进行语音识别训练处理,获取识别训练处理结果;
反馈模块,用于将语音识别训练模块获取的识别训练处理结果反馈给所述媒体网关控制器。
本发明实施例提供一种媒体网关控制器,包括:
发送模块,用于向媒体网关发送语音训练开始请求和语音识别请求;
结果接收模块,用于接收所述媒体网关根据所述语音训练开始请求和所述语音识别请求中携带的信息进行语音识别训练处理后,反馈的识别训练处理结果。
本发明实施例还提供一种语音识别训练系统,包括:媒体网关控制器和媒体网关,
所述媒体网关控制器用于向媒体网关发送语音训练开始请求后,向所述媒体网关发送语音识别请求;并接收所述媒体网关根据所述语音训练开始请求和所述语音识别请求中携带的信息进行语音识别训练处理后,反馈的识别训练处理结果;
所述媒体网关用于接收媒体网关控制器发送的语音训练开始请求后,接收所述媒体网关控制器发送的语音识别请求;根据所述语音训练开始请求和所述语音识别请求中携带的信息进行语音识别训练处理,获取识别训练处理结果;并将所述识别训练处理结果反馈给所述媒体网关控制器。
本发明实施例中,MG通过接收MGC发送的语音训练开始请求和语音识别请求,可以获取该语音训练开始请求和语音识别请求中携带的信息,通过该信息可以对语音识别训练处理过程进行控制操作。在该语音识别训练处理过程中,MG还可以根据这些参数获取相应的识别训练结果,并将该识别训练结果反馈给MGC,以方便MGC根据该识别训练结果进行后续训练过程的控制。本实施例在MG和MGC分离架构下,使得MG能够在MGC的控制下实现语音识别训练操作,填补了在MG和MGC分离架构下,进行语音识别训练的技术空白。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910086974.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:碟片搬运装置
- 下一篇:可降低动态模糊的液晶显示装置