[发明专利]电力系统的语音导航系统、语音识别方法和语音交互方法在审
申请号: | 201710198667.0 | 申请日: | 2017-03-30 |
公开(公告)号: | CN107093425A | 公开(公告)日: | 2017-08-25 |
发明(设计)人: | 赵永生;徐海青;吴立刚;袁睿智;梁翀;浦正国;管马舟;陈瑞祥;孙飞;徐唯耀;孔伟伟;林胜;王维佳;许元虎;周小希;宋飞 | 申请(专利权)人: | 安徽继远软件有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/16;G10L15/14;G10L15/06;G10L15/00;G01C21/20 |
代理公司: | 温州市品创专利商标代理事务所(普通合伙)33247 | 代理人: | 程春生 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电力系统 语音 导航系统 识别 方法 交互 | ||
技术领域
本发明涉及语音交互系统领域,特别涉及电力系统的语音导航系统、语音识别方法和语音交互方法。
背景技术
在传统的语音导航系统中,用户与系统交互的方式是通过电话的键盘。通常,用户在进入语音导航系统后,会听到相关的语音提示选单,根据自己的需要可以按下键盘上相关的按键。系统通过DTMF信号传送用户按下的键,同时也将用户的请求传送给系统,从而触发相关的语音信息。然而,传统的电话仅能通过DTMF信号,传送有限的几个数字及符号按键。这使得用户与系统的交互界面受到很大的限制,同时也就使得语音导航系统的信息查询范围变得相当狭窄,用户在实际使用时会感到诸多不便。
随着计算机技术和人工智能总体技术的发展,自然语言理解不断取得进展。语音识别系统已成为一个越来越广泛的应用方向。基于传统声学模型的语音识别技术的语音导航系统,被应用自动语音服务系统(即IVR服务)中,解决了菜单层级过深和业务无法拓展的问题,随着服务内容日趋增多,训练人工投入大、语音识别率低和系统的鲁棒性差等固有的缺点和难点也日益凸显,影响客户对自助服务的使用,从而求助人工导致人工话务压力增加。随着深度学习技术的发展,在传统的语音技术的基础上引入深度学习技术应经成为了必然趋势和解决当下问题的有效途径。
发明内容
针对上述现有技术存在的问题,提供了电力系统的语音导航系统、语音识别方法和语音交互方法。
为了实现上述目的,一种电力系统的语音导航系统,其特征在于:包括
语音输入模块:客户通过手机或者固话,利用排队机接入呼叫中心系统,在CTI和IVR的控制下,当用户需要语音导航业务时,通过呼叫平台实现话务接入,平台记录下的原始语音信息,并进行播报用户确认无误后,将该文件作为原始的语音文件信息输入;
语音识别模块包括语音识别单元和语音文本处理单元;
语音识别单元:语音识别引擎输入的原始的语音文件信息经过语音识别预处理;将经过语音识别预处理的语音文件进行离线解码或在线解码、置信度处理后转成自然语言文本信息;并将原始语音信息、原始的语音文件信息、语音特征信息存入文本/语音语库中;
语音文本处理单元:将自然语言文本信息经过模式匹配处理、语法分析处理、语义解析处理、语义搜索处理、上下文管理处理以及语义预测处理后,将自然语言文本信息转换成计算机识别的语音信息作为输出物;进行业务需求分析,为自然语言处理引擎提供数据输入;
作为上述方案的进一步优化,在语音识别单元中进行的语音识别预处理包括特征提取处理、端点检测处理和去燥处理。
作为上述方案的进一步优化,还包括语音反馈模块,用于反馈噪音或非普通话输入的原始语音信息。
作为上述方案的进一步优化,其特征在于:语音识别模块中,语音识别处理的步骤为:
(41)初始化原始的语音文件信息;
(42)创建识别引擎;语音识别引擎用于输入的原始的语音文件;
(43)创建识别上下文接口;
(44)设置识别消息;
(45)设置事件;
(46)创建语法规则;
(47)激活语法规则:
(48)获取识别消息,进行处理:
本发明还公开了电力系统的语音导航系统的语音识别方法,其特征在于,语音识别单元采用深度神经网络和隐马尔科夫(DNN-HMM)混合模型,使用HMM来描述语音信号的动态变化,再使用DNN的每个输出节点来估计连续密度HMM的某个状态的后验概率。
作为上述方案的进一步优化,离线解码或在线解码中:
(61)首先将后验概率转为似然度p(Xt/qt):
p(Xt/qt=s)=p(qt=s/Xt)p(Xt)/p(s)(1)
其中,是从训练集中统计的每个状态的先验概率,Ts是标记属于状态s的帧数,T是总帧数,
(62)p(Xt)与字词序列无关,计算时可以忽略,忽略后得到缩放的似然度
(63)在DNN-HMM模型中,解码出的字词序列由以下公式确定:
其中p(ω)是语言模型(LM)概率,以及
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽继远软件有限公司,未经安徽继远软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710198667.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:机器人走柔性钢丝绳实验测试平台
- 下一篇:一种住院部用药片配药机器人