[发明专利]长语音连续识别及识别结果实时反馈方法和系统有效
申请号: | 201210551379.6 | 申请日: | 2012-12-18 |
公开(公告)号: | CN103035243A | 公开(公告)日: | 2013-04-10 |
发明(设计)人: | 徐波;孟猛;高鹏 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G10L15/28 | 分类号: | G10L15/28 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 宋焰琴 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 连续 识别 结果 实时 反馈 方法 系统 | ||
1.一种语音识别结果实时反馈方法,其特征在于,包括:
步骤1,在识别的过程中,定期对目前所有活跃节点的历史路径的共有部分进行检测;
步骤2,对检测到的历史路径中的共有部分进行回溯,获得该历史路径的共有部分上的语音识别结果,并将其作为当前时刻已经确定下来的语音识别结果;
步骤3,判断所述固定下来的语音识别结果是否有更新,如果有,则反馈更新后的语音识别结果。
2.如权利要求1所述的方法,其特征在于,所述共有部分指当前所有活跃节点的历史路径的相同部分。
3.如权利要求1所述的方法,其特征在于,从当前时刻所有活跃节点出发对其历史路径进行回溯,记录历史路径上的单词序列;所有活跃节点都处理完毕之后,所获得的所有单词序列的交集,即为所述已经确定下来的语音识别结果。
4.如权利要求1所述的方法,其特征在于,通过记录回溯节点的方式确定活跃节点历史路径中的共有部分。
5.如权利要求4所述的方法,其特征在于,在通过记录回溯节点的方式确定活跃节点历史路径中的共有部分时,用于确定语音识别结果的具体方式为:
步骤a,获取当前时刻解码中所有活跃节点的集合;
步骤b,设置回溯路径节点交集为当前时刻最优历史路径上节点的集合;其中,获取所述最优历史路径时,仅回溯到当前时刻的回溯截止点,初始时刻回溯截止点为解码识别网络的初始起始点;
步骤c,从所述活跃节点集合中取出未进行过回溯的节点作为回溯节点,回溯其历史路径,直到首次遇到回溯路径节点交集中的节点,然后将该节点作为重合节点记录下来;
步骤d,更新回溯路径节点交集为所述回溯节点在其回溯路径上所述重合节点之前的所有节点;
步骤e,判断活跃节点集合中是否仍有未回溯的节点;如果是,重新执行步骤c;否则,执行步骤f;
步骤f,从回溯路径节点交集的尾节点回溯到回溯截止点,获得从所述尾节点到所述回溯截止点的路径上的单词序列,并将所述回溯路径节点交集的尾节点,作为新的回溯截止点;
步骤g,判断所述单词序列是否不为空;如果不为空,则将所述单词序列作为当前时刻已经确定下来的识别结果反馈给用户。
6.如权利要求1所述的方法,其特征在于,在语音识别过程中,判断已经确定下来的语音识别结果对应的识别路径是否跨越了解码识别网络中的句尾结束点,如果是,则认为有一个独立的句子被确定了,并将该确定的独立的句子对应的识别网络中的各状态及跳转弧删除,以重新规整所述解码识别网络。
7.一种利用如权利要求1所述的语音识别结果实时反馈方法所确定下来的语音识别结果的长语音信号连续识别方法,其特征在于,包括:
构建支持从句尾结束点到识别起始点的扩展路径的解码识别网络;
接收连续语音信号,根据所述解码识别网络对所述连续语音信号中的每一帧进行解码;其中,解码时根据语调分析和静音持续时间调整句尾结束点到识别起始点的跳转概率;
根据如权利要求1所述的语音识别结果实时反馈方法定期获取已经确定下来的语音识别结果,判断当前时刻是否有作为独立句子的识别结果;
在确定当前时刻有作为独立句子的识别结果时,对所述确定的独立句子进行优化和输出反馈;
清理所述确定的独立句子在所述解码识别网络中对应的解码空间,以规整所述解码识别网络。
8.如权利要求7所述的方法,其特征在于,所述根据语调分析和静音持续时间调整句尾结束点到识别起始点的跳转概率具体为:
采用语调分析,将句尾结束点的概率以一定的权重与预设概率相加权获得所述跳转概率;到达所述句子结束点前经历的静音的长度大于预定阈值时,增加所述跳转概率。
9.一种语音识别结果实时反馈装置,其特征在于,包括:
历史共有部分检测单元,在识别的过程中,定期对目前所有活跃节点的历史路径的共有部分进行检测;
识别结果实时反馈单元,对检测到的历史路径中的共有部分进行回溯,获得该历史路径的共有部分上的语音识别结果,并将其作为当前时刻已经确定下来的语音识别结果,如果所述确定下来的语音识别结果有更新,则反馈更新后的语音识别结果。
10.一种包括如权利要求9所述的语音识别结果实时反馈装置的长语音信号连续识别系统,包括:
网络构建单元,用于构建支持从句尾结束点到识别起始点的扩展路径的解码识别网络;
解码单元,用于接收连续语音信号,根据所述解码识别网络对所述连续语音信号中的每一帧进行解码;
语音句子结束点辅助判断单元,用于在解码时根据语调分析和静音持续时间调整句尾结束点到识别起始点的跳转概率;
如权利要求9所述语音识别结果实时反馈装置;
独立句子判断单元,用于定期从所述语音识别结果实时反馈装置已经确定下来的语音识别结果,判断当前时刻是否有作为独立句子的识别结果;
独立句子处理单元,用于在确定当前时刻有作为独立句子的识别结果时,对所述确定的独立句子进行优化和输出反馈;
内存清理单元,用于清理所述确定的独立句子在所述解码识别网络中对应的解码空间,以规整所述解码识别网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210551379.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种增压发动机智能化双路进气装置
- 下一篇:双并联式重载静平衡运动模拟台