[发明专利]连续长语音识别方法及系统、硬件设备在审
申请号: | 201610111643.2 | 申请日: | 2016-02-29 |
公开(公告)号: | CN105719642A | 公开(公告)日: | 2016-06-29 |
发明(设计)人: | 黄博;张国兴 | 申请(专利权)人: | 黄博 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L25/87 |
代理公司: | 四川省成都市天策商标专利事务所 51213 | 代理人: | 罗韬 |
地址: | 621000 四川省绵阳*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及语言信号识别技术领域,提供一种连续长语音识别方法及系统、硬件设备,以解决在连续长语音识别过程中,大段语音造成服务器缓冲区溢出的问题,该方法包括:按照预设的分帧时间长度对缓冲区内的数据进行分帧,识别各帧信号的类型;对于各个正常语音帧后的首个静音帧,计算连续的静音帧的总静音时间,如果总静音时间大于预设停顿时间阈值,则将所述连续的静音帧设置为停顿状态,分别将两个连续停顿状态之间的信号顺序保存在各个切片中。本发明提出的技术方案快速准确的将长语音切断成短语句切片,并在执行过程中丢弃长段不影响语音识别准确率的静音包,最后分段对各个切片进行识别,有效避免了大段语音造成服务器缓冲区溢出问题。 | ||
搜索关键词: | 连续 语音 识别 方法 系统 硬件 设备 | ||
【主权项】:
一种连续长语音识别方法,其特征在于包括步骤:A、初始化缓冲区,设置分帧时间长度、停顿时间阈值;B、将待识别的连续长语音读入缓冲区并对缓冲区内的数据进行降噪处理;C、按照预设的分帧时间长度对缓冲区内的数据进行分帧,识别各帧信号的类型,所述信号类型包括正常语音帧和静音帧;D、对于各个正常语音帧后的首个静音帧,计算连续的静音帧的总静音时间,如果总静音时间大于预设停顿时间阈值,则将所述连续的静音帧设置为停顿状态,分别将两个连续停顿状态之间的语音信号保存在各个切片中,并在各个切片中追加一段静音帧;E、分别对各个切片进行识别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于黄博,未经黄博许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610111643.2/,转载请声明来源钻瓜专利网。