[发明专利]语音识别处理方法及装置有效
申请号: | 201610715090.1 | 申请日: | 2016-08-24 |
公开(公告)号: | CN107785020B | 公开(公告)日: | 2022-01-25 |
发明(设计)人: | 闫晓梅 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G06F40/103;G06F40/117 |
代理公司: | 深圳鼎合诚知识产权代理有限公司 44281 | 代理人: | 薛祥辉 |
地址: | 518057 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 处理 方法 装置 | ||
1.一种语音识别处理方法,其特征在于,所述语音识别处理方法包括以下步骤:
获取投影仪的语音识别模块检测到的语音信息,所述语音信息包括语音内容和声音特征;
将所述语音信息转换为文本,并根据所述声音特征对所述文本中的字符进行标记处理,包括:
以所述语音信息转换为文本的开始时间为起始时间,计算第一设定时间t1内声波的振幅平均值,并将其设定为第一基准值X0;
计算第n+1个t1内声波的振幅平均值Xn,其中n为任意正整数;
当(Xn-X0)/X0大于预设值时,对第n+1个t1内语音信息对应的字符进行标记处理;
将标记处理后的所述文本进行投影显示。
2.如权利要求1所述的语音识别处理方法,其特征在于,所述将所述语音信息转换为文本,并根据所述声音特征对所述文本中的字符进行标记处理还包括:
以所述语音信息转换为文本的开始时间为起始时间,计算第一设定时间t1内声波的频率平均值,并将其设定为第二基准值Y0;
计算第n+1个t1内声波的频率平均值Yn,其中n为任意正整数;
当(Yn-Y0)/Y0大于预设值时,对第n+1个t1内语音信息对应的字符进行标记处理。
3.如权利要求2所述的语音识别处理方法,其特征在于,所述将所述语音信息转换为文本,并根据所述声音特征对所述文本中的字符进行标记处理之后还包括:
以第二设定时间t2为时间周期,当(n+1)×t1=t2时,以第n+1个t1的结束时间为起始时间,重新计算第一设定时间t1内声波的振幅平均值,并将其设定为第一基准值X0,以及重新计算第一设定时间t1内声波的频率平均值,并将其设定为第二基准值Y0。
4.如权利要求1所述的语音识别处理方法,其特征在于,所述标记处理包括加粗、加色或加亮。
5.一种语音识别处理装置,其特征在于,所述语音识别处理装置包括:
语音获取模块,用于获取投影仪的语音识别模块检测到的语音信息,所述语音信息包括语音内容和声音特征;
语音处理模块,用于将所述语音信息转换为文本,并根据所述声音特征对所述文本中的字符进行标记处理;所述语音处理模块包括:
振幅基准单元,用于以所述语音信息转换为文本的开始时间为起始时间,计算第一设定时间t1内声波的振幅平均值,并将其设定为第一基准值X0;
振幅获取单元,用于计算第n+1个t1内声波的振幅平均值Xn,其中n为任意正整数;
第一标记处理单元,用于当(Xn-X0)/X0大于预设值时,对第n+1个t1内语音信息对应的字符进行标记处理;
投影模块,用于将标记处理后的所述文本进行投影显示。
6.如权利要求5所述的语音识别处理装置,其特征在于,所述语音处理模块还包括:
频率基准单元,用于以所述语音信息转换为文本的开始时间为起始时间,计算第一设定时间t1内声波的频率平均值,并将其设定为第二基准值Y0;
频率获取单元,用于计算第n+1个t1内声波的频率平均值Yn,其中n为任意正整数;
第二标记处理单元,用于当(Yn-Y0)/Y0大于预设值时,对第n+1个t1内语音信息对应的字符进行标记处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610715090.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种双向控制电磁比例阀
- 下一篇:一种坐管式水下作业装置