[发明专利]一种语音识别方法和装置在审
申请号: | 201810504702.1 | 申请日: | 2018-05-24 |
公开(公告)号: | CN108682423A | 公开(公告)日: | 2018-10-19 |
发明(设计)人: | 任阳 | 申请(专利权)人: | 北京奔流网络信息技术有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/10 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 谢安昆;宋志强 |
地址: | 100085 北京市海淀区信*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字信息 原始文字 信息展示 语音识别 方法和装置 语音信号 接收语音信号 语音识别结果 自适应调整 准确度 距离计算 距离确定 信息距离 多段 拼音 场景 | ||
1.一种语音识别方法,其特征在于,该方法包括:
接收语音信号;
确定用语音信号对应的原始文字信息;
从当前信息展示界面包含的多段文字信息;
对所述原始文字信息和当前信息展示界面包含的每段文字信息进行基于拼音的距离计算;
确定当前信息展示界面包含的与所述原始文字信息距离最短的一段文字信息,根据该段文字信息与所述原始文字信息的距离确定用户的语音信号对应的最终文字信息。
2.根据权利要求1所述的方法,其特征在于,
对所述原始文字信息和当前信息展示界面包含的每段文字信息进行基于拼音的距离计算的方法为:
将所述原始文字信息转化为不带声调的第一拼音字符串和带有声调的第二拼音字符串;
将当前信息展示界面包含的每段文字信息转化为待匹配拼音字符串,所述待匹配拼音字符串为不带声调的拼音字符串或带有声调的拼音字符串;
将当前信息展示界面包含的每段文字信息对应的待匹配拼音字符串分别与所述第一拼音字符串和第二拼音字符串进行距离计算,并计算该待匹配拼音字符串与第一拼音字符串的距离和与第二拼音字符串的距离之和,将该距离之和作为该段文字信息与所述原始文字信息的距离。
3.根据权利要求1所述的方法,其特征在于,
对所述原始文字信息和当前信息展示界面包含的每段文字信息进行基于拼音的距离计算的方法为:
将所述原始文字信息转化为不带声调的第一拼音字符串和带有声调的第二拼音字符串;
将当前信息展示界面包含的每段文字信息转化为不带声调的第一待匹配拼音字符串和带有声调的第二待匹配拼音字符串;
将当前信息展示界面包含的每段文字信息对应的第一待匹配拼音字符串、第二待匹配拼音字符串分别与所述第一拼音字符串、第二拼音字符串进行距离计算,并计算该第一待匹配拼音字符串与第一拼音字符串的距离和该第二待匹配拼音字符串与第二拼音字符串的距离之和,将该距离之和作为该段文字信息与所述原始文字信息的距离。
4.根据权利要求2或3所述的方法,其特征在于,
基于最小编辑距离算法计算两个拼音字符串的距离,具体包括:利用最小编辑距离算法计算该两个拼音字符串的最小编辑距离,将该最小编辑距离作为该两个拼音字符串的距离。
5.根据权利要求1、2、或3所述的方法,其特征在于,
根据该段文字信息与所述原始文字信息的距离确定用户的语音信号对应的最终文字信息的方法为:根据该段文字信息和所述原始文字信息确定一个距离度量值,如果该段文字信息与所述原始文字信息的距离小于该距离度量值,则将该段文字信息作为用户的语音信号对应的最终文字信息,否则,将所述原始文字信息作为用户的语音信号对应的最终文字信息。
6.根据权利要求5所述的方法,其特征在于,
预先按照字符串长度越长则距离度量值越大的原则设置一关于字符串长度与距离度量值的函数;
根据该段文字信息和所述原始文字信息确定一个距离度量值的方法为:确定该段文字信息转化而成的不带声调的拼音字符串的长度L1,以及所述原始文字信息转化而成的不带声调的拼音字符串的长度L2,取L1和L2中的最大长度值,根据所述函数确定所述最大长度值对应的距离度量值,将该距离度量值确定为所述一个距离度量值。
7.一种语音识别装置,其特征在于,该装置包括:接收单元、识别单元、获取单元、处理单元;
所述接收单元,用于接收用户的语音信号;
所述识别单元,用于接收单元接收到用户的语音信号时,确定用户的语音信号对应的原始文字信息;
所述获取单元,用于接收单元接收到用户的语音信号时,从信息展示模块获取当前信息展示界面包含的多段文字信息;
所述处理单元,用于对所述原始文字信息和当前信息展示界面包含的每段文字信息进行基于拼音的距离计算;用于确定当前信息展示界面包含的与所述原始文字信息距离最短的一段文字信息,根据该段文字信息与所述原始文字信息的距离确定用户的语音信号对应的最终文字信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奔流网络信息技术有限公司,未经北京奔流网络信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810504702.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种音频信息处理方法及系统
- 下一篇:一种音频采集设备及方法