[发明专利]一种语音识别方法及装置有效
申请号: | 201610202416.0 | 申请日: | 2016-03-31 |
公开(公告)号: | CN105702252B | 公开(公告)日: | 2019-09-17 |
发明(设计)人: | 王峰;陈仲帅;殷腾龙 | 申请(专利权)人: | 海信集团有限公司 |
主分类号: | G10L15/183 | 分类号: | G10L15/183;G10L15/193 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 陶敏;黄健 |
地址: | 266100 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 装置 | ||
1.一种语音识别方法,其特征在于,包括:
获取用户的语音数据,并根据所述语音数据获取对应的语音文本;
根据预设的语音文本识别模型,确定所述语音文本是否为口语文本,所述语音文本识别模型包括:口语文本集、规范文本集和第一映射关系;其中,所述第一映射关系用于存储所述口语文本集和所述规范文本集中每个特征量对应的语音文本为口语文本的概率,所述特征量包括特征词和/或句式结构;
若所述语音文本为口语文本,则对所述语音文本进行归一化和标准化处理,生成规范化的语音文本;
对所述规范化的语音文本,进行语义解析。
2.根据权利要求1所述的方法,其特征在于,所根据预设的语音文本识别模型,确定所述语音文本是否为口语文本,包括:
获取所述语音文本的特征量;
根据所述第一映射关系,确定每个所述特征量对应的所述概率,并根据所述概率计算所述语音文本为口语文本的复合概率;
根据所述复合概率,确定所述语音文本是否为口语文本。
3.根据权利要求2所述的方法,其特征在于,所述根据所述概率计算所述语音文本为口语文本的复合概率,包括:
根据公式:
P(A|t1,t2,t3......tn)=(P1*P2*......PN)/[P1*P2*......PN+(1-P1)*(1-P2)*......(1-PN)]
计算所述语音文本的复合概率;
其中,P(A|t1,t2,t3......tn)为语音文本为口语文本的复合概率,t1,t2,...tn为对应语音文本的n个特征量,P1,P2,...PN为分别以t1,t2,...tn为参考时,对应所述语音文本为口语文本的概率。
4.根据权利要求3所述的方法,其特征在于,所述根据所述复合概率,确定所述语音文本是否为口语文本,包括:
将所述复合概率与预设的阈值进行对比,若所述复合概率大于所述阈值,则确定所述语音文本为口语文本;
若所述复合概率小于或等于所述阈值,则确定所述语音文本为规范文本。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述若所述语音文本为口语文本,则对所述语音文本进行归一化和标准化处理,生成规范化的语音文本,包括:
去除所述语音文本中口语化的语气词,并通过归一化处理,将所述语音文本中口语化的特征词转化为规范化的特征词;
对所述语音文本的句式结构进行标准化处理,生成规范化的语音文本。
6.一种基于口语化的语音识别装置,其特征在于,包括:
获取模块,用于获取用户的语音数据,并根据所述语音数据获取对应的语音文本;
确定模块,用于根据预设的语音文本识别模型,确定所述语音文本是否为口语文本,所述语音文本识别模型包括:口语文本集、规范文本集和第一映射关系;其中,所述第一映射关系用于存储所述口语文本集和所述规范文本集中每个特征量对应的语音文本为口语文本的概率,所述特征量包括特征词和/或句式结构;
处理模块,用于当所述语音文本为口语文本时,对所述语音文本进行归一化和标准化处理,生成规范化的语音文本;
解析模块,用于对所述规范化的语音文本,进行语义解析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海信集团有限公司,未经海信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610202416.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音唤醒方法及装置
- 下一篇:智能终端调整歌曲伴奏音乐的方法和装置