[发明专利]用户个性化信息语音识别方法及系统有效
申请号: | 201210585934.7 | 申请日: | 2012-12-28 |
公开(公告)号: | CN103065630A | 公开(公告)日: | 2013-04-24 |
发明(设计)人: | 潘青华;何婷婷;胡国平;胡郁;刘庆峰 | 申请(专利权)人: | 安徽科大讯飞信息科技股份有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/28 |
代理公司: | 北京汇智胜知识产权代理事务所(普通合伙) 11346 | 代理人: | 朱登河 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 个性化 信息 语音 识别 方法 系统 | ||
技术领域
本发明涉及语音识别技术领域,具体涉及一种用户个性化信息语音识别方法及系统。
背景技术
随着手机等智能终端上语音输入功能和应用的普及,用户在手机等智能终端上使用语音输入的需求越来越多,对用户个性化信息,尤其是通讯录中联系人的识别准确率也提出了更高的要求。而传统连续语音识别系统由于语言模型训练方式及识别方法的局限性,对存在多音字现象的汉语语音信号可能无法提供正确的字词结果,特别是在人名信息识别中,其识别准确率更受到了进一步的限制,主要体现在:
1.中文常见人名数量众多,对此连续语音识别的词典中通常将人名字词作为未登录词处理,导致训练语料中覆盖的人名数量极其有限;
2.其次中文人名同音字大量存在,常见人名有几十个甚至更多的汉字组合;
3.对每个用户来说,用户特有的个性化通讯录中联系人人名可能还会有一部分非常用人名,即每个个性化的人名列表在训练语料中无法均匀覆盖。
基于以上原因,现有技术中用于连续语音识别的语言模型不能很好地模拟人名字词特别是用户个性化联系人名字词,人名识别效果也往往明显低于其他内容的识别效果。显然如何在连续语音识别中提高用户个性化信息,特别是人名信息的识别准确率已经成为连续语音识别系统亟待解决的问题。
发明内容
本发明提供一种用户个性化信息语音识别方法及系统,以提高连续语音识别中用户个性化信息的识别准确率。
为此,本发明提供如下技术方案:
一种用户个性化信息语音识别方法,包括:
接收用户输入的语音信号;
根据基础静态解码网络逐帧对所述语音信号进行解码,得到当前帧在基础静态解码网络中各活跃节点上的解码路径,所述基础静态解码网络是与基础人名语言模型相关的解码网络;
如果确定当前帧有解码路径进入所述基础静态解码网络中的人名节点,则根据所述用户的附属静态解码网络对所述人名节点进行网络扩展,所述附属静态解码网络是与特定用户人名语言模型相关的解码网络;
在最后一帧解码完成后,返回识别结果。
优选地,所述方法还包括:
在根据基础静态解码网络逐帧对所述语音信号进行解码之前,确定所述用户的附属静态解码网络;或者
在确定当前帧有解码路径进入所述基础静态解码网络中的人名节点之后,确定所述用户的附属静态解码网络。
优选地,所述确定所述用户的附属静态解码网络包括:
根据所述语音信号的特征确定用户身份,然后根据所述用户身份确定所述用户的附属静态解码网络;或者
根据用户的设备码确定用户身份,然后根据所述用户身份确定所述用户的附属静态解码网络。
优选地,所述方法还包括:
构建基础人名语言模型和特定用户人名语言模型;
分别构建与所述基础人名语言模型相关的基础静态解码网络和与所述特定用户人名语言模型相关的附属静态解码网络。
优选地,所述构建基础人名语言模型包括:
分别采集人名数据库和语言模型训练语料;
根据所述人名数据库及所述语言模型训练语料,对常规字词以及常规字词与人名字词间关联关系进行统计;
根据统计结果生成基础人名语言模型。
优选地,所述根据所述人名数据库及所述语言模型训练语料,对常规字词以及常规字词与人名字词间关联关系进行统计包括:
根据所述人名数据库中的人名在所述训练语料中进行人名检测;
对所述训练语料中的所有具体人名用一个统一的虚拟人名替换;
根据替换后的训练语料对常规字词以及常规字词与人名字词间关联关系进行统计。
优选地,所述构建与所述基础人名语言模型相关的基础静态解码网络包括:
为所述虚拟人名设置一个虚拟发音,以使所述虚拟人名作为一个普通单词参与声学模型的静态网络扩展;
根据所述虚拟发音确定扩展后的静态网络中的特殊节点,所述特殊节点包括:进入人名单元的节点和人名单元的终止节点;
对所述特殊节点的入弧或出弧上的虚拟发音单元进行扩展,得到与基础人名语言模型相关的基础静态解码网络。
优选地,所述构建特定用户人名语言模型包括:
从用户上传的人名相关信息中提取人名,并将所述人名作为人名词条记录;
对每个人名词条设置一个词频概率,并根据人名词条的词频概率生成特定用户人名语言模型;
所述构建与所述特定用户人名语言模型相关的附属静态解码网络包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽科大讯飞信息科技股份有限公司,未经安徽科大讯飞信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210585934.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防止压滤机滤板旋转的机构
- 下一篇:游戏屋
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置