[发明专利]面向智能服务机器人的语音交互系统的实现方法有效
申请号: | 200910087108.8 | 申请日: | 2009-06-12 |
公开(公告)号: | CN101577118A | 公开(公告)日: | 2009-11-11 |
发明(设计)人: | 刘宏;杨雪松 | 申请(专利权)人: | 北京大学 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/02 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) | 代理人: | 李稚婷 |
地址: | 100871北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种面向智能服务机器人的语音交互系统的实现方法,通过改进的鲁棒性模板训练法训练语音模板,挑选出可用于人机交互的鲁棒性较强的词汇表,弱化了不同说话人的个性信息,在系统的抗噪声和与说话人无关方面得以改进。当输入待测语音时,基于挑选的词汇表计算待测语音与各语音模板的匹配距离,选择最小距离对应的模板为识别结果,如果该识别结果信赖度较高,则输出识别结果,如果信赖度较低,则拒绝该识别结果,同时选择次小距离对应的模板为识别结果,再次判定,如此循环,直至找到信赖度较高的识别结果为止,有效屏蔽了信赖度较低的待测语音,同时又可以修正识别结果,提高识别性能,实现了说话人与机器人安全、友好地交互。 | ||
搜索关键词: | 面向 智能 服务 机器人 语音 交互 系统 实现 方法 | ||
【主权项】:
1.一种面向智能服务机器人的语音交互系统的实现方法,包括如下步骤;1)预定义语音词汇表,同时根据该词汇表采集语音样本数据组成样本集和测试集;2)使用下述改进的鲁棒性模板训练法训练语音模板:首先对样本集内的N个语音样本全排列,得到N!个排列;分别将每一个排列输入训练系统中,得到一个训练好的语音矢量中心;最后求出N!个语音矢量中心的平均矢量和方差参数,得到最终的语音训练模板;其中N为大于1的整数;3)使用测试集中的语音样本作为待测语音进行测试,得到预定义词汇表中每个单词的鲁棒性程度,包括每个单词的正确识别率和单词平均正确识别率;4)按照单词正确识别率的大小对单词进行排序,选择单词正确识别率大于平均正确识别率的单词组成候选词汇表;5)针对候选词汇表,再次使用步骤2)中所述的改进的鲁棒性模板训练法训练语音模板,得到各个语音模板的平均矢量μ和平均方差σ;6)当待测语音输入时,计算待测语音与各语音模板的匹配距离,选择最小匹配距离对应的语音模板为识别结果;7)计算待测语音与识别结果对应的矢量中心的方差;8)根据多元统计分析中的3西格玛法则,判断该识别结果是否在置信区间[(μ-3σ),(μ+3σ)]内:是,则接受识别结果,跳转到步骤10);否,则拒绝识别结果,跳转到步骤9);9)选择次小匹配距离对应的语音模板为识别结果,回到步骤8)再次进行判断,直至接受识别结果进入步骤10),或者拒绝了所有的识别结果,输出拒绝信息;10)输出待测语音的识别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200910087108.8/,转载请声明来源钻瓜专利网。
- 上一篇:智能轴位移变送器
- 下一篇:一种铁道货车侧架承台至弹簧承台距离测量尺