[发明专利]一种人机交互的可扩展语音识别方法无效
申请号: | 200910053200.2 | 申请日: | 2009-06-17 |
公开(公告)号: | CN101923857A | 公开(公告)日: | 2010-12-22 |
发明(设计)人: | 王视鎏;冯瑞;金城;薛向阳 | 申请(专利权)人: | 复旦大学 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/06;G10L15/08 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 包兆宜 |
地址: | 20043*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人机交互 扩展 语音 识别 方法 | ||
1.一种人机交互的可扩展语音识别系统,其特征在于:它包括音频采集设备、语音识别模块、加载样本单元、有限状态机、分类存储特征样本库和指令执行模块;所述音频采集设备、语音识别模块、有限状态机和指令执行模块首尾一字串联,所述加载样本单元分别与语音识别模块、有限状态机和分类存储特征样本库相连,所述分类存储特征样本库和有限状态机相连。
2.根据权利要求1所述的可扩展语音识别系统,其特征在于:所述分类存储特征样本库是人为分类,可根据所述有限状态机的状态只加载部分指令所对应的样本至加载样本单元。
3.根据权利要求1或2所述的可扩展语音识别系统,其特征在于:所述语音识别模块的输出为指令号i和相似度simil。
4.使用权利要求1至3所述系统的可扩展语音识别方法,其程序如下:
步骤1:由音频采集设备输入语音段T;
步骤2:对输入的语音段做预加重等预处理,并进行端点检测;
步骤3:将端点检测的结果输送至语音识别模块,将输入语音段信号T与加载样本语音信号Ri进行匹配;
步骤4:判断其相似度simil,如果simil<30相似度很高,则转入步骤9;如果simil>40相似度很低,则转入步骤7;如果相似度30<simil<40,进入下一步骤;
步骤5:系统发问:“你说的是不是...”;
步骤6:将输入语音段T存储在缓存单元,并转入步骤1,接受用户反馈;
步骤7:系统对输入语音段T和存储在缓存单元的前一个输入语音段T’进行匹配,计算D(T,T’);
步骤8:判断其相似度D,如果D<30相似度很高,则系统发问:“你说的是什么”,并转入步骤1,接受用户反馈;如果D>30相似度很低,则转入步骤6;
步骤9:对匹配结果进行分析,判断其是否是特殊指令,如果是特殊指令,进入下一步骤;如果不是特殊指令,则转入步骤12;
步骤10:对特殊指令进行相应的处理:如果特殊指令是“你听错了”,系统将结束此次交互过程,不执行任何操作;如果特殊指令是“识别错误”,将转入步骤1等待系统可识别的指令;如果特殊指令是“识别正确”,进入下一步骤;
步骤11:处理未识别语音缓存单元T’;
步骤12:直接输出识别结果,并转入步骤11。
5.根据权利要求4所述的可扩展语音识别方法,其特征在于,步骤3所述将输入语音段信号T与加载样本语音信号Ri进行匹配的过程如下:
步骤31:由输入语音段信号T得到待识别的Mel频率倒谱系数(MFCC)特征向量;
步骤32:根据获得的MFCC系数和加载样本单元中已加载的样本,计算输入语音段信号T与加载样本语音信号Ri的动态时间规整DTW距离,获得两者的相似度simil;
步骤33:如果相似度simil<35,相似度很高,则直接输出simil;
步骤34:如果相似度simil>35,说明输入语音段在加载样本单元中找不到相应的语音段,则重新计算输入语音段信号T与分类存储特征样本库中的未加载样本的DTW距离,获得相似度simil’,如果simil<simil’,则直接输出simil;否则程序结束。
6.根据权利要求4或5所述的可扩展语音识别方法,其特征在于,步骤11所述处理未识别语音缓存单元T’,是通过来自用户的反馈来正确处理缓存单元,在线更新其特征样本库,其步骤如下:当接受到用户反馈时,对于识别过程中始终缓存在未识别语音缓存单元内一条未识别的语音段T’,系统会采取不同的动作:
1)当用户反馈“识别正确”时,将缓存语音段赋以指令标号存储到特征样本库;
2)当用户反馈“识别错误”时,等待说话人更正错误,并将缓存语音段赋以正确指令标号并存储到特征样本库;
3)当用户反馈“你听错了”时,将缓存语音段赋以噪音标号存储,这样以后再听到之前的语音段能够自动识别为噪音而不作任何处理;
4)当系统发问“你说的是什么”后,等待充分训练人输入能识别的语音段,将缓存语音段赋以指令标号存储到特征样本库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910053200.2/1.html,转载请声明来源钻瓜专利网。