[发明专利]一种应用于家庭网络的语音识别方法有效
申请号: | 201110065918.0 | 申请日: | 2011-03-18 |
公开(公告)号: | CN102682767A | 公开(公告)日: | 2012-09-19 |
发明(设计)人: | 林东伸;方英奎 | 申请(专利权)人: | 株式公司CS |
主分类号: | G10L15/08 | 分类号: | G10L15/08 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 杨立 |
地址: | 韩国京畿道城南市盆唐区*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用于 家庭 网络 语音 识别 方法 | ||
技术领域
本发明涉及一种语音识别方法,尤其是一种通过语音识别机器来进行语音识别的方法。
背景技术
随着网络技术的发达,使用一个输入/输出装置来控制由网络连接在一起的远程机器的系统也随之上市。不仅如此,以语音指令来控制由网络所连接的机器的系统也日益增多。
以往技术中的语音识别系统存在杂音影响机器控制及特定语音者语音识别率降低等缺陷和极限。就特定语音者语音识别率降低这一点来说,虽然可以通过适应化来弥补这一缺陷,但给用户带来诸多的不便。不仅如此,为了通过语音来控制多个机器,需要在每个机器内储存不同的指令,从而导致指令过多、过于繁琐,致使识别率降低。
发明内容
本发明所要解决的技术问题是提供一种应用于家庭网络的语音识别方法,语音识别方法通过语音识别来控制由网络连接的机器,可随时输入语音,无需其他特别准备,即可通过语音识别即时准确地识别指令及非指令的其他声音,从而减少错误识别的频率,并自动适应语音者的语音;不仅如此,还可以提高特定语音者的语音识别率,同时可实现多个机器的控制指令统一化,并提高语音识别的准确率。
本发明解决上述技术问题的技术方案如下:语音识别方法,包括:即时接收语音输入的阶段S1;测定上述S1阶段中所输入的所述语音的强弱及持续时间的阶段S2;将所述S2阶段中所测定的所述语音的强弱及持续时间与任意值相比,并按默音、弱音、强音对所述语音进行分类的阶段S3;根据所述S3阶段中的分类,若为默音,则计算默音的持续时间,并持续维持语音输入待机状态,若为弱音或强音,则进行语音识别处理的阶段S4;根据所述S4阶段进行的语音识别处理,进行制定单位语音识别处理的阶段S5;根据所述S5阶段的结果,决定是否对整体语音进行语音识别处理,并进行处理准备的阶段S6;根据所述S6阶段,若决定执行整体语音的语音识别处理,则对整体语音进行语音识别处理的阶段S7;根据所述S7阶段的结果,决定是否认证语音识别处理的结果,并控制机器,进行识别语音适应化的阶段S8;在所述S6阶段中,不对所述整体语音进行语音识别时,或根据所述S8阶段,不认证所述语音的识别结果时,则根据所述S3阶段中所决定的语音分类,若为弱音时,则转换为噪音模式,若为强音时,则转换为拒绝模式的阶段S9。
进一步,最好还包括在所述S3阶段中,根据事先制定的强弱,可将所述语音分为三个等级,在所述S2阶段中所测定的语音音量若为最低的第一等级时,则所述语音分到默音类;若所述语音的音量属于高于所述第一等级的第二等级,且所述语音的音长为任意值时,则所述语音分到弱音类;若所述语音的音量为最高的第三等级,且所述语音的音长满足任意值时,则所述语音分到强音类的S10阶段。
进一步,最好还包括在所述S5阶段的所述制定单位的语音识别处理进行的过程中,若识别关键字时,将所述关键字最末音素传向虚拟机的对数似然比与各自的声学模型对比,记忆具有最高值的声学模型的阶段S11。
最好还包括在所述S6阶段中,所述语音识别结果与已存指令一致,并决定对所述整体语音进行第二次识别的阶段S12。
最好还包括在所述S12阶段中,决定进行所述第二次语音识别时,将所述S11阶段中所记忆的所述声学模型换为第二次识别模式的准备阶段S13。
最好还包括在所述S13阶段中,将所述已准备的声学模型用于数据库,并进行第二次语音识别的阶段S14。
最好还包括:在所述S8阶段中,若所述第二次语音识别结果被认证,根据所述认证结果控制机器的阶段S15;及在所述S8阶段中,储存语音,并进行所储存语音的适应化作业,更新具有发音的语音者的音色特征的声学模型的阶段S16。
进一步,最好还包括:在所述S16阶段中,检查是否有具有所述语音者音色特征的数据库的阶段S17;及在所述S16阶段中,若未有所述音色的数据库时,在所述语音适应化的作业中,更新所述已识别的语音音色数据库的阶段S18。
最好还包括:在所述S17阶段中,检查所述S11阶段中,与所述各自的声学模型对比后,是否存在具有最高值的所述声学模型的阶段S19;及在所述S19阶段中,若检查到在所有的声学模型中不存在具有最高值的所述声学模型时,记录没有具有与所述S1阶段中所输入的所述语音类似音色的声学模型的阶段S20。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式公司CS,未经株式公司CS许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110065918.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:半导体装置用薄膜的制造方法
- 下一篇:金属风管法兰处密封垫片锯齿形搭接方法