[发明专利]可进行语音识别处理的浏览器及处理方法有效
申请号: | 201210488924.1 | 申请日: | 2012-11-26 |
公开(公告)号: | CN103020165A | 公开(公告)日: | 2013-04-03 |
发明(设计)人: | 杨东;任寰 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G10L15/26 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 进行 语音 识别 处理 浏览器 方法 | ||
1.一种可进行语音识别处理的浏览器,其包括:
处理器,适于接收用户输入指令设置浏览器的声控模式为命令输入模式或者文本输入模式;
语音接收器,适于接收用户的语音输入,并转换为语音数据;
本地识别单元,适于调用浏览器侧本地语音识别引擎对所述语音数据进行识别,接收本地语音识别结果,如果识别成功,则依据本地语音识别结果在所述命令输入模式或者文本输入模式下进行相应的浏览器侧处理;
WEB识别单元,适于在所述本地识别单元识别失败的情况下,调用WEB语音识别引擎对所述语音数据进行识别,接收来自WEB语音识别引擎的WEB语音识别结果,依据WEB语音识别结果在命令输入模式或者文本输入模式下进行相应的浏览器侧处理。
2.如权利要求1所述的浏览器,其特征在于,所述本地识别单元包括:
本地调用模块,适于调用本地语音识别引擎对所述语音数据进行识别,接收本地语音识别结果;
本地判断模块,适于判断所述本地语音识别结果是否为空,如果是,认为识别失败,向WEB识别单元发送启动通知;否则,判断当前声控模式是否是文本输入模式,如果是,认为识别成功,在所述浏览器中输入所述本地语音识别结果对应的输入文本,否则,向本地匹配模块发送本地匹配指令;
所述本地匹配模块,适于根据所述本地匹配指令,将所述本地语音识别结果与所述浏览器的命令集进行匹配,如果匹配成功,按照所述本地语音识别结果执行相应的浏览器操作,否则,认为识别失败,向WEB识别单元发送启动通知。
3.如权利要求2所述的浏览器,其特征在于,所述WEB识别单元包括:
通知接收模块,适于接收所述本地识别单元发送的启动通知;
WEB调用模块,适于调用WEB语音识别引擎对所述语音数据进行识别,接收来自WEB语音识别引擎的WEB语音识别结果;
WEB判断模块,适于判断当前声控模式是否是文本输入模式,如果是,在所述浏览器中输入所述WEB语音识别结果对应的输入文本,否则,向WEB匹配模块发送WEB匹配指令;
WEB匹配模块,适于根据所述WEB匹配指令将所述WEB语音识别结果与所述浏览器的命令集进行匹配,并按照所述WEB语音识别结果执行相应的浏览器操作。
4.如权利要求2或3所述的浏览器,其特征在于,所述命令集包括所述浏览器的操作命令。
5.如权利要求4所述的浏览器,其特征在于,所述浏览器还包括:训练语音识别单元;
所述训练语音识别单元包括:
训练语音库建立模块,适于预先对用户的语音数据进行训练,生成包含训练语音及相应的输入文本或相应的所述操作命令的训练语音库;
训练语音匹配模块,适于将所述语音数据与所述训练语音库中的训练语音相匹配,如果匹配成功,在文本输入模式下,在所述浏览器中输入相应的输入文本,或者,在命令输入模式下,按照相应的操作命令执行相应的浏览器操作。
6.如权利要求5所述的浏览器,其特征在于,所述训练语音识别单元还包括:提示模块;
所述提示模块,适于提示用户对常用操作命令、地址栏中常用地址和/或搜索栏中常用搜索关键字进行语音训练。
7.如权利要求6所述的浏览器,其特征在于,所述训练语音识别单元还包括:建表模块和查表模块;
所述建表模块,适于生成地址栏中输入和推荐的常用地址的URL与相应的网页标题的对应关系表;
其中,所述网页标题还作为所述训练语音库中的输入文本与相应的训练语音相对应;
所述训练语音匹配模块,还适于当用户在地址栏中进行语音输入时,将用户输入的语音与所述训练语音相匹配获得对应的网页标题;
所述查表模块,适于根据匹配获得的网页标题查询所述对应关系表获得相应的URL,并将获得的URL输入至所述浏览器的地址栏中。
8.如权利要求5所述的浏览器,其特征在于,所述浏览器还包括:历史语音识别单元;
所述历史语音识别单元包括:
历史语音库建立模块,适于将所述系统已经识别的历史语音及相应的输入文本或相应的所述操作命令进行存储生成历史语音库;
历史语音匹配模块,适于将所述语音数据与所述历史语音库中的历史语音相匹配,如果匹配成功,在文本输入模式下,在所述浏览器中输入相应的输入文本,或者,在命令输入模式下,按照相应的操作命令执行相应的浏览器操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210488924.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种导航系统中单字录入方法
- 下一篇:对数据单据进行自定义项扩展的系统和方法