[发明专利]可进行语音识别处理的浏览器及处理方法有效
申请号: | 201210488924.1 | 申请日: | 2012-11-26 |
公开(公告)号: | CN103020165A | 公开(公告)日: | 2013-04-03 |
发明(设计)人: | 杨东;任寰 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G10L15/26 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 进行 语音 识别 处理 浏览器 方法 | ||
技术领域
本发明涉及互联网通信技术领域,特别涉及一种可进行语音识别处理的浏览器及浏览器中进行语音识别处理的方法。
背景技术
语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。
浏览器是指可以显示网页服务器或者文件系统的HTML(Hypertext Markup Language,超文本标记语言)文件内容,并让用户与这些文件交互的一种软件。网页浏览器主要通过HTTP(Hypertexttransfer protocol,超文本传递协议)协议与网页服务器交互并获取网页,这些网页由URL(Uniform/Universal Resource Locator,统一资源定位符)指定,文件格式通常为HTML,并由MIME(MultipurposeInternet Mail Extensions,多功能互联网邮件扩充服务)在HTTP协议中指明。
现有的浏览器大多没有集成语音识别功能,即是个别浏览器集成了语音识别功能,一般只基于本地语音识别引擎或只基于WEB(网络)语音识别引擎,识别效率低、准确性差。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种可进行语音识别处理的浏览器及浏览器中进行语音识别处理的方法。
依据本发明的一个方面,提供了一种可进行语音识别处理的浏览器,其包括:
处理器,适于接收用户输入指令设置浏览器的声控模式为命令输入模式或者文本输入模式;
语音接收器,适于接收用户的语音输入,并转换为语音数据;
本地识别单元,适于调用浏览器侧本地语音识别引擎对所述语音数据进行识别,接收本地语音识别结果,如果识别成功,则依据本地语音识别结果在所述命令输入模式或者文本输入模式下进行相应的浏览器侧处理;
WEB识别单元,适于在所述本地识别单元识别失败的情况下,调用WEB语音识别引擎对所述语音数据进行识别,接收来自WEB语音识别引擎的WEB语音识别结果,依据WEB语音识别结果在命令输入模式或者文本输入模式下进行相应的浏览器侧处理。
可选地,所述本地识别单元包括:
本地调用模块,适于调用本地语音识别引擎对所述语音数据进行识别,接收本地语音识别结果;
本地判断模块,适于判断所述本地语音识别结果是否为空,如果是,认为识别失败,向WEB识别单元发送启动通知;否则,判断当前声控模式是否是文本输入模式,如果是,认为识别成功,在所述浏览器中输入所述本地语音识别结果对应的输入文本,否则,向本地匹配模块发送本地匹配指令;
所述本地匹配模块,适于根据所述本地匹配指令,将所述本地语音识别结果与所述浏览器的命令集进行匹配,如果匹配成功,按照所述本地语音识别结果执行相应的浏览器操作,否则,认为识别失败,向WEB识别单元发送启动通知。
可选地,所述WEB识别单元包括:
通知接收模块,适于接收所述本地识别单元发送的启动通知;
WEB调用模块,适于调用WEB语音识别引擎对所述语音数据进行识别,接收来自WEB语音识别引擎的WEB语音识别结果;
WEB判断模块,适于判断当前声控模式是否是文本输入模式,如果是,在所述浏览器中输入所述WEB语音识别结果对应的输入文本,否则,向WEB匹配模块发送WEB匹配指令;
WEB匹配模块,适于根据所述WEB匹配指令将所述WEB语音识别结果与所述浏览器的命令集进行匹配,并按照所述WEB语音识别结果执行相应的浏览器操作。
可选地,所述命令集包括所述浏览器的操作命令。
可选地,所述浏览器还包括:训练语音识别单元;
所述训练语音识别单元包括:
训练语音库建立模块,适于预先对用户的语音数据进行训练,生成包含训练语音及相应的输入文本或相应的所述操作命令的训练语音库;
训练语音匹配模块,适于将所述语音数据与所述训练语音库中的训练语音相匹配,如果匹配成功,在文本输入模式下,在所述浏览器中输入相应的输入文本,或者,在命令输入模式下,按照相应的操作命令执行相应的浏览器操作。
可选地,所述训练语音识别单元还包括:提示模块;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210488924.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种导航系统中单字录入方法
- 下一篇:对数据单据进行自定义项扩展的系统和方法