[发明专利]识别浏览器语音命令的服务器及浏览器语音命令识别方法有效

申请号：	201210029792.6	申请日：	2012-02-10
公开（公告）号：	CN102629246B	公开（公告）日：	2017-06-27
发明（设计）人：	喻俨;王瑜;杨永智;刘铁锋	申请（专利权）人：	百纳（武汉）信息技术有限公司
主分类号：	G06F17/30	分类号：	G06F17/30;G06F17/27;G10L15/26
代理公司：	北京思睿峰知识产权代理有限公司11396	代理人：	罗松梅
地址：	430074 湖北省武汉***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	识别浏览器语音命令服务器方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及语音处理领域，更具体地，涉及一种用于识别浏览器语音命令的服务器及其方法，以及涉及一种浏览器语音命令识别系统及其方法，可以对用户输入的浏览器语音命令进行智能识别，实现了用户通过语音对用户终端浏览的网页进行语音控制。

背景技术

最近几年，随着语音识别技术的快速发展与广泛应用，采用语音作为人机交互的方式为用户提供了便利。语音识别是将人的语音中的词汇内容转换为文字，即，语音到文字的转换(Speech to text)，从而用户采用说话的方式来完成文字的输入。在手机上采用语音识别技术可以方便人与手机的交流，比如语音的自动拨号功能，只用说出被叫者姓名，电话即自动拨向被叫者，节省了用户查询电话的时间。语义识别是对文字的语义进行智能的分析和判断，语义识别技术往往构建在准确的语音识别基础之上，比如苹果的Iphone所采用的Siri语音助理功能。Siri可以让手机用户通过语音来实现对手机的控制，通过对自然语言理解和学习并结合上下文来提供问答式服务。语音和语义识别技术开始逐渐应用在浏览器中，比如Google谷歌就已经在Chrome浏览器里加入了语音搜索的功能，腾讯和UC优视也相继推出了各自的手机浏览器语音版。但上述应用在人机交互过程中仍然存在不令人满意的地方。这主要表现在以下两点：

1.现有的浏览器语音上网过程只能简单地完成一个识别出的文字到网址的映射，用户在使用浏览器语音上网时的操作仅限于浏览某个用户已知的网站，比如用户说“打开新浪”，浏览器则通过查找文字-网站映射表，打开“www.sina.com”。

2.此外，绝大多数的网页都没有提供语音交互的接口，Google提供了语音搜索的功能，但其应用范围局限于Google的搜索框输入。当用户想在网页上点击按钮、链接，提交表单等时候，还是需要鼠标和键盘设备的辅助。

发明内容

为了实现用户与用户终端的自由交互与智能语音网页浏览，实现了本发明。本发明的目的是提出一种用于识别浏览器语音命令的服务器以及浏览器语音命令识别方法，以及一种浏览器语音命令识别系统及其方法，其中可以对用户的浏览器语音命令进行语音识别与语义识别。实现用户通过语音对用户终端浏览的网页进行语音控制，通过语音就可以直接打开网页浏览，获取搜索结果。从而，用户终端更智能化、人性化，用户与用户终端之间的“沟通”变得更加方便、及时。以及无需使用鼠标，键盘之类的辅助设备。

根据本发明第一方面，提出一种用于识别浏览器语音命令的服务器，包括：通信装置，用于接收用户终端发送的浏览器语音命令；语音识别装置，用于将所述浏览器语音命令语音识别为文本；和语义识别装置，用于对所述语音识别的文本进行语义识别，以转换为浏览器命令。

根据本发明第二方面，提出一种浏览器语音命令识别方法，包括：通信步骤，接收用户终端发送的浏览器语音命令；语音识别步骤，将所述浏览器语音命令语音识别为文本；和语义识别步骤，对所述语音识别的文本进行语义识别，以转换为浏览器命令。

根据本发明的第三方面，提出一种浏览器语音命令识别系统，包括用户终端以及与用户终端通过网络连接的服务器，其中：所述用户终端包括：输入装置，用于接收用户输入的浏览器语音命令；语音识别装置，用于将所述浏览器语音命令语音识别为文本；第一通信装置，用于将语音识别的文本发送给所述服务器；所述服务器包括：第二通信装置，用于接收所述语音识别的文本；和语义识别装置，用于对所述语音识别的文本进行语义识别，以转换为浏览器命令。

根据本发明的第四方面，提出一种浏览器语音命令识别方法，包括：输入步骤，用户终端接收用户输入的浏览器语音命令；语音识别步骤，用户终端将所述浏览器语音命令语音识别为文本；第一通信步骤，用户终端将语音识别的文本发送给所述服务器；第二通信步骤，服务器接收所述语音识别的文本；和语义识别步骤，服务器对所述语音识别的文本进行语义识别，以转换为浏览器命令。

附图说明

从下面结合附图的详细描述中，本发明的上述特征和优点将更明显，其中：

图1a示出根据本发明第一实施例的浏览器语音命令识别系统的示意图；

图1b示出根据本发明第二实施例的浏览器语音命令识别系统的示意图；

图2示出浏览器语音命令识别系统的语义识别装置的示意图；

图3是语义识别装置其词性标注单元采用的标注器顺序的一个示例；

图4示出根据本发明第一实施例的浏览器语音命令识别系统执行浏览器语音命令识别方法的流程图；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于百纳（武汉）信息技术有限公司，未经百纳（武汉）信息技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201210029792.6/2.html，转载请声明来源钻瓜专利网。