[发明专利]语音控制方法及装置、存储介质、电子设备有效
申请号: | 201810163645.5 | 申请日: | 2018-02-27 |
公开(公告)号: | CN108538300B | 公开(公告)日: | 2021-01-29 |
发明(设计)人: | 舒翔 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L15/30 | 分类号: | G10L15/30;G10L15/26;G10L15/22;G06F3/16;G06K9/32;G06K9/62 |
代理公司: | 北京维澳专利代理有限公司 11252 | 代理人: | 王立民 |
地址: | 230000 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开提供一种语音控制方法及装置、存储介质、电子设备。该方法包括:获取当前页面的页面图像,识别页面图像中包含的文字;将连续排列的文字确定为一个文字单元,并确定出文字单元所在显示区域;获取当前页面中可操作元素所在显示区域,与文字单元所在显示区域相匹配,确定出可操作元素对应的文字单元;将可操作元素对应的文字单元上传至语音服务器保存;获取用户输入的语音数据,并将语音数据转发至语音服务器进行语音识别,语音服务器用于根据上传的文字单元,确定出语音数据对应的待操作文字单元;接收语音服务器发送的待操作文字单元,对待操作文字单元对应的可操作元素执行操作。如此方案,有助于提高语音控制效果。 | ||
搜索关键词: | 语音 控制 方法 装置 存储 介质 电子设备 | ||
【主权项】:
1.一种语音控制方法,其特征在于,所述方法包括:获取当前页面的页面图像,识别所述页面图像中包含的文字;将连续排列的文字确定为一个文字单元,并确定出所述文字单元所在显示区域;获取所述当前页面中可操作元素所在显示区域,与所述文字单元所在显示区域相匹配,确定出可操作元素对应的文字单元;将所述可操作元素对应的文字单元上传至语音服务器保存;获取用户输入的语音数据,并将所述语音数据转发至所述语音服务器进行语音识别,所述语音服务器用于根据上传的所述文字单元,确定出所述语音数据对应的待操作文字单元;接收所述语音服务器发送的所述待操作文字单元,对所述待操作文字单元对应的可操作元素执行操作。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810163645.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种自动会议记录方法
- 下一篇:一种基于神经网络音频技术的智能数码乐器