[发明专利]通过语音控制多媒体app的方法及装置有效
| 申请号: | 201811613470.X | 申请日: | 2018-12-27 |
| 公开(公告)号: | CN109658934B | 公开(公告)日: | 2020-12-01 |
| 发明(设计)人: | 王坤;刘嵘;李毅昌;周良帅;蔡志成;周鹏飞 | 申请(专利权)人: | 苏州思必驰信息科技有限公司 |
| 主分类号: | G10L15/22 | 分类号: | G10L15/22;H04M1/725 |
| 代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 李彬彬;张丽 |
| 地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 通过 语音 控制 多媒体 app 方法 装置 | ||
本发明公开了一种通过语音控制多媒体app的方法,包括监听多媒体app的状态;根据多媒体app的状态设置语音焦点;在接收到用户语音指令时,根据用户语音指令和当前语音焦点下发用户语音指令。本发明还公开了一种通过语音控制多媒体app的装置,根据本发明提供的方法和装置可以实现将语音交互技术应用在现有的多媒体app上,并且兼容更加便捷、可靠,不需要对现有的多媒体app进行更改,也不需要专门制定的协议,即可实现及时通过语音对多媒体app的自由控制,极大提升了行业对接效率和可靠性。
技术领域
本发明涉及语音控制技术领域,特别是一种通过语音控制多媒体app的方法及装置。
背景技术
随着语音交互技术的愈发成熟,目前APP在开发过程中就会对其赋予语音交互功能,但是还没有通用的技术将多种APP的语音交互功能进行统一,用户在使用装有多种APP的终端设备时,想要通过语音功能去操控各个APP时,往往需要进入到对应的APP中进行操作,这样对用户的语音操作并不方便。
发明内容
为了解决上述问题,发明人构思通过引入一个“语音焦点管理者”的角色,来监听多媒体app的状态,判断当前用户正在操作/收听的是哪个app,通过将当前操作/收听的app作为语音焦点,来进行通用语音指令的下达,这样,就不需要用户每次都进入到具体的app进行相应操作,改善交互体验。并且,基于焦点管理,语音指令的触达率也能维持在准确率较高的水平,大幅提升用户体验。
根据本发明的第一方面,提供了一种通过语音控制多媒体app的方法,包括如下步骤:
监听多媒体app的状态;
根据多媒体app的状态设置语音焦点;
在接收到用户语音指令时,根据用户语音指令和当前语音焦点下发用户语音指令。
根据本发明的第二方面,提供了一种通过语音控制多媒体app的装置,包括
状态监听模块,用于监听多媒体app的状态;
语音焦点设置模块,用于根据多媒体app的状态设置语音焦点;
指令下发模块,用于在接收到用户语音指令时,根据用户语音指令和当前语音焦点下发用户语音指令。
根据本发明的第三个方面,提供了一种电子设备,其包括:至少一个处理器,以及与至少一个处理器通信连接的存储器,其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述方法的步骤。
根据本发明的第四个方面,提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述方法的步骤。
根据本发明提供的方法及装置,可以实现将语音交互技术应用在现有的多媒体app上,并且兼容更加便捷、可靠,不需要对现有的多媒体app进行更改,也不需要专门制定的协议,即可实现及时通过语音对多媒体app的自由控制,极大提升了行业对接效率和可靠性,并且极大的增加了用户的体验感。
附图说明
图1为本发明一实施方式的通过语音控制多媒体app的方法流程图;
图2为本发明又一实施方式的通过语音控制多媒体app的装置原理框图;
图3为本发明一实施方式的电子设备的框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州思必驰信息科技有限公司,未经苏州思必驰信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811613470.X/2.html,转载请声明来源钻瓜专利网。





