[发明专利]信息处理设备、控制方法及程序有效
申请号: | 201580078175.7 | 申请日: | 2015-12-28 |
公开(公告)号: | CN107408027B | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 大村淳己 | 申请(专利权)人: | 索尼公司 |
主分类号: | G06F3/16 | 分类号: | G06F3/16;G06F3/0487;G10L13/00;G10L15/10;G10L15/22 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 高岩;陈炜 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 设备 控制 方法 程序 | ||
提供了信息处理设备、控制方法以及程序,其能够在存在多个用户语音时通过对各个用户输出适当的响应来提高语音识别系统的便利性。该信息处理设备设置有:响应生成单元,其生成对来自多个用户的语音的响应;确定单元,其基于对应于多个用户的语音的顺序的优先级来确定针对各个用户的响应输出方法;以及输出控制单元,其执行控制以使得使用所确定的响应输出方法来输出所生成的响应。
技术领域
本公开内容涉及信息处理设备、控制方法及程序。
背景技术
传统技术中,已经开发了对来自用户的语音进行语音识别和语义分析并且通过声音进行响应的技术。具体地,由于近年来语音识别算法的进步和计算机技术的发展,可以在实际时间内执行语音识别处理,并且用于智能手机、平板电脑等的使用声音的用户接口(UI)已经变得普及。
例如,通过使用安装在智能手机、平板电脑等上的声音UI的应用程序,可以通过声音对用户说出的问题进行响应,或者可以执行与用户说出的指令相对应的处理。
例如,下面列出的专利文献1公开了一种语音对话控制方法,在该语音对话控制方法中,由系统侧考虑响应内容的重要水平以在与单个用户的声音对话中在系统正在做出响应时(换句话说,在系统正在输出语音时)用户中断语音的情况下继续或停止响应。
此外,下面列出的专利文献2公开了一种声音对话设备,通过该设备用户可以容易地识别在多个用户与彼此讲话时谁的声音正在被输出。
引用列表
专利文献
专利文献1:JP 2004-325848A
专利文献2:JP 2009-261010A
发明内容
技术问题
然而,由于通过输出语音进行响应的特性,假定声音UI被用在系统与用户之间的一对一对话中,并且假定声音UI不被用在系统与多个用户之间的对话中。因此,例如,当假定在房屋或公共空间中使用声音UI系统时,某个用户很可能占用该系统。
此外,在上述专利文献1中描述的技术是用在与单个用户进行声音对话的响应系统,并且该响应系统很难同时对多个用户进行响应。此外,尽管在上述专利文献2中描述的技术涉及要由多个用户使用的系统,但未假定多个用户使用自动地通过声音对来自用户的语音进行响应的声音UI。
因此,本公开内容提出了信息处理设备、控制方法及程序,其能够在多个用户讲话时通过对各个用户输出适当的响应来提高语音识别系统的便利性。
解决方案
根据本公开内容,提供了一种信息处理设备,包括:响应生成单元,被配置成生成对来自多个用户的语音的响应;确定单元,被配置成基于根据来自多个用户的语音的顺序的优先级来确定对各个用户输出响应的方法;以及输出控制单元,被配置成执行控制以使得通过使用所确定的输出响应的方法来输出所生成的响应。
根据本公开内容,提供了一种控制方法,包括:生成对来自多个用户的语音的响应;基于根据来自多个用户的语音的顺序的优先级来确定对各个用户输出响应的方法;以及由输出控制单元执行控制以使得通过使用所确定的输出响应的方法来输出所生成的响应。
根据本公开内容,提供了一种使计算机用作以下单元的程序:响应生成单元,被配置成生成对来自多个用户的语音的响应;确定单元,被配置成基于根据来自多个用户的语音的顺序的优先级来确定对各个用户输出响应的方法;以及输出控制单元,被配置成执行控制以使得通过使用所确定的输出响应的方法来输出所生成的响应。
发明的有益效果
如上所述,根据本公开内容,可以在多个用户讲话时通过对各个用户输出适当的响应来提高语音识别系统的便利性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580078175.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于使溶液混合的系统
- 下一篇:在内预测模式的基础上处理图像的方法及其装置