[发明专利]对话控制装置和方法在审
申请号: | 201780049114.7 | 申请日: | 2017-08-03 |
公开(公告)号: | CN109564757A | 公开(公告)日: | 2019-04-02 |
发明(设计)人: | 岩濑广;斋藤真里;河野真一 | 申请(专利权)人: | 索尼公司 |
主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L13/00;G10L13/10;G10L15/22 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杜诚;刘敏 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对话控制装置 话语文本 进度控制 行为请求 对话控制 对话系统 检测结果 位置处 对话 诱导 话语 应用 | ||
本发明涉及可以执行更加适当的对话控制的对话控制装置和方法。该对话控制装置设置有对话进度控制单元,该对话进度控制单元基于由理解行为请求位置划分的话语文本,在一个或多个理解行为请求位置处诱导用户的理解行为,并且基于话语文本和对理解行为的检测结果来控制随后的话语。本发明可以被应用于声音对话系统。
技术领域
本技术涉及交互控制装置和方法,并且特别地涉及使得能够执行更加适当的交互控制的交互控制装置和方法。
背景技术
传统上,已知用于控制与用户的语音交互的技术。
上述技术的示例包括向用户请求语音话语、基于用户说出的关键词来确定用户的理解程度、以及根据确定结果推进交互的技术(例如,参见专利文献1)。
此外,例如,还提出了在与用户的交互中检测用户的快速响应行为或者向用户请求快速响应的技术(例如,参见专利文献2)。
引用列表
专利文献
专利文献1:日本专利申请公开第2005-234331号
专利文献2:日本专利申请公开第H9-218770号
发明内容
本发明要解决的问题
然而,在上述技术中,难以适当地控制与用户的语音交互。
例如,在基于关键字确定用户的理解程度的技术中,根据用户的理解程度输出提示用户输入语音的消息。然而,在系统通过语音来呈现要发送给用户的大量信息(例如要发送给用户的长的项目列表,或指示要发送的内容的长句子)的情况下,无法以适当的粒度(即,在适当的定时处)测量用户的理解程度。
文本到语音(Text To Speech,TTS)中的合成语音具有恒定的速度和语音抑扬。在信息量很大、并且要通过语音说出的句子很长的情况下,例如,有可能执行不适合用户情况的交互控制,以致于即使当用户理解话语的内容并且集中精力聆听话语时,也以慢速说出话语或频繁地提示用户输入语音。在这种情况下,用户难以理解话语的内容,并且用户也难以记住话语的内容。
此外,在上述技术中,在语音交互期间(即在话语语音的句子中间),没有诱导对用户而言负担小的、诸如快速响应或点头的理解行为。
因此,不能例如通过以下方式以适当的粒度向用户请求对用户而言负担小的理解行为:根据用户的专注程度或理解程度来控制在比句子短的句段(短语)之间的划分处或在语义划分处请求理解行为的频率。
鉴于上述情况创建了本技术,并且本技术使得能够执行更加适当的交互控制。
问题的解决方案
本技术的一个方面的交互控制装置包括交互进度控制器,该交互进度控制器基于已经在一个或多个理解行为请求位置处划分的话语文本,使得在所述一个或多个理解行为请求位置处话语被说出,该话语诱导用户执行理解行为,并且交互进度控制器基于检测理解行为的结果和话语文本来控制下一话语。
在由用户执行的理解行为是肯定行为的情况下,可以使交互进度控制器使得话语文本中的尚未说出的下一词语被说出。
在由用户执行的理解行为是否定行为的情况下,可以使交互进度控制器使得最近说出的话语被再次说出。
可以使交互进度控制器控制基于话语文本的话语,使得随着由用户执行的肯定理解行为的响应时间减少,诱导理解行为的次数也减少。
可以使交互进度控制器控制基于话语文本的话语,使得随着由用户执行的肯定理解行为的响应时间减少,话语速度提高。
可以使交互进度控制器控制基于话语文本的话语,使得随着由用户执行的肯定理解行为的响应时间减少,话语的声调变得更高。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780049114.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能钢琴系统
- 下一篇:电子设备及其语音识别方法