[发明专利]意图理解装置以及方法有效
申请号: | 201480077480.X | 申请日: | 2014-03-31 |
公开(公告)号: | CN106663424B | 公开(公告)日: | 2021-03-05 |
发明(设计)人: | 景祎;藤井洋一;石井纯 | 申请(专利权)人: | 三菱电机株式会社 |
主分类号: | G10L15/10 | 分类号: | G10L15/10;G10L15/22 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉;黄纶伟 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 意图 理解 装置 以及 方法 | ||
语音识别部(3)根据一个输入语音(2),生成多个语音识别结果。意图理解部(7)按照每个语音识别结果估计意图,输出一个以上的意图理解结果和分数。权重计算部(11)使用控制对象设备的设定信息(9)计算等待权重。意图理解校正部(12)使用等待权重,校正意图理解结果候选的分数,算出最终分数,根据该最终分数从意图理解结果候选中选择意图理解结果(13)。
技术领域
本发明涉及根据语音识别结果估计用户的意图的意图理解装置以及其方法。
背景技术
近年来,使用人们说的语言的语音识别结果来执行装置的操作的技术受到关注。该技术被用作移动电话、导航装置等的语音接口。作为现有的基本方法,具有以下这样的方法:例如装置预先存储假定的语音识别结果与操作的对应关系,当用户发出的语音的识别结果是假定的内容时,执行与该识别结果对应的操作。
该方法与用户手动操作的情况相比,可通过语音的发声进行直接操作,因此,作为快捷功能有效地发挥作用。另一方面,用户为了执行操作,需要发出装置等待的语言,当装置处理的功能增加时,用户不得不预先记住的语言增加。另外,一般情况下,在充分理解使用说明书后使用装置的用户较少,所以,没有理解的用户不知道为了进行操作要说什么,所以,还具有这样的问题:实际上,除了记住的功能的指令以外,无法利用语音进行操作。
因此,作为改良上述问题的技术,提出了以下这样的方法:即使用户没有记住用于达成目的的指令,装置也通过对话来引导用户达成目的。作为其实现的方法的一个重要技术,例如在专利文献1中公开了根据用户的发话来正确地估计该用户的意图的技术。
专利文献1的语音处理装置按照分别表示多个意图的多个意图信息,具有语言的词典数据库以及文法数据库,还将此前执行的指令的信息作为事先分数进行保持。该语音处理装置按照多个意图信息来计算音响分数、语言分数以及事先分数,作为表示根据用户发话而输入的语音信号相对于意图信息的一致度的分数,选择综合这些分数而获得的综合分数最大的意图信息。此外,还公开了以下的情况:语音处理装置根据综合分数来执行所选择的意图信息,在用户确认后执行或放弃。
但是,在专利文献1中,所定义的意图是“请告诉天气”、“请告诉时间”这种形式的唯一决定的意图,没有提及例如假定了包含在导航装置的终点设定中所需的多用的设施名这样的意图的处理。
现有技术文献
专利文献
专利文献1:日本特开2011-33680号公报
发明内容
发明要解决的课题
在上述专利文献1的语音处理装置中,因为按照意图来设计语音识别结果,所以,仅仅是从多个不同的意图中进行选择、以及判定最终选择的意图信息的执行和放弃,不处理语音识别结果的次级候选。
例如,在用户听音乐的状态下作出“不听音乐”这样的发话的情况下,当“想听音乐”这样的第1候选和“不听音乐”这样的第2候选的意图作为结果求出时,选择第1候选的“想听音乐”。
此外,在导航装置的终点已经设定了“○○中心”的状态下用户为了追加途经地而作出“停在○×中心”这样的发话的结果是,在“停在○○中心”是第1候选的意图、“停在○×中心”是第2候选的意图的情况下也会选择第1候选的“停在○○中心”。
这样,具有以下这样的课题:因为现有装置不处理次级候选,所以,难以正确地理解用户的意图。其结果是,用户必须取消所选择的第1候选,再次作出发话。
本发明是为了解决上述这样的课题而完成的,其目的是提供利用输入语音来正确地理解用户的意图的意图理解装置以及方法。
解决问题的手段
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480077480.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种微耕机刀具
- 下一篇:提供音频录音以供内容资源中使用的引擎、系统和方法