[发明专利]一种确定用户意图的方法及装置在审
申请号: | 202011628131.6 | 申请日: | 2020-12-31 |
公开(公告)号: | CN114694645A | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 黄益贵;乔登龙;夏潘斌 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L15/06;G06F16/9535;G06F16/9035;G06F16/9032 |
代理公司: | 北京格罗巴尔知识产权代理事务所(普通合伙) 11406 | 代理人: | 孙德崇 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 确定 用户 意图 方法 装置 | ||
本申请涉及一种确定用户意图的方法及装置,涉及人工智能领域的自然语言理解技术。所述方法包括:获取语音信号对应的语音文本;将所述语音文本分别输入至至少一个基准意图识别模型和至少一个第三方意图识别模型中,经所述至少一个基准意图识别模型输出第一意图集合,经所述至少一个第三方意图识别模型输出第二意图集合,其中,所述第三方意图识别模型被设置为基于相同技能类别的所述基准意图识别模型及其模型训练数据训练得到;根据所述第一意图集合中意图的置信度和所述第二意图集合中意图的置信度确定所述语音文本的意图。
技术领域
本申请涉及人工智能语音交互技术领域,尤其涉及一种确定用户意图的方法及装置。
背景技术
近年来,智能语音交互(Intelligent Speech Interaction)技术得到迅速发展,智能语音交互技术基于语音识别、语音合成、自然语言理解等技术,可以为用户在多种实际应用场景下赋予产品“能听、会说、懂你”式的智能人机交互体验。
目前,智能语音交互平台往往需要与多个第三方平台的合作,才可以向用户提供丰富的语音技能。典型地,合作的第三方平台主要包括商家、音乐广播平台、天气资讯平台等等。由于第三方平台的数量众多且有很多第三方平台属于同一类型,因此,如何准确地识别用户想要触发哪个平台的哪个技能变得非常重要。通常,智能语音交互平台仅支持对第三方平台开放带有技能唤醒词的技能,这些技能只能通过用户语音文本中带有明确的技能唤醒词才能召回,在一个示例中,可以设置播放音乐的技能唤醒词为“播放音乐”,那么,如果用户需要听某个歌曲,则需要先说出技能唤醒词“播放音乐”,然后再说出歌曲的名称。由于智能语音交互平台所涉及到的语音技能很多,利用技能唤醒词唤醒技能的方式对用户的要求较高,用户不可能记住太多技能唤醒词。进而,免技能唤醒词触发语音技能成为用户比较受欢迎的语音交互方式,免技能唤醒词触发语音技能即为在不需要说出技能唤醒词的情况下触发语音技能,例如在上述示例中,用户不需要先说出技能唤醒词“播放音乐”,用户可以直接说“播放XY”(XY是歌曲的名称)即可触发播放音乐的技能。相关技术中,智能语音交互平台往往可以开发多个预设意图,这些预设意图往往不可修改。如果第三方平台支持其中的某个或者某些预设意图,可以引用对应的预设意图。这样,在用户的语音命中其中的一个预设意图且该预设意图对应于多个第三方平台的语音技能的情况下,可以向用户确认使用哪个第三方平台的语音技能。相关技术中的方式,第三方平台只能引用智能语音交互平台已经定义的预设意图,而不能扩展已有预设意图,可扩展性较差。
因此,相关技术中亟需一种能够为第三方平台提供扩展性较好的自定义语音意图的方式。
发明内容
有鉴于此,提出了一种确定用户意图的方法及装置。
第一方面,本申请的实施例提供了一种确定用户意图的方法。
根据第一方面,在第一种可能的实现方式中,包括:
获取语音信号对应的语音文本;
将所述语音文本分别输入至至少一个基准意图识别模型和至少一个第三方意图识别模型中,经所述至少一个基准意图识别模型输出第一意图集合,经所述至少一个第三方意图识别模型输出第二意图集合,其中,所述第三方意图识别模型基于相同技能类别的所述基准意图识别模型及其模型训练数据训练得到;
根据所述第一意图集合中意图的置信度和所述第二意图集合中意图的置信度确定所述语音文本的意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011628131.6/2.html,转载请声明来源钻瓜专利网。