[发明专利]适配自动化助理以用多种语言使用在审
申请号: | 201980091601.9 | 申请日: | 2019-05-02 |
公开(公告)号: | CN113412515A | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 梅尔文·乔斯·约翰逊普雷姆库马尔;弗拉迪米尔·武什科维奇;詹姆斯·库茨马尔斯基;柴宏杰 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G06F16/33;G06F40/35;G06F40/44;G06F40/56;G06F40/58 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 邓聪惠;周亚荣 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自动化 助理 多种 语言 使用 | ||
本文所述的技术可以用于增加自动化助理系统的语言覆盖范围,即它们可以用于增加自动化助理能够递送合理响应的一种或多种非本机语言的查询的数量。例如,本文描述了用于训练和利用机器翻译模型来将一种语言的多个语义相关自然语言输入映射到另一种语言的一个或多个规范翻译的技术。在各种实现方式中,规范翻译可以被选择和/或优化以用于由自动化助理确定说话者的意图,使得可以基于说话者的意图来执行一个或多个响应动作。换句话说,规范翻译可以被具体格式化以用于向自动化助理指示说话者的意图。
背景技术
人类可以参与与这里称为“自动化助理”(也称为“聊天程序”、“交互式个人助理”、“智能个人助理”、“个人语音助理”、“会话代理”等)的交互式软件应用的人机对话。例如,人类(当他们与自动化助理交互时,可以被称为“用户”)可以使用自由形式的自然语言输入和/或键入的自由形式的自然语言输入来提供命令、查询和/或请求(在此统称为“查询”),所述自由形式的自然语言输入可以是被转换成文本并且然后被处理的声音话语。自动化助理通常使用预定的声音话语(例如,“OK Assistant(好的助理)”)来调用,并且通常仅对跟随调用短语的那些声音话语执行各种类型的处理,例如语音到文本处理和/或自然语言处理。
自动化助理擅长以诸如英语等某些广泛使用的语言与用户通信,但不太能够以其它语言通信。然而,用于配置自动化助理以用新语言通信的常规技术是资源密集型的。对于每种新语言,可能需要生成新触发语法(即,旨在调用自动化助理的特定动作的词或短语),识别新语言的查询意图(这需要针对不同语言的不同自然语言处理组件),并且生成在新语言中可理解的自然语言输出。除了该挑战之外,每种语言具有无数的特质(例如,形态丰富、前遗忘、性别中立等),并且可能难以找到能够以特定语言构建这些系统的语言专家。
发明内容
本文描述的技术部分地涉及自动化助理解释并且响应于自动化助理的“本机”语言以外的多种不同语言的查询、命令和请求的多语言模型。本文所述的技术还可以用来增加自动化助理系统的语言覆盖范围,即它们可以用来增加自动化助理能够递送合理响应的一种或多种非本机语言的查询的数量。
本文描述用于训练和利用机器翻译模型来将一种语言的多个语义相关自然语言输入映射到另一种语言的一个或多个规范翻译的一些实现方式。在各种实现方式中,规范翻译可以被选择和/或优化以用于由自动化助理确定说话者的意图,使得可以基于说话者的意图来执行一个或多个响应动作。换句话说,规范翻译可以被具体格式化以用于向自动化助理指示说话者的意图。虽然本文描述的示例将主要涉及一种语言的多个语音输入被语音识别并且被映射到另一种语言的单个规范翻译,但这并不意味着限制。本文描述的技术可应用于非口头的自然语言输入,诸如键入的自然语言输入。
在各种实现方式中,可以例如通过一个或多个麦克风来捕获口头话语以生成音频数据。音频数据可以采取各种形式,诸如音频记录、基于口头话语生成的嵌入等。口头话语可以是第一语言,该第一语言可能不被自动化助理本机支持,或者至少可能不像第二语言那样也被自动化助理所支持。
在一些实现方式中,可以对音频数据执行语音识别处理以生成语音识别输出。语音识别输出可以采取各种形式,诸如文本、语义嵌入等。语音识别输出可以被应用作为跨经训练的机器翻译模型的输入以生成输出。基于机器翻译模型生成的输出可以指示语音识别输出从第一语言到第二语言的规范翻译。基于规范翻译,口头话语传达的意图可以被确定并被用于触发自动化助理的一个或多个响应动作。
在各种实现方式中,机器翻译模型可以被训练成将第一语言的多个语义相关短语映射到第二语言的相同规范翻译。规范翻译可以在句法上不同于多个语义相关短语中的至少一些语义相关短语。换句话说,第一语言中的多个语义相关短语中的至少一些语义相关短语将不再被映射到第二语言中的它们的“真实”或严格翻译。相反,它们可以由机器翻译模型映射到第二语言的规范翻译。然而,规范翻译可以被选择或优化以供在自动化助理域中使用。因此,第一语言的语言覆盖范围-即自动化助理能够递送合理响应的第一语言的查询的数量-可以被增加。这可以增加自动化助理系统的效用,并且可以减少自动化助理系统不能够处理的以特定非本机语言接收的查询的实例数量(以及与其相关联的计算资源使用)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980091601.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用户装置、基站及通信方法
- 下一篇:BTN3A结合蛋白及其用途