[发明专利]用于不同标记集合的转移学习技术的系统和方法有效
申请号: | 201680039897.6 | 申请日: | 2016-07-05 |
公开(公告)号: | CN107735804B | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 金永邦;R·萨里卡亚 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G06K9/62;G06N20/00 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅;杜波 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 不同 标记 集合 转移 学习 技术 系统 方法 | ||
本公开的示例描述了用于不同标记集合的转移学习技术的系统和方法。在各方面中,可以访问服务器设备上的数据集。数据集可以包括标记和与标记相关联的词集。服务器设备可以引起数据集内的标记嵌入。嵌入的标记可以由对应于特定标记的多维向量表示。向量可以用于构建数据集的标记映射。标记映射可以用于训练模型以执行领域适应或转移学习技术。该模型可以用于向语句/查询或训练模型提供结果。
背景技术
自然语言理解(NLU)是计算机程序理解人类言语和提取口头或键入输入的含义的能力。NLU系统已经与各种领域(例如,地点、天气、通信、提醒)结合使用。通常,这些领域中的NLU基于统计机器学习模型,这些模型需要大量特定于领域的注释训练数据。出于这样的原因,建立新的领域需要大量的资源投资。虽然领域适应中的各种技术和方法已经发展到解决这些问题,但是这些解决方案假设使用不变的标记空间。因此,这些解决方案的直接应用目前是不可能的。
本文所公开的方面就是针对这些以及其他一般考虑而提出的。而且,虽然可以讨论相对具体的问题,但是应当理解的是,这些示例不应该被限制为解决背景技术或者本公开中的其他地方所标识的具体问题。
发明内容
提供本“发明内容”是为了以简化形式介绍将在以下具体实施方式部分中进一步描述的概念的选择。本发明内容不旨在标识所要求保护的技术主题的关键特征或必要特征,也不旨在用作帮助确定所要求保护的技术方案的范围。
本公开的示例描述了用于不同标记集合的转移学习技术的系统和方法。在各方面中,可以在服务器设备上访问数据集。数据集可以包括标记以及与标记相关联的词集。服务器设备可以引起标记嵌入到数据集。嵌入的标记可以由对应于特定标记的多维向量表示。向量可以用于构建数据集的标记映射。标记映射可以用于训练模型以执行领域适应或转移学习技术。该模型可以用来向语句/查询提供结果或训练不同的模型。
提供本发明内容是为了以简化形式介绍将在以下具体实施方式中进一步描述的概念的选择。本发明内容不旨在标识所要求保护的技术方案的关键特征或必要特征,也不旨在用于限定所要求保护的技术方案的范围。示例的额外方面、特征和/或优点将部分地在下面的描述中阐述,并且部分地将通过描述而显而易见,或者可以通过本公开的实践而被了解。
附图说明
参考以下附图来描述非限制性和非穷尽性示例。
图1示出了本文所述用于实现不同标记集合的转移学习技术的示例性系统的概述。
图2示出了本文所述用于实现不同标记集合的转移学习技术的示例性输入处理单元的概述。
图3示出了本文所述用于不同标记集合的转移学习技术的示例性方法。
图4示出了本文所述使用接收到的输入来执行用于不同标记集合的转移学习技术的示例性方法。
图5是示出可以实践本公开的各方面的计算设备的示例的框图。
图6A和图6B是可以实践本公开的各方面的移动计算设备的简化框图。
图7是其中可以实践本公开的各方面的分布式计算系统的简化框图。
图8是示例性领域中的双射映射的示例图。
具体实施方式
下面参考附图更全面地描述本公开的各方面,附图形成本公开的一部分,并且示出了具体的示例性方面。然而,本公开的不同方面可以以许多不同的形式实现,并且不应被解释为限于在此阐述的各方面;相反,这些方面被提供以使得本公开将是彻底和完整的,并将向本领域技术人员充分地传达这些方面的范围。各方面可以被实践为方法、系统或设备。因此,各方面可以采取硬件实现方式、完全软件实现方式或者组合软件和硬件方面的实现方式的形式。因此,下面的详细描述不应被认为是限制性的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680039897.6/2.html,转载请声明来源钻瓜专利网。