[发明专利]针对自然语言的语义处理有效
申请号: | 201610818984.3 | 申请日: | 2016-09-12 |
公开(公告)号: | CN107818076B | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 秦涛;刘铁岩 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华;丁君军 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 自然语言 语义 处理 | ||
1.一种电子设备,包括:
处理单元;
存储器,耦合至所述处理单元并且存储有指令,所述指令在由所述处理单元执行时执行以下动作:
获得包括多个项目的项目集;
确定所述项目集中的项目在第一组语义维度上的第一量化表示和在第二组语义维度上的第二量化表示,其中所述第一组语义维度表示具有第一数目的维度的多维空间,并且所述第二组语义维度表示具有第二数目的维度的多维空间;以及
至少基于所述第一量化表示和所述第二量化表示来生成所述项目的语义值,所述语义值能够用于确定所述项目与所述项目集中的其他项目之间的语义相关性,所述第一量化表示和所述第二量化表示中的至少一个由所述项目与所述项目集中的至少一个其他项目共享。
2.根据权利要求1所述的设备,其中所述语义值由向量表示,所述第一量化表示由第一子向量表示,并且所述第二量化表示由第二子向量表示。
3.根据权利要求1所述的设备,所述动作还包括:
基于所述项目的所述语义值,确定所述项目集中与所述项目相关联的另一项目。
4.根据权利要求3所述的设备,其中所述项目为句子中的第一词语,所述另一项目为所述句子中将会出现在所述第一词语之后的第二词语,并且确定所述另一项目包括:
基于所述第一词语的语义值来预测所述第二词语。
5.根据权利要求3所述的设备,其中确定所述另一项目包括:
至少基于所述第二量化表示,确定在所述第一组语义维度上的、与所述项目相关联的第三量化表示;
至少基于所述第三量化表示,确定在所述第二组语义维度上的、与所述项目相关联的第四量化表示;以及
根据所述第三量化表示和所述第四量化表示来确定所述另一项目。
6.根据权利要求1所述的设备,其中确定所述第一量化表示和所述第二量化表示包括:
将所述项目集中的所述多个项目组织成表,使得所述表中的处于同一行的项目具有在所述第一组语义维度上相同的量化表示,并且处于同一列的项目具有在所述第二组语义维度上相同的量化表示;以及
利用训练数据集来调整所述项目在所述表中的分配位置。
7.根据权利要求6所述的设备,其中将所述项目集中的所述多个项目组织成表包括:
将具有相同的前缀的项目分配在所述表中的同一行,所述前缀表示所述项目的前一部分;以及
将具有相同的后缀的项目分配在所述表中的同一列,所述后缀表示所述项目的后一部分。
8.根据权利要求6所述的设备,其中利用训练数据集来调整所述项目在所述表中的分配位置包括:
迭代执行以下操作至少一次,直至收敛条件被满足,所述收敛条件与以下至少一项相关:迭代时间、迭代次数和训练模型的参数变化:
基于所述分配位置,更新所述第一量化表示和所述第二量化表示;以及
基于更新后的所述第一量化表示和所述第二量化表示,调整所述分配位置。
9.一种计算机实现的方法,包括:
获得包括多个项目的项目集;
确定所述项目集中的项目在第一组语义维度上的第一量化表示和在第二组语义维度上的第二量化表示,其中所述第一组语义维度表示具有第一数目的维度的多维空间,并且所述第二组语义维度表示具有第二数目的维度的多维空间;以及
至少基于所述第一量化表示和所述第二量化表示来生成所述项目的语义值,所述语义值能够用于确定所述项目与所述项目集中的其他项目之间的语义相关性,所述第一量化表示和所述第二量化表示中的至少一个由所述项目与所述项目集中的至少一个其他项目共享。
10.根据权利要求9所述的方法,其中所述语义值由向量表示,所述第一量化表示由第一子向量表示,并且所述第二量化表示由第二子向量表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610818984.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据报告的生成方法、装置及电子设备
- 下一篇:一种敏感内容识别方法及装置