[发明专利]语义匹配的方法、装置、电子设备及存储介质在审
| 申请号: | 202010105193.2 | 申请日: | 2020-02-20 |
| 公开(公告)号: | CN111324699A | 公开(公告)日: | 2020-06-23 |
| 发明(设计)人: | 赵文;张开旭;刘洪;陈守志 | 申请(专利权)人: | 广州腾讯科技有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
| 地址: | 510310 广东省广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语义 匹配 方法 装置 电子设备 存储 介质 | ||
1.一种语义匹配的方法,其特征在于,所述方法包括:
基于待匹配的至少两个语句中词语在语句中的依存关系,构造目标图,所述目标图的一个节点用于表示所述至少两个语句中的一个词语,所述目标图的边用于表示所述边所连接的节点所表示的词语之间存在依存关系或者不属于同一个语句;
将语言模型中的掩码矩阵替换为所述目标图的邻接矩阵,所述掩码矩阵用于使参与计算的部分值不起作用;
基于所述至少两个语句对应的语句向量以及替换后的所述语言模型,确定所述至少两个语句之间的语义关系。
2.根据权利要求1所述的方法,其特征在于,所述基于待匹配的至少两个语句中词语之间的依存关系,构造目标图,包括:
对待匹配的至少两个语句分别进行依存句法分析,得到至少两个依存句法树,一个所述依存句法树用于表示一个语句中词语之间的依存关系;
响应于所述至少两个语句中的两个词语之间具有所述依存关系或者不属于同一个语句,在用于表示所述两个词语的两个节点之间构造边,得到目标图。
3.根据权利要求1所述的方法,其特征在于,所述基于所述至少两个语句对应的语句向量以及替换后的所述语言模型,确定所述至少两个语句之间的语义关系,包括:
将所述至少两个语句对应的语句向量输入替换后的所述语言模型;
基于所述语言模型的编码层,确定所述至少两个语句中词语之间的相似程度;
基于所述语言模型的解码层,确定所述至少两个语句之间的语义关系。
4.根据权利要求3所述的方法,其特征在于,所述基于所述语言模型的编码层,确定所述至少两个语句中词语之间的相似程度,包括:
在所述编码层中,根据所述邻接矩阵,将满足目标条件的词语之间的第一关联信息调整至第二关联信息,所述第二关联信息所表示的词语之间的关联程度大于所述第一关联信息;
根据所述第二关联信息,确定所述至少两个语句中词语之间的相似程度。
5.根据权利要求4所述的方法,其特征在于,所述第一关联信息和所述第二关联信息以数值形式表示;
所述根据所述邻接矩阵,将满足目标条件的词语之间的第一关联信息调整至第二关联信息,包括:
将所述邻接矩阵的元素值作为关系增强参数,所述关系增强参数的取值为1或0,1表示词语之间满足所述目标条件,0表示词语之间不满足所述目标条件;
获取目标参数,将所述目标参数输入激活函数,所述目标参数为随着所述语言模型的训练进行优化的参数,所述激活函数用于保证正向增强词语之间的关联程度;
根据所述关系增强参数和所述激活函数的乘积对词语之间的第一关联信息进行调整,得到所述第二关联信息。
6.根据权利要求4或5任一项权利要求所述的方法,其特征在于,所述目标条件为下述任一种:
属于不同语句的词语;
属于同一语句且具有依存关系的词语。
7.根据权利要求4或5任一项权利要求所述的方法,其特征在于,所述根据所述第二关联信息,确定所述至少两个语句中词语之间的相似程度,包括:
对于任一词语,将所述词语与所述两个语句中其他词语之间的第二关联信息,作为所述词语对应的注意力矩阵中的元素;
根据所述注意力矩阵和所述其他词语的值向量,确定所述词语与所述其他词语之间的相似程度。
8.根据权利要求3所述的方法,其特征在于,所述基于所述语言模型的解码层,确定所述至少两个语句之间的语义关系,包括:
在所述解码层,根据所述邻接矩阵,对所述编码层的输出结果进行解码;
根据所述解码层的输出结果,确定所述至少两个语句之间的语义关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州腾讯科技有限公司,未经广州腾讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010105193.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种时政要闻自动分类方法及其终端
- 下一篇:一种热点内容确认方法及装置





