[发明专利]语义匹配的方法、装置、电子设备及存储介质在审
| 申请号: | 202010105193.2 | 申请日: | 2020-02-20 |
| 公开(公告)号: | CN111324699A | 公开(公告)日: | 2020-06-23 |
| 发明(设计)人: | 赵文;张开旭;刘洪;陈守志 | 申请(专利权)人: | 广州腾讯科技有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
| 地址: | 510310 广东省广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语义 匹配 方法 装置 电子设备 存储 介质 | ||
本申请提供了一种语义匹配的方法、装置、电子设备及存储介质,属于自然语言处理技术领域。所述方法包括:基于待匹配的至少两个语句中词语在语句中的依存关系,构造目标图,所述目标图的一个节点用于表示所述至少两个语句中的一个词语,所述目标图的边用于表示所述边所连接的节点所表示的词语之间存在依存关系或者不属于同一个语句;将语言模型中的掩码矩阵替换为所述目标图的邻接矩阵,所述掩码矩阵用于使参与计算的部分值不起作用;基于所述至少两个语句对应的语句向量以及替换后的所述语言模型,确定所述至少两个语句之间的语义关系。上述技术方案,增强了语义结构之间的关系,提高了语义匹配的准确度。
技术领域
本申请涉及自然语言处理技术领域,特别涉及一种语义匹配的方法、装置、电子设备及存储介质。
背景技术
随着大规模数据集的出现和深度学习的发展,出现了很多解决语义匹配问题的方法。语义匹配是指判断语句之间的语义关系,如相似关系或者矛盾关系,语义匹配的核心是词义理解和结构语义理解,词义理解是指精准掌握词语在上下文中的含义,结构语义理解是指理解语义成分之间的关系,语义成分是指语义结构的组成成分。由于语义匹配广泛的应用于搜索、问答以及内容推荐等场景中,因此语义匹配的结果是否准确,就显得尤为重要。
相关技术中,通常是通过编码器将待匹配的语句编码成向量,通过比较向量之间的距离,来得到语句之间的语义关系。该编码器可以为基于LSTM(Long Short-TermMemory,长短期记忆网络)的编码器,或者基于CNN(Convolutional Neural Networks,卷积神经网络)的编码器等。
上述语义匹配的过程中,是从语句之间的角度来理解语句各词语在上下文中的含义,忽略了语义成分之间的关系,也即忽略了对结构语义的理解,导致语义匹配的结果的准确度不高。
发明内容
本申请实施例提供了一种语义匹配的方法、装置、电子设备及存储介质,增强了语义成分之间的关系,提高了语义匹配的准确度。所述技术方案如下:
一方面,提供了一种语义匹配的方法,所述方法包括:
基于待匹配的至少两个语句中词语在语句中的依存关系,构造目标图,所述目标图的一个节点用于表示所述至少两个语句中的一个词语,所述目标图的边用于表示所述边所连接的节点所表示的词语之间存在依存关系或者不属于同一个语句;
将语言模型中的掩码矩阵替换为所述目标图的邻接矩阵,所述掩码矩阵用于使参与计算的部分值不起作用;
基于所述至少两个语句对应的语句向量以及替换后的所述语言模型,确定所述至少两个语句之间的语义关系。
一方面,提供了一种语义匹配装置,所述装置包括:
构造模块,用于基于待匹配的至少两个语句中词语在语句中的依存关系,构造目标图,所述目标图的一个节点用于表示所述至少两个语句中的一个词语,所述目标图的边用于表示所述边所连接的节点所表示的词语之间存在依存关系或者不属于同一个语句;
替换模块,用于将语言模型中的掩码矩阵替换为所述目标图的邻接矩阵,所述掩码矩阵用于使参与计算的部分值不起作用;
确定模块,用于基于所述至少两个语句对应的语句向量以及替换后的所述语言模型,确定所述至少两个语句之间的语义关系。
在一种可选的实现方式中,所述构造模块,还用于对待匹配的至少两个语句分别进行依存句法分析,得到至少两个依存句法树,一个所述依存句法树用于表示一个语句中词语之间的依存关系;响应于所述至少两个语句中的两个词语之间具有所述依存关系或者不属于同一个语句,在用于表示所述两个词语的两个节点之间构造边,得到目标图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州腾讯科技有限公司,未经广州腾讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010105193.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种时政要闻自动分类方法及其终端
- 下一篇:一种热点内容确认方法及装置





