[发明专利]文本匹配方法、装置、设备及存储介质在审

专利信息
申请号: 202011131760.8 申请日: 2020-10-21
公开(公告)号: CN112307179A 公开(公告)日: 2021-02-02
发明(设计)人: 傅向华;韦炎志 申请(专利权)人: 深圳技术大学
主分类号: G06F16/332 分类号: G06F16/332;G06F40/35;G06F40/289;G06N3/04
代理公司: 深圳青年人专利商标代理有限公司 44350 代理人: 吴桂华
地址: 518000 广东省深*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文本 匹配 方法 装置 设备 存储 介质
【说明书】:

发明适用计算机技术领域,提供了一种文本匹配方法、装置、设备及存储介质,该方法包括:获取第一文本和第二文本;对第一文本和第二文本进行处理,得到第一文本向量和第二文本向量,第一文本向量包括与第一文本对应的多个第一词嵌入,第二文本向量包括与第二文本对应的多个第二词嵌入;在预先训练好的文本匹配模型中,对第一文本向量和第二文本向量分别进行语义特征提取、情感特征提取和上下文特征提取,得到第一文本的第一特征向量和第二文本的第二特征向量;在文本匹配模型中,根据第一特征向量和第二特征向量,确定第一文本与第二文本的匹配关系,从而综合文本的语义特征、情感特征和上下文信息进行文本匹配,提高了文本匹配的效果。

技术领域

本发明属于自然语言处理技术领域,尤其涉及一种文本匹配方法、装置、设备及存储介质。

背景技术

作为自然语言理解的核心,文本匹配可以应用到大量已知的自然语言处理任务中,例如信息检索、自动问答、机器翻译、对话系统、问题复述,这些自然语言处理任务都可以在一定程度上抽象成文本匹配问题,比如信息检索可以归结为查询项和文档的匹配,自动回答可以归结为问题和候选答案的匹配,机器翻译可以归结为两种语言文本的匹配,对话系统可以归结为前一句对话和回复的匹配,复述问题可以归结为两个同义文本的匹配。因此,这一系列的自然语言处理任务都需要依靠文本匹配模型的参与和协作,文本匹配模型的性能会在很大程度上影响到这些自然语言处理任务的最终表现。

随着深度学习技术的发展,基于神经网络的文本语句匹配模型成为文本匹配模型的主流选择。根据匹配思路的不同,可以将基于神经网络的文本语句匹配模型分为两大类,分别是基于词语交互的文本语句匹配模型和基于语句表征的文本语句匹配模型。基于词语交互的文本语句匹配模型,基本思路是通过词语间的直接交互来产生交互信号,利用这些词语间的交互信号作为匹配特征,最后实现语义关系的建模和匹配。

基于词语交互的文本匹配模型的优点是能够获得词语级别的细粒度交互特征,并且通过注意力机制能够更好地对局部语义进行建模。然而,基于词语交互的文本匹配模型在文本匹配时,尚无法有效地捕捉到文本的情感信息,导致文本匹配效果不佳。

发明内容

本发明的目的在于提供一种文本匹配方法、装置、设备及存储介质,旨在解决由于现有技术无法提供一种有效的文本匹配方法,导致文本匹配效果不佳的问题。

一方面,本发明提供了一种文本匹配方法,所述方法包括下述步骤:

获取第一文本和第二文本;

对所述第一文本和所述第二文本进行处理,得到第一文本向量和第二文本向量,所述第一文本向量包括与所述第一文本对应的多个第一词嵌入,所述第二文本向量包括与所述第二文本对应的第二词嵌入;

在预先训练的文本匹配模型中,对所述第一文本向量和所述第二文本向量分别进行语义特征提取、情感特征提取和上下文特征提取,得到所述第一文本的第一特征向量和所述第二文本的第二特征向量;

在所述文本匹配模型中,根据所述第一特征向量和所述第二特征向量,确定所述第一文本与所述第二文本的匹配关系。

另一方面,本发明提供了一种文本匹配装置,所述装置包括:

文本获取模块,用于获取第一文本和第二文本;

文本处理模块,用于对所述第一文本和所述第二文本进行处理,得到第一文本向量和第二文本向量,所述第一文本向量包括与所述第一文本对应的多个第一词嵌入,所述第二文本向量包括与所述第二文本对应的多个第二词嵌入;

特征提取模块,用于在预先训练好的文本匹配模型中,对所述第一文本向量和所述第二文本向量分别进行语义特征提取、情感特征提取和上下文特征提取,得到所述第一文本的第一特征向量和所述第二文本的第二特征向量;以及

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳技术大学,未经深圳技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011131760.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top