[发明专利]文本匹配分析方法、装置、电子设备及存储介质在审

申请号：	202110706501.1	申请日：	2021-06-24
公开（公告）号：	CN113342940A	公开（公告）日：	2021-09-03
发明（设计）人：	张炜	申请（专利权）人：	中国平安人寿保险股份有限公司
主分类号：	G06F16/33	分类号：	G06F16/33;G06F40/126;G06F40/194;G06K9/62
代理公司：	深圳市赛恩倍吉知识产权代理有限公司 44334	代理人：	刘丽华;杨毅玲
地址：	518000 广东省深圳市福田区益田路503***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本匹配分析方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及人工智能技术领域，提供一种文本匹配分析方法、装置、电子设备及存储介质，所述方法包括：将查询文本输入至预设的第一BERT模型中，得到查询向量，及将结果文本集输入至预设的第二BERT模型中，得到每个结果文本的多个词向量；根据查询向量和每个结果文本的每个词向量计算对应词的注意力权重；根据每个结果文本的每个词的注意力权重对对应结果文本进行加权求和，得到第一文本向量；拼接查询向量和每个结果文本的第一文本向量得到第二文本向量，并输入至全连接层，确定查询文本和每个结果文本的匹配值。本发明基于查询向量对结果文本中的词向量进行加权，能够更加准确得到每个词的加权词向量，提高了文本匹配分析的准确性。

技术领域

本发明涉及人工智能技术领域，具体涉及一种文本匹配分析方法、装置、电子设备及存储介质。

背景技术

在人工智能领域，对文本进行文本分析时，特别是进行文本匹配分析，通过需要预先对文本的对应的向量进行处理，得到处理后的特征向量，基于处理后的特征向量计算文本的匹配度，进而确认文本是否匹配，然而，现有的文本匹配算法主要考虑查询词频和逆文档频率，未考虑到文本中词的顺序和上下文，引起潜在语义的丢失，导致文本匹配分析准确率低，匹配文本效果较差。

发明内容

鉴于以上内容，有必要提出一种文本匹配分析方法、装置、电子设备及存储介质，基于查询向量对结果文本中的词向量进行加权，能够更加准确得到每个词的加权词向量，提高了文本匹配分析的准确性。

本发明的第一方面提供一种文本匹配分析方法，所述方法包括：

获取查询文本和所述查询文本对应的结果文本集；

将所述查询文本输入至预设的第一BERT模型中，得到查询向量，及将所述结果文本集输入至预设的第二BERT模型中，得到每个结果文本的多个词向量；

根据所述查询向量和每个结果文本的每个词向量计算对应词的注意力权重；

根据每个结果文本的每个词的注意力权重对对应结果文本进行加权求和，得到每个结果文本的第一文本向量；

拼接所述查询向量和每个结果文本的第一文本向量得到第二文本向量，并将所述第二文本向量输入至全连接层，确定所述查询文本和每个结果文本的匹配值。

可选地，所述根据所述查询向量和每个结果文本的每个词向量计算对应词的注意力权重包括：

计算所述查询向量与每个结果文本的每个词向量之间的点积，得到每个结果文本的每个词向量的第一乘积；

计算所述查询向量的模与每个结果文本的每个词向量的模之间的乘积，得到每个结果文本的每个词向量的第二乘积；

计算所述第一乘积和所述第二乘积的商数，将所述商数确定为所述查询向量与每个结果文本的每个词向量之间的相似度；