[发明专利]基于迁移学习的文本匹配方法、装置、介质及设备在审
| 申请号: | 201910650372.1 | 申请日: | 2019-07-18 |
| 公开(公告)号: | CN110377714A | 公开(公告)日: | 2019-10-25 |
| 发明(设计)人: | 潘申龄;杨正良;刘设伟 | 申请(专利权)人: | 泰康保险集团股份有限公司;泰康在线财产保险股份有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06K9/62 |
| 代理公司: | 隆天知识产权代理有限公司 72003 | 代理人: | 郑特强;聂慧荃 |
| 地址: | 100031 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语义向量 匹配 查询语句 文本匹配 语句集合 语句 自然语言处理技术 迁移 计算机存储介质 电子设备 目标匹配 语言模型 语义表示 准确度 正整数 文本 学习 | ||
本公开涉及自然语言处理技术领域,提供了一种基于迁移学习的文本匹配方法及装置、计算机存储介质、电子设备,其中,上述方法包括:获取查询语句以及与查询语句对应的待匹配语句集合;基于预训练的语言模型,确定关于待匹配语句集合中第i个待匹配语句与查询语句的第i组语义向量集,其中,每组语义向量集包含第一语义向量和第二语义向量;根据第i组语义向量集中的第一语义向量与第二语义向量确定第i个待匹配语句与查询语句之间的匹配值,其中,i为正整数;根据匹配值,在待匹配语句集合中确定查询语句的目标匹配文本。本公开提供的技术方案能够显著提升基于语义表示的文本匹配准确度。
技术领域
本公开涉及自然语言处理技术领域,特别涉及一种基于迁移学习的文本匹配方法、基于迁移学习的文本匹配装置,以及实现上述方法的计算机存储介质及电子设备。
背景技术
在自然语言处理(Natural Language Processing,简称:NLP)中,文本匹配技术通常以文本相似度计算、文本相关性计算的形式进行的,可应用于搜索引擎、智能问答、知识检索、信息流推荐等方面。
随着深度学习技术在NLP中的应用,相关技术中,深度语义匹配网络逐渐被应用于文本匹配,以基于语义表示(sentence encoding,简称:SE)网络为例进行说明。
SE网络核心思想是提取文本整体语义再进行匹配,通常分为输入层,表征层和匹配层。输入层将文本字序列或者词序列映射成字向量(char embedding)或者词向量(wordembedding)序列;表征层一般采用循环神经网络(Recurrent Neural Network,简称:RNN)或者卷积神经网络(Convolutional Neural Network,简称:CNN)作为字向量、词向量序列的特征抽取器,将字向量、词向量序列转换为具有全局信息的低维稠密的语义向量;匹配层利用上述语义向量进行相似度计算,例如,常用cosine相似度函数或者通过多层感知机(Multi-Layer Perception,简称:MLP)网络训练拟合出一个匹配值来实现相似度计算。
然而,相关技术提供的文本匹配方案存在匹配准确度有待提高
需要说明的是,上述背景技术部分公开的信息仅用于加强对本公开的背景的理解。
发明内容
本公开的目的在于提供一种基于迁移学习的文本匹配方法、基于迁移学习的文本匹配装置、计算机存储介质及电子设备,进而至少在一定程度上避免了相关技术中文本匹配方案存在匹配准确度的缺陷。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的第一方面,提供一种基于迁移学习的文本匹配方法,所述方法包括:
获取查询语句以及与所述查询语句对应的待匹配语句集合;基于预训练的语言模型,确定关于所述待匹配语句集合中第i个待匹配语句与所述查询语句的第i组语义向量集,其中,每组所述语义向量集包含第一语义向量和第二语义向量;根据第i组语义向量集中的第一语义向量与第二语义向量确定所述第i个待匹配语句与所述查询语句之间的匹配值,其中,i为正整数;根据所述匹配值,在所述待匹配语句集合中确定所述查询语句的目标匹配文本。
在本公开的示例性实施例中,基于前述方案,在所述确定关于所述待匹配语句集合中第i个待匹配语句与所述查询语句的第i组语义向量集之前,所述方法还包括:获取多组样本,其中,每组样本包含一语句对和用于标识所述语句对是否相匹配的分类标签;根据所述样本中的训练集,对所述预训练的语言模型进行微调训练。
在本公开的示例性实施例中,基于前述方案,所述方法还包括:根据所述样本中的测试集,对所述微调训练后的预训练的语言模型进行测试,得到测试结果;响应于所述测试结果满足预设条件,则得到训练好的所述预训练的语言模型,以用于确定所述第i组语义向量集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰康保险集团股份有限公司;泰康在线财产保险股份有限公司,未经泰康保险集团股份有限公司;泰康在线财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910650372.1/2.html,转载请声明来源钻瓜专利网。





