[发明专利]文本的匹配方法、匹配装置、终端及计算机可读存储介质有效
申请号: | 201811640931.2 | 申请日: | 2018-12-29 |
公开(公告)号: | CN111382246B | 公开(公告)日: | 2023-03-14 |
发明(设计)人: | 熊友军;熊为星;廖洪涛 | 申请(专利权)人: | 深圳市优必选科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;H04M3/527 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 张全文 |
地址: | 518000 广东省深圳市南山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 匹配 方法 装置 终端 计算机 可读 存储 介质 | ||
1.一种文本的匹配方法,其特征在于,所述匹配方法包括:
获取第一文本和第二文本;
获取所述第一文本对应的第一向量以及所述第二文本对应的第二向量;
计算所述第一向量和所述第二向量的向量积;
根据第一映射函数将所述向量积映射为第一特征向量;
根据第二映射函数将所述第一向量映射为第二特征向量;
基于所述第一特征向量和所述第二特征向量,确定第二文本与所述第一文本的匹配度。
2.根据权利要求1所述的文本的匹配方法,其特征在于,所述获取第一文本和第二文本包括:
获取第一文本,以及所述第一文本的类别信息;
基于所述类别信息确定与所述第一文本对应的文本匹配库;
从所述文本匹配库中选取与所述第一文本进行匹配的第二文本。
3.根据权利要求2所述的文本的匹配方法,其特征在于,所述匹配方法还包括:
分别确定所述文本匹配库中各文本与所述第一文本的匹配度;
将所述匹配库中与所述第一文本的匹配度最高的文本作为所述第一文本的匹配文本。
4.根据权利要求1至3任一项所述的文本的匹配方法,其特征在于,所述第一映射函数包括多层映射关系,所述第一映射函数的数学表示为:
z(l)=relu(W(l)z(l-1)+b(l))
其中,设第一映射函数包括的映射关系的层数为L,则l=1,2,...,L,W(l)表示第l层映射关系对应的权重矩阵,b(l)表示第l层映射关系对应的偏置向量,z(l-1)表示第l层映射关系对应的输入,z(l)表示第l层映射关系对应的映射输出,relu表示映射输出的激励方式;
所述第二映射函数的数学表示为:
h=relu(Wpq1+bp)
其中,h表示第二映射函数的映射输出,q1表示第二映射函数的输入,Wp表示第二映射函数的权重矩阵,bp表示第二映射函数的偏置向量,relu表示映射输出的激励方式。
5.根据权利要求4所述的文本的匹配方法,其特征在于,所述第一映射函数的各层映射关系对应的权重矩阵和偏置向量、以及所述第二映射函数的权重矩阵和偏置向量为通过训练得到,训练的步骤包括:
获取训练样本,其中,所述训练样本包括正向样本和负向样本,所述正向样本包含的文本对之间的匹配度大于所述负向样本包含的文本对之间的匹配度;
利用所述训练样本对所述第一映射函数和所述第二映射函数进行迭代计算;
根据预设的损失函数计算所述训练样本中正向样本对应的输出结果和负向样本对应的输出结果的损失值,并根据所述损失值进行梯度更新,确定所述第一映射函数的各层映射关系对应的权重矩阵和偏置向量、以及所述第二映射函数的权重矩阵和偏置向量。
6.根据权利要求5所述的文本的匹配方法,其特征在于,所述获取训练样本包括:
采集训练用的文本;
对所述训练用的文本进行分类,确定各文本的所属类别;
根据所述各文本的所属类别,确定所述各文本之间的匹配度;
基于所述各文本之间的匹配度构建文本三元组(Q1,Q2,Q3)作为训练样本,其中,Q1与Q2组成正向样本,Q1与Q3组成负向样本,所述正向样本之间的匹配度大于所述负向样本之间的匹配度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市优必选科技有限公司,未经深圳市优必选科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811640931.2/1.html,转载请声明来源钻瓜专利网。