[发明专利]基于Coarse2Fine网络的相似问题匹配方法在审

专利信息
申请号: 202111188461.2 申请日: 2021-10-12
公开(公告)号: CN113988081A 公开(公告)日: 2022-01-28
发明(设计)人: 王东升;赵翠平;王奇;李佳伟;路曼;钟家国 申请(专利权)人: 江苏科技大学
主分类号: G06F40/30 分类号: G06F40/30;G06K9/62;G06N3/04
代理公司: 南京经纬专利商标代理有限公司 32200 代理人: 徐澍
地址: 212003 江苏省*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 coarse2fine 网络 相似 问题 匹配 方法
【权利要求书】:

1.一种基于Coarse2Fine网络的相似问题匹配方法,其特征在于,包括以下步骤:

步骤1:上传数据集至数据库中,运用数据集训练得到对应的Coarse2Fine模型;

步骤2:通过Coarse2Fine模型接口的上传接口上传待处理语句,运用Coarse2Fine模型中的BM25模型将待处理语句与数据库中的语句进行粗粒度的相似度匹配,得到数条匹配语句,将待处理语句、数条匹配语句作为Coarse2Fine模型的ESIM网络的输入;

步骤3:在ESIM网络中提取待处理语句、匹配语句的特征值,将待处理语句的特征值逐一与数条匹配语句的特征值计算差异性值;

步骤4:在ESIM网络中提取出差异性值小的匹配语句,作为相似语句的输出结果。

2.如权利要求1所述的基于Coarse2Fine网络的相似问题匹配方法,其特征在于,所述步骤2中,运用Coarse2Fine模型中的BM25模型将待处理语句与数据库中的语句进行粗粒度的相似度匹配,得到数条匹配语句,具体为:

将待处理语句与数据库中某一语句进行语素分析,再求两个语句之间相关性的得分,得分计算公式如下:

其中,Q表示输入的语句,d表示数据库中的待匹配语句,qi表示问句匹配的基本单位,Wi表示qi的权重;R(qi,d)表示语素qi与d的相关性得分。

最后根据相关性的得分高低,提取出得分高的且满足需求的数条匹配语句。

3.如权利要求1所述的基于Coarse2Fine网络的相似问题匹配方法,其特征在于,所述步骤3中,在ESIM网络中提取待处理语句、匹配语句的特征值具体方法如下:

ESIM网络使用词嵌入和BiLSTM根据上下文重新学习待处理语句、匹配语句的单词表示,得到待处理语句、匹配语句的编码表示,根据注意力权重得到待处理语句、匹配语句的加权编码表示,将编码表示和加权编码表示作为特征值。

4.如权利要求3所述的基于Coarse2Fine网络的相似问题匹配方法,其特征在于,所述步骤3中,ESIM网络使用词嵌入和BiLSTM根据上下文重新学习待处理语句、匹配语句的单词表示,得到待处理语句、匹配语句的编码表示的具体公式如下:

其中,a和b分别表示输入的两个语句,i和j表示句子中某个词语的序号,la和lb表示句子a和b的长度,和则分别为输入语句a和b中某个单词的向量表示。

5.如权利要求3或4所述的基于Coarse2Fine网络的相似问题匹配方法,其特征在于,所述步骤3中,根据注意力权重得到待处理语句、匹配语句的加权编码表示的具体方法为:运用attention机制,计算待处理语句、匹配语句的词向量联系:

其中,表示输入语句a各个词向量的转置和输入语句b中各个词向量之间的乘积;

再根据如下公式计算待处理语句、匹配语句的权重加权后的值,得到待处理语句、匹配语句的加权编码表示的具体公式如下:

其中,和分别表示输入语句a和b中某个词的加权编码表示。

6.如权利要求5所述的基于Coarse2Fine网络的相似问题匹配方法,其特征在于,所述步骤3中,将和分别进行差和点积运算,得到差异性值ma和mb,差异性值计算公式如下:

其中,和分别表示输入语句a和b的编码值和加权编码值。

7.如权利要求1所述的基于Coarse2Fine网络的相似问题匹配方法,其特征在于,所述步骤4具体如下:

通过BiLSTM层获取差异性值的局部推理信息和上下文信息,将获取结果进行最大池化和平均池化,并把池化后的值再次拼接,放到一个新的向量中,将向量输入到多层感知分类器,最后在输出层使用softmax函数得到差异性值小的匹配语句。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏科技大学,未经江苏科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111188461.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top