[发明专利]基于Coarse2Fine网络的相似问题匹配方法在审
申请号: | 202111188461.2 | 申请日: | 2021-10-12 |
公开(公告)号: | CN113988081A | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 王东升;赵翠平;王奇;李佳伟;路曼;钟家国 | 申请(专利权)人: | 江苏科技大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06K9/62;G06N3/04 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 徐澍 |
地址: | 212003 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 coarse2fine 网络 相似 问题 匹配 方法 | ||
1.一种基于Coarse2Fine网络的相似问题匹配方法,其特征在于,包括以下步骤:
步骤1:上传数据集至数据库中,运用数据集训练得到对应的Coarse2Fine模型;
步骤2:通过Coarse2Fine模型接口的上传接口上传待处理语句,运用Coarse2Fine模型中的BM25模型将待处理语句与数据库中的语句进行粗粒度的相似度匹配,得到数条匹配语句,将待处理语句、数条匹配语句作为Coarse2Fine模型的ESIM网络的输入;
步骤3:在ESIM网络中提取待处理语句、匹配语句的特征值,将待处理语句的特征值逐一与数条匹配语句的特征值计算差异性值;
步骤4:在ESIM网络中提取出差异性值小的匹配语句,作为相似语句的输出结果。
2.如权利要求1所述的基于Coarse2Fine网络的相似问题匹配方法,其特征在于,所述步骤2中,运用Coarse2Fine模型中的BM25模型将待处理语句与数据库中的语句进行粗粒度的相似度匹配,得到数条匹配语句,具体为:
将待处理语句与数据库中某一语句进行语素分析,再求两个语句之间相关性的得分,得分计算公式如下:
其中,Q表示输入的语句,d表示数据库中的待匹配语句,qi表示问句匹配的基本单位,Wi表示qi的权重;R(qi,d)表示语素qi与d的相关性得分。
最后根据相关性的得分高低,提取出得分高的且满足需求的数条匹配语句。
3.如权利要求1所述的基于Coarse2Fine网络的相似问题匹配方法,其特征在于,所述步骤3中,在ESIM网络中提取待处理语句、匹配语句的特征值具体方法如下:
ESIM网络使用词嵌入和BiLSTM根据上下文重新学习待处理语句、匹配语句的单词表示,得到待处理语句、匹配语句的编码表示,根据注意力权重得到待处理语句、匹配语句的加权编码表示,将编码表示和加权编码表示作为特征值。
4.如权利要求3所述的基于Coarse2Fine网络的相似问题匹配方法,其特征在于,所述步骤3中,ESIM网络使用词嵌入和BiLSTM根据上下文重新学习待处理语句、匹配语句的单词表示,得到待处理语句、匹配语句的编码表示的具体公式如下:
其中,a和b分别表示输入的两个语句,i和j表示句子中某个词语的序号,la和lb表示句子a和b的长度,和则分别为输入语句a和b中某个单词的向量表示。
5.如权利要求3或4所述的基于Coarse2Fine网络的相似问题匹配方法,其特征在于,所述步骤3中,根据注意力权重得到待处理语句、匹配语句的加权编码表示的具体方法为:运用attention机制,计算待处理语句、匹配语句的词向量联系:
其中,表示输入语句a各个词向量的转置和输入语句b中各个词向量之间的乘积;
再根据如下公式计算待处理语句、匹配语句的权重加权后的值,得到待处理语句、匹配语句的加权编码表示的具体公式如下:
其中,和分别表示输入语句a和b中某个词的加权编码表示。
6.如权利要求5所述的基于Coarse2Fine网络的相似问题匹配方法,其特征在于,所述步骤3中,将和分别进行差和点积运算,得到差异性值ma和mb,差异性值计算公式如下:
其中,和分别表示输入语句a和b的编码值和加权编码值。
7.如权利要求1所述的基于Coarse2Fine网络的相似问题匹配方法,其特征在于,所述步骤4具体如下:
通过BiLSTM层获取差异性值的局部推理信息和上下文信息,将获取结果进行最大池化和平均池化,并把池化后的值再次拼接,放到一个新的向量中,将向量输入到多层感知分类器,最后在输出层使用softmax函数得到差异性值小的匹配语句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏科技大学,未经江苏科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111188461.2/1.html,转载请声明来源钻瓜专利网。