[发明专利]基于Bi-LSTM算法的检测咨询语句重复性评价方法及系统有效

专利信息
申请号: 202110383167.0 申请日: 2021-04-09
公开(公告)号: CN113011193B 公开(公告)日: 2021-11-23
发明(设计)人: 黄伟波;刘江辉;谢柏儒 申请(专利权)人: 广东外语外贸大学
主分类号: G06F40/30 分类号: G06F40/30;G06F40/216;G06N3/04;G06N3/08
代理公司: 广州帮专高智知识产权代理事务所(特殊普通合伙) 44674 代理人: 陆茵
地址: 510006 *** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 bi lstm 算法 检测 咨询 语句 重复性 评价 方法 系统
【权利要求书】:

1.一种基于Bi-LSTM算法的检测咨询语句重复性评价方法,其特征在于,包括如下步骤:

步骤S1:输入咨询语句到神经网络中;其中,设定咨询语句包括W1和W2,记为:S(W1,W2),其中,

当S(W1,W2)→1时,表示两个咨询语句的语义相似或相同,即此组语句存在重复值;

当S(W1,W2)→0时,表示两个咨询语句的语义不相同,即此组语句不存在重复值;

步骤S2:使用DM模型将所输入的咨询语句转化为对应的词向量表示,使用Embedding的方式将离散的词向量转化为连续的一维句向量;

步骤S3:在编码层中将所生成的句向量输入到Bi-LSTM模型的神经网络中;

步骤S4:使用互注意力机制将Bi-LSTM模型的输出结果生成对应的互注意力表示;

步骤S5:通过距离加权函数来测算出特征向量之间的相似程度;

步骤S6:通过多层感知网络进行分类筛选,从而判断问题语句存在重复值或者不存在重复值。

2.根据权利要求1所述的评价方法,其特征在于,步骤S1进一步包括不同的咨询语句分别输入到神经网络的子网络中。

3.根据权利要求2所述的评价方法,其特征在于,步骤S2还包括对DM模型进行训练,训练步骤包括:

DM模型生成一个与词向量拥有相同维数的语句识别向量;

将所有的咨询语句的向量和词向量进行累加处理,得到对应的语句向量;

将对应的语句向量传递到下一层的编码层中。

4.根据权利要求3所述的评价方法,其特征在于,步骤S3包括

步骤S31:使用神经网络算法进行计算生成的句向量;

步骤S32:使用LSTM模型从后向以及前向每个时间步的隐藏层状态进行连接操作,并且通过连接函数计算出Bi-LSTM所输出的每个句向量。

5.根据权利要求4所述的评价方法,其特征在于,所述步骤S4包括:

步骤S41:使用互注意力机制对Bi-LSTM模型进行优化,构造语义的相似度矩阵;

步骤S42:对相似度矩阵的行和列进行最大池化来对池化层进行特征提取,从而得到对应语句的互注意力表示。

6.根据权利要求1所述的评价方法,其特征在于,所述DM模型可通过GloVe模型或者Word2Vec模型替换。

7.根据权利要求1所述的评价方法,其特征在于,所述距离加权函数为欧氏距离加权函数或者马氏距离加权函数或者明氏距离加权函数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东外语外贸大学,未经广东外语外贸大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110383167.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top