[发明专利]基于Bi-LSTM算法的检测咨询语句重复性评价方法及系统有效
申请号: | 202110383167.0 | 申请日: | 2021-04-09 |
公开(公告)号: | CN113011193B | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 黄伟波;刘江辉;谢柏儒 | 申请(专利权)人: | 广东外语外贸大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/216;G06N3/04;G06N3/08 |
代理公司: | 广州帮专高智知识产权代理事务所(特殊普通合伙) 44674 | 代理人: | 陆茵 |
地址: | 510006 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 bi lstm 算法 检测 咨询 语句 重复性 评价 方法 系统 | ||
1.一种基于Bi-LSTM算法的检测咨询语句重复性评价方法,其特征在于,包括如下步骤:
步骤S1:输入咨询语句到神经网络中;其中,设定咨询语句包括W1和W2,记为:S(W1,W2),其中,
当S(W1,W2)→1时,表示两个咨询语句的语义相似或相同,即此组语句存在重复值;
当S(W1,W2)→0时,表示两个咨询语句的语义不相同,即此组语句不存在重复值;
步骤S2:使用DM模型将所输入的咨询语句转化为对应的词向量表示,使用Embedding的方式将离散的词向量转化为连续的一维句向量;
步骤S3:在编码层中将所生成的句向量输入到Bi-LSTM模型的神经网络中;
步骤S4:使用互注意力机制将Bi-LSTM模型的输出结果生成对应的互注意力表示;
步骤S5:通过距离加权函数来测算出特征向量之间的相似程度;
步骤S6:通过多层感知网络进行分类筛选,从而判断问题语句存在重复值或者不存在重复值。
2.根据权利要求1所述的评价方法,其特征在于,步骤S1进一步包括不同的咨询语句分别输入到神经网络的子网络中。
3.根据权利要求2所述的评价方法,其特征在于,步骤S2还包括对DM模型进行训练,训练步骤包括:
DM模型生成一个与词向量拥有相同维数的语句识别向量;
将所有的咨询语句的向量和词向量进行累加处理,得到对应的语句向量;
将对应的语句向量传递到下一层的编码层中。
4.根据权利要求3所述的评价方法,其特征在于,步骤S3包括
步骤S31:使用神经网络算法进行计算生成的句向量;
步骤S32:使用LSTM模型从后向以及前向每个时间步的隐藏层状态进行连接操作,并且通过连接函数计算出Bi-LSTM所输出的每个句向量。
5.根据权利要求4所述的评价方法,其特征在于,所述步骤S4包括:
步骤S41:使用互注意力机制对Bi-LSTM模型进行优化,构造语义的相似度矩阵;
步骤S42:对相似度矩阵的行和列进行最大池化来对池化层进行特征提取,从而得到对应语句的互注意力表示。
6.根据权利要求1所述的评价方法,其特征在于,所述DM模型可通过GloVe模型或者Word2Vec模型替换。
7.根据权利要求1所述的评价方法,其特征在于,所述距离加权函数为欧氏距离加权函数或者马氏距离加权函数或者明氏距离加权函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东外语外贸大学,未经广东外语外贸大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110383167.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多深度相机快速标定与数据融合的方法
- 下一篇:一种汽车紧固件冲压模具