[发明专利]基于神经网络混合模型的法律条文检索方法及相关设备有效
申请号: | 201910991657.1 | 申请日: | 2019-10-18 |
公开(公告)号: | CN110928987B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 于修铭;雷骏峰;刘嘉伟;陈晨;李可;汪伟 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/126;G06N3/0464;G06N3/044 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 谢文强 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神经网络 混合 模型 法律条文 检索 方法 相关 设备 | ||
1.一种基于神经网络混合模型的法律条文检索方法,其特征在于,包括以下步骤:
获取输入文本,对所述输入文本进行向量化,获得第一文本向量及第二文本向量;
对所述第一文本向量及所述第二文本向量进行堆栈嵌入,获得第一循环向量及第二循环向量;
将所述第一循环向量与所述第二循环向量进行拼接,获得混合向量,并对所述混合向量进行堆栈嵌入,获得混合堆栈向量;
对所述混合堆栈向量进行归一化处理,获得文本检索结果
所述获取输入文本,对所述输入文本进行向量化,获得第一文本向量及第二文本向量,包括:
获取输入文本,将所述输入文本设置为第一文本;
对所述第一文本进行实体链接,获得所述第一文本中的要素,将所述要素拼接成上下文,将所述上下文设置为第二文本;
分别对所述第一文本和所述第二文本进行向量化,获得第一文本向量及第二文本向量;
所述对所述第一文本向量及所述第二文本向量进行堆栈嵌入,获得第一循环向量及第二循环向量,包括:
将所述第一文本向量与所述第一文本向量的位置信息相加,获得第一位置向量,将所述第二文本向量与所述第二文本向量的位置信息相加,获得第二位置向量;
分别将所述第一位置向量与所述第二位置向量输入神经网络模型进行归一化处理,获得第一归一化隐向量及第二归一化隐向量;
对所述第一归一化隐向量及所述第二归一化隐向量进行特征提取,获得第一特征向量及第二特征向量;
将所述第一特征向量及所述第二特征向量输入神经网络模型进行归一化处理,获得第一归一化向量及第二归一化向量,将所述第一归一化向量及所述第二归一化向量输入自注意力神经网络模型进行处理,获得第一编码块向量及第二编码块向量,对所述第一编码块向量及所述第二编码块向量进行循环处理,获得第一循环向量及第二循环向量;
所述对所述混合堆栈向量进行归一化处理,获得文本检索结果,包括:
预设法律条文概率阈值;
将所述混合堆栈向量输入卷积神经网络的全连接层进行线性处理,获得待分类向量,并对所述待分类向量进行归一化处理,获得每一条法律条文对应的概率;
将所述每一条法律条文对应的概率与所述预设法律条文概率阈值进行比较,将所有大于所述法律条文概率阈值的法律条文进行输出。
2.如权利要求1所述的基于神经网络混合模型的法律条文检索方法,其特征在于,所述分别对所述第一文本和所述第二文本进行向量化,获得第一文本向量及第二文本向量,包括:
对所述第一文本和所述第二文本进行字分割,获得第一文本和第二文本中的每个字;
预设向量的维度,根据所述向量的维度分别对所述第一文本的每个字和所述第二文本的每个字进行向量化,获得第一文本向量和第二文本向量。
3.如权利要求1所述的基于神经网络混合模型的法律条文检索方法,其特征在于,所述对所述第一归一化隐向量及所述第二归一化隐向量进行特征提取,获得第一特征向量及第二特征向量,包括:
将所述第一归一化隐向量及所述第二归一化隐向量输入神经网络模型进行特征提取,将所述特征提取后的向量分别与所述第一位置向量及所述第二位置向量相加,获得第一特征隐向量及第二特征隐向量;
预设第一循环次数,将所述第一特征隐向量及所述第二特征隐向量输入神经网络模型进行归一化,将归一化后获得的向量输入神经网络模型进行特征提取,将特征提取后的向量分别与所述第一位置向量及所述第二位置向量相加,并根据预设的第一循环次数重复执行本步骤,获得第一特征向量及第二特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910991657.1/1.html,转载请声明来源钻瓜专利网。