[发明专利]神经网络中序列长度选择方法、装置、设备及存储介质有效
申请号: | 202110651333.0 | 申请日: | 2021-06-11 |
公开(公告)号: | CN113112007B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 任杰 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 深圳市世联合知识产权代理有限公司 44385 | 代理人: | 汪琳琳 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 序列 长度 选择 方法 装置 设备 存储 介质 | ||
1.一种神经网络中序列长度选择方法,其特征在于,所述方法包括:
获取样本文章;
基于指定的任意序列长度的序列参数,通过时序模型对所述样本文章中段落进行段落切分预测,得到样本字词预测结果;
根据所述样本文章中的段落文本和所述样本字词预测结果,计算所述时序模型的预测概率值,所述时序模型为LSTM模型;
计算所述序列参数在序列样本集合中的出现概率值,所述出现概率值表示为:
其中,所述表示所述序列样本集合中全部序列对的计数值;所述10表示在不同递归神经网络模型设计下可以选择的可能值的数量;所述n 表示所述序列长度的总数;
基于所述预测概率值和所述出现概率值,通过梯度下降法选择所述序列参数的序列长度,输出序列长度选择结果;
所述基于指定的任意序列长度的序列参数,通过时序模型对所述样本文章中段落进行段落切分预测,得到样本字词预测结果,包括:
将所述样本文章输入到所述LSTM模型中,基于所述序列参数对所述样本文章的段落进行切分,得到文本长度与所述序列长度一致的段落文本;并
对与所述段落文本相邻,且在所述段落文本之后的至少一个字词进行预测,得到样本字词预测结果;
所述基于所述预测概率值和所述出现概率值,通过梯度下降法选择所述序列参数的序列长度,输出序列长度选择结果,包括:
构造损失函数,其中,不脱所述损失函数的损失值满足的关系式包括所述预测概率值与所述出现概率值的乘积的条件;
基于所述预测概率值和所述出现概率值,通过梯度下降法计算损失函数的损失值;
根据所述损失值更新指定的所述序列长度,重复段落切分预测的操作,直到所述损失函数的损失值小于预设值,确定当前序列参数的序列长度,作为所述序列长度选择结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述样本文章中的段落文本和所述样本字词预测结果,计算所述时序模型的预测概率值,包括
对所述样本字词预测结果中的预测字词进行编码处理;并
从相似度算法集中任选至少2种相似度算法,基于选择的各所述相似度算法计算编码处理后的预测字词与所述样本文章中实际字词的文本相似度;
基于权重调整算法调整各所述文本相似度,得到作为预测概率值。
3.根据权利要求2所述的方法,其特征在于,所述从相似度算法集中任选至少2种相似度算法,基于选择的各所述相似度算法计算编码处理后的预测字词与所述样本文章中实际字词的文本相似度,包括:
从所述相似度算法集中随机选择预先相似度和马氏距离算法,计算得到编码处理后的预测字词与所述样本文章中实际字词的文本相似度。
4.根据权利要求3所述的方法,其特征在于,所述构造损失函数,包括:
所述损失函数的损失值所满足的关系式包括所述预测概率值与所述出现概率值的乘积。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110651333.0/1.html,转载请声明来源钻瓜专利网。