[发明专利]神经网络中序列长度选择方法、装置、设备及存储介质有效
申请号: | 202110651333.0 | 申请日: | 2021-06-11 |
公开(公告)号: | CN113112007B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 任杰 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 深圳市世联合知识产权代理有限公司 44385 | 代理人: | 汪琳琳 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 序列 长度 选择 方法 装置 设备 存储 介质 | ||
本申请实施例属于语言模型训练领域,涉及一种神经网络中序列长度选择方法,包括获取样本文章;基于指定的任意序列长度的序列参数,通过时序模型对所述样本文章中段落进行段落切分预测,得到样本字词预测结果;根据所述样本文章中的段落文本和所述样本字词预测结果,计算所述时序模型的预测概率值;计算序列参数在序列样本集合中的出现概率值;基于所述预测概率值和所述出现概率值,通过梯度下降法选择所述序列参数的序列长度,输出序列长度选择结果。本申请还提供一种神经网络中序列长度选择装置、计算机设备及存储介质。此外,本申请还涉及区块链技术。采用本方法大大提高了模型预测准确性和鲁棒性。
技术领域
本申请涉及语言模型训练领域,特别是涉及一种神经网络中序列长度选择方法、装置、计算机设备和存储介质。
背景技术
数字化运营管理是现代商业运营的重要组成部分,对于几乎所有运营业务而言,持续观测运营的效果非常重要。而数据观测领域基于时间序列的观测又被广泛的应用。随着新的AI和深度学习技术的发展,递归神经网络,比如LSTM(RNN)就成了时序模型的重要代表。
在时序模型的调参中,序列长度sequence是一个很重要的参数,这个参数极大程度影响到模型的准确率和鲁棒性。另一方面,目前又很少有方式或者模型来提示怎么进行这个重要参数的选择。
发明内容
基于此,针对上述技术问题,本申请提供一种神经网络中序列长度选择方法、装置、计算机设备及存储介质,以解决现有技术中时序模型,特别是LSTM模型中的序列参数的序列长度无法确定,导致的时序模型的准确率下降的技术问题。
一种神经网络中序列长度选择方法,所述方法包括:
获取样本文章;
基于指定的任意序列长度的序列参数,通过时序模型对所述样本文章中段落进行段落切分预测,得到样本字词预测结果;
根据所述样本文章中的段落文本和所述样本字词预测结果,计算所述时序模型的预测概率值;
计算所述序列参数在序列样本集合中的出现概率值;
基于所述预测概率值和所述出现概率值,通过梯度下降法选择所述序列参数的序列长度,输出序列长度选择结果。
一种神经网络中序列长度选择装置,所述装置包括:
数据获取模块,用于获取样本文章;
字词预测模块,用于基于指定的任意序列长度的序列参数,通过时序模型对所述样本文章中段落进行段落切分预测,得到样本字词预测结果;
第一概率计算模块,用于根据所述样本文章中的段落文本和所述样本字词预测结果,计算所述时序模型的预测概率值;
第二概率计算模块,用于计算所述序列参数在序列样本集合中的出现概率值;
序列选择模块,用于基于所述预测概率值和所述出现概率值,通过梯度下降法选择所述序列参数的序列长度,输出序列长度选择结果。
一种计算机设备,包括存储器和处理器,以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现上述神经网络中序列长度选择方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现上述神经网络中序列长度选择方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110651333.0/2.html,转载请声明来源钻瓜专利网。