[发明专利]特征上下文感知的池化方法、装置、计算机设备和介质在审
申请号: | 202310260101.1 | 申请日: | 2023-03-07 |
公开(公告)号: | CN116108895A | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 舒畅;陈又新 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06N3/0464 | 分类号: | G06N3/0464;G06V10/82;G06F17/16;G06N3/08 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉;曹勇 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征 上下文 感知 方法 装置 计算机 设备 介质 | ||
本发明涉及深度学习领域,应用于可处理金融票据图像、医学影像等的神经网络模型。本发明公开了一种特征上下文感知的池化方法,应用于神经网络模型,包括:获得所述神经网络模型中的卷积层计算得出的特征向量矩阵;将所述特征向量矩阵进行第一池化计算得到第一池化值,同时对所述特征向量矩阵进行第二池化计算得到第二池化值;对所述第一池化值和所述第二池化值分别进行加权计算,得到第一加权池化值和第二加权池化值;将所述第一加权池化值和所述第二加权池化值进行拼接,得到池化后的特征向量矩阵。
技术领域
本发明涉及到机器学习领域,具体而言,涉及到一种特征上下文感知的池化方法、装置、计算机设备和介质。
背景技术
神经网络模型(Convolutional Neural Network,CNN)是一种前馈神经网络,擅长处理图像特别是大图像的相关机器学习问题。具体地,神经网络模型可以应用于金融票据图像、医学影像等的处理。神经网络模型包含了一个由卷积层(Convolutional Layer)和池化层(Pooling Layer)构成的特征抽取器,其中,卷积层用于对输入的图像进行特征提取,得到特征图序列;池化层则用于对卷积层输出的每一帧特征图进行降维处理。
理论上来说,网络可以在不对原始输入图像执行降采样的操作,通过堆叠多个的卷积层来构建深度神经网络,如此一来便可以在保留更多空间细节信息的同时提取到更具有判别力的抽象特征。然而,考虑到计算机的算力瓶颈,通常都会引入池化层,来进一步地降低网络整体的计算代价,这是引入池化层最根本的目的。
现在常用的几种池化方法有最大池化方法、平均池化方法、全局池化方法等,这些方法在神经网络模型训练过程中,需要手动设置池化过程,在不停地变换和尝试之后才能获得最优的结果。
发明内容
本发明的主要目的为提供一种特征上下文感知的池化方法、装置、计算机设备和介质,旨在解决需要手动设置池化过程的技术问题。
本发明公开了以下技术方案:
一种特征上下文感知的池化方法,包括:
获得预设神经网络模型中的卷积层计算得出的特征向量矩阵;
将所述特征向量矩阵进行第一池化计算得到第一池化值,同时对所述特征向量矩阵进行第二池化计算得到第二池化值;
对所述第一池化值和所述第二池化值分别进行加权计算,得到第一加权池化值和第二加权池化值;
将所述第一加权池化值和所述第二加权池化值进行拼接,得到池化后的特征向量矩阵。
进一步地,所述将所述特征向量矩阵进行第一池化计算得到第一池化值的步骤,包括:
将所述特征向量矩阵的每一列数据按照从大到小的顺序进行排序,得到排序后的特征向量矩阵;
将排序后的所述特征向量矩阵输入所述预设神经网络模型的全连接层,得到排序后的所述特征向量矩阵的每一列数据的权重值;
将排序后的所述特征向量矩阵的每一列数据与其对应的权重值相乘,得到加权后的特征向量矩阵;
将加权后的所述特征向量矩阵的每一列数据进行相加,得到第一池化值。
进一步地,所述对所述特征向量矩阵进行第二池化计算得到第二池化值的步骤,包括:
基于softmax函数计算所述特征向量矩阵中每个特征向量的得分;
将所述特征向量矩阵中每个特征向量与对应的所述得分相乘,得到乘法计算后的特征向量矩阵;
将乘法计算后的所述特征向量矩阵的每一列数据进行相加,得到第二池化值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310260101.1/2.html,转载请声明来源钻瓜专利网。