[发明专利]生成图神经网络模型的方法、装置、设备及存储介质在审
申请号: | 202210166630.0 | 申请日: | 2022-02-23 |
公开(公告)号: | CN114418124A | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 田洪宝;付靖玲;裴积全 | 申请(专利权)人: | 京东科技信息技术有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/04;G06N3/08;G06V20/62 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100176 北京市大兴区经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 神经网络 模型 方法 装置 设备 存储 介质 | ||
本申请公开了一种生成图神经网络模型的方法、装置、设备及存储介质,涉及人工智能技术领域。该方法的一具体实施方式包括:获取样本凭证文件的图数据,其中,图数据包括:节点和边,各个节点为样本凭证文件中目标检测框的目标样本特征,边为目标检测框与其他检测框之间的位置关系特征;利用目标样本特征和位置关系特征与对应的字段类别标签,对机器学习模型进行训练,得到图神经网络模型。
技术领域
本申请涉及计算机技术领域,具体涉及人工智能技术领域,尤其涉及生成图神经网络模型的方法、装置、设备及存储介质。
背景技术
在日常应用中,总会有大量的凭证文件需要由专职人员进行处理、审批和管理;目前,通过文字识别算法只能得出凭证文件中每个位置的文字内容,无法确定每个文字内容具体属于哪个字段。
现有技术中,通过文字识别算法识别出凭证文件中的内容,再根据内容的位置、正则表达式等方法提取出每个字段的具体内容。但,基于位置、正则匹配等方法,难以适应新的版面变化,鲁棒性差。因此,面对复杂版式的变化,很难兼容各类版式,精度也比较低。
发明内容
本申请的实施例提出了生成图神经网络模型的方法、装置、设备及存储介质。
第一方面,本申请的实施例提供了一种生成图神经网络模型的方法,该方法包括:获取样本凭证文件的图数据,其中,图数据包括:节点和边,各个节点为样本凭证文件中目标检测框的目标样本特征,边为目标检测框与其他检测框之间的位置关系特征;利用目标样本特征和位置关系特征与对应的字段类别标签,对机器学习模型进行训练,得到图神经网络模型。
在一些实施例中,位置关系特征基于以下步骤确定:将样本凭证文件输入预设的文本行检测网络中,得到目标检测框的坐标信息和其他检测框的坐标信息;根据目标检测框的坐标信息和其他检测框的坐标信息,生成为目标向量;将目标向量作为位置关系特征。
在一些实施例中,根据目标检测框的坐标信息和其他检测框的坐标信息,生成为目标向量,包括:根据目标检测框的坐标信息和其他检测框的坐标信息,确定目标检测框与其他检测框之间的距离信息;将以下至少一项进行归一化处理,得到目标向量:目标检测框的坐标信息、其他检测框的坐标信息、距离信息、目标检测框的坐标信息之间的比值、其他检测框的坐标信息之间的比值。
在一些实施例中,在一些实施例中,目标检测框的类型为图像;目标样本特征基于以下步骤确定:获取目标检测框的视觉样本特征和文本样本特征;根据视觉样本特征和文本样本特征,生成目标样本特征。
在一些实施例中,获取目标检测框的视觉样本特征和文本样本特征,包括:将样本凭证文件中的目标检测框输入预设的视觉特征提取网络中,得到视觉样本特征;以及将样本凭证文件中的目标检测框内的文本输入预设的文本特征提取网络中,得到文本样本特征。
在一些实施例中,根据视觉样本特征和文本样本特征,生成目标样本特征,包括:利用克罗内克积将视觉样本特征和文本样本特征进行融合,得到目标样本特征。
第二方面,本申请的实施例提供了一种文本识别方法,该方法包括:获取待预测凭证文件中第一检测框的坐标信息和第一检测框内的目标文本信息;将坐标信息和目标文本信息输入如第一方面描述的方法生成的图神经网络模型中,得到第一检测框的字段类别,其中,第一检测框的字段类别用于表征第一检测框内目标文本信息所属的类别。
在一些实施例中,获取待预测凭证文件中第一检测框的坐标信息和第一检测框内的目标文本信息,包括:将待预测凭证文件输入预设的文本行检测网络中,得到待预测凭证文件中第一检测框的坐标信息;利用预设的文本识别网络,对第一检测框进行识别,得到第一检测框内的目标文本信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东科技信息技术有限公司,未经京东科技信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210166630.0/2.html,转载请声明来源钻瓜专利网。