[发明专利]识别模型的优化方法和装置在审

申请号：	201910270038.3	申请日：	2019-04-04
公开（公告）号：	CN110135409A	公开（公告）日：	2019-08-16
发明（设计）人：	许洋;刘鹏;王健宗	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	G06K9/20	分类号：	G06K9/20;G06K9/32
代理公司：	深圳市立智方成知识产权代理事务所(普通合伙) 44468	代理人：	王增鑫
地址：	518000 广东省深圳市福田区福***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	字段标注信息方法和装置图片标注优化训练数据集定期接收图片发送图片添加图像处理训练数据训练样本可信度返回更新保证
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及图像处理的技术领域，本发明提供一种识别模型的优化方法和装置，所述方法包括获取识别模型在生产中待识别的第一字段图片；将所述第一字段图片发送至众包平台进行标注，得到对应的标注信息；其中，所述众包平台的用户对所述第一字段图片进行识别标注；定期接收所述众包平台返回的第一字段图片的标注信息，根据所述第一字段图片的标注信息，获取训练字段图片；将所述训练字段图片添加至所述识别模型的训练数据集中，并利用所述训练数据集对所述识别模型进行优化。本发明避免了不能在短时间内不能获取可信度高的训练字段图片的问题，保证及时对所述识别模型的训练样本进行更新，提升了所述识别模型的识别能力。

技术领域

本发明涉及图像处理的技术领域，具体而言，本发明涉及一种识别模型的优化方法和装置。

背景技术

随着智能识别发展的趋势，文字智能识别已经运用至各领域中。目前，文字识别技术主要是通过训练字段识别模型，然后再对目标字段进行识别。但是，生成字段识别模型常常受限于业务方提供的数据，且难以在短时间内完成对字段识别模型进行优化，不利于提高识别模型的识别度。

发明内容

为克服以上技术问题，特别是现有技术中识别模型常常受限于业务方提供的数据的问题，特提出以下技术方案：

第一方面，本发明提供一种识别模型的优化方法，包括以下步骤：

获取识别模型在生产中待识别的第一字段图片；

将所述第一字段图片发送至众包平台进行标注，得到对应的标注信息；其中，所述众包平台的用户对所述第一字段图片进行识别标注；

定期接收所述众包平台返回的第一字段图片的标注信息，根据所述第一字段图片的标注信息，获取训练字段图片；

将所述训练字段图片添加至所述识别模型的训练数据集中，并利用所述训练数据集对所述识别模型进行优化。

在其中一个实施例中，所述标注信息包括所述第一字段图片的标注编码和众包平台对带有标注编码的第一字段图片的第一识别结果；