[发明专利]一种快速美食图片识别方法及系统有效
申请号: | 201710481531.0 | 申请日: | 2017-06-22 |
公开(公告)号: | CN107341508B | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 张江琦;董远;白洪亮 | 申请(专利权)人: | 苏州飞搜科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京卓唐知识产权代理有限公司 11541 | 代理人: | 唐海力;韩来兵 |
地址: | 215123 江苏省苏州市苏州工*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 快速 美食 图片 识别 方法 系统 | ||
本发明公开了一种快速美食图片识别方法及系统,其中方法包括如下步骤:采集训练集,将训练集包括美食图片集和非美食图片集两个类别;对美食图片集、非美食图片集分别进行小类划分;构建Inception‑BN网络模型,并利用分类后的美食图片集、非美食图片集对Inception‑BN网络模型进行训练;将待识别图片输入至训练好的Inception‑BN网络模型,计算待识别图片属于美食类图片或非美食类图片的概率,将概率与阈值进行比较,并根据比较结果判断待识别图片所属的类别。本发明大幅提高计算速度,且提高了识别的准确率。
技术领域
本发明涉及图片识别技术领域,具体涉及一种快速美食图片识别方法及系统。
背景技术
现今的图片识别大多由通用的大型卷积神经网络获得,速度都比较慢,并且没有专门针对美食的分类。同时,现有的模型主要的目的为识别大量常见的场景,且训练使用的数据的范围较为广泛。这些方式一般取概率最高的类别作为最终的结果输出,而在面对美食图片时,由于图片内容本身较为复杂,可能包含大量其它场景、物体,并且多种类别的美食很可能出现在同一张图片中,所以取概率最高的类别的方法的准确率不高。另外,由于这些模型的计算量较大,所以速度很慢。
发明内容
本发明的目的是使用卷积神经网络快速、准确地识别出内容是美食的图片。
为了实现上述目的,本发明提供了一种快速美食图片识别方法,包括如下步骤:
采集训练集,将训练集包括美食图片集和非美食图片集两个类别;
对美食图片集、非美食图片集分别进行小类划分;
构建Inception-BN网络模型,并利用分类后的美食图片集、非美食图片集对Inception-BN网络模型进行训练;
将待识别图片输入至训练好的Inception-BN网络模型,计算待识别图片属于美食类图片或非美食类图片的概率,将概率与阈值进行比较,并根据比较结果判断待识别图片所属的类别。
进一步,所述对美食图片集、非美食图片集分别进行分类包括
对美食图片集和非美食图片集进行清洗;
按照美食图片集中相同的美食进行小类划分,非美食图片集中相同的场景进行小类分类,分别得到美食类别、场景类别。
进一步,所述计算待识别图片属于美食类图片或非美食类图片的概率,将概率与阈值进行比较,并根据比较结果判断待识别图片所属的类别包括
计算待识别图片在美食图片中每个小类的概率、以及非美食图片中每个小类的概率;
统计美食图片中所有小类的概率之和S1,非美食图片中所有小类的概率之和S2;
判断S1是否不小于S2,是则确定待识别图片为美食图片,否则为非美食图片。
进一步,所述判断S1是否不小于S2,是则确定待识别图片为美食图片,否则为非美食图片还包括
如果确定待识别图片为美食图片,则标记美食图片的区域,计算该区域占美食图片的比例,将该比例与区域阈值比较,若比例不小于区域阈值,则确定待识别图片美食图片。
进一步,所述Inception-BN网络模型依次包括第一卷积层、第一池化层、第二卷积层、第二池化层、第一inception结构和第二inception结构,其中,第一inception结构包括多个卷积核和至少一个池化层,第二inception结构包括多个卷积核。
本发明还提供了一种快速美食图片识别系统,包括
一种快速美食图片识别系统,其特征在于,包括
采集模块,用于采集训练集,将训练集包括美食图片集和非美食图片集两个类别;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州飞搜科技有限公司,未经苏州飞搜科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710481531.0/2.html,转载请声明来源钻瓜专利网。