[发明专利]一种互联网图片场景分类方法及其系统在审
申请号: | 201611265192.4 | 申请日: | 2016-12-30 |
公开(公告)号: | CN108268882A | 公开(公告)日: | 2018-07-10 |
发明(设计)人: | 王康;李峰岳;李倩玉;王明良;汤鲲 | 申请(专利权)人: | 南京烽火软件科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 常州佰业腾飞专利代理事务所(普通合伙) 32231 | 代理人: | 王玉平 |
地址: | 210000 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 场景分类 互联网 预处理 深度感知 图片 互联网信息处理 互联网数据 标签类别 快速检索 特征输入 特征提取 图片信息 图像场景 分类器 场景 挖掘 | ||
本发明属于互联网信息处理技术领域,公开了一种互联网图片场景分类方法及其系统,包括:S101、对输入的海量互联网图片进行预处理;S102、对经过预处理后的互联网图片进行图像场景的深度感知特征提取;S103、将提取后的深度感知特征输入分类器,用于判别最终场景类别;本发明提供的技术方案能够做到真正意义上的互联网数据场景分类,从而利用图片标签类别对图片进行快速检索,实现海量互联网图片信息价值的充分挖掘。
技术领域
本发明属于互联网信息处理技术领域,具体涉及一种互联网图片场景分类方法及其系统。
背景技术
在互联网社会,网络上存在大量的多媒体数据,其中图片数据占据着极大的比重,图片作为一种信息载体,蕴含了大量有价值的信息,如何去充分挖掘图片的价值,成了当前研究的热点。图像场景分类立足于快速的对图像场景信息的描述,例如对车辆、行人、包、鞋子、建筑等不同图像场景信息的描述,目前市面上还没有对互联网图片数据进行充分类别描述的相关产品。
目前的现有产品都只能分辨有限类的场景类别,具体存在如下问题:类别描述不充分,对图像场景的理解局限于对图像颜色、纹理等浅层的特征,无法感知图像的场景内容信息,并且对于多个类别的描述,效率非常低下。传统方法在对多类别场景进行分类描述时需要多个分类器的级联,每增加一个场景类别分类所用的时间都需要增加,且采用传统方法进行场景分类时提取的是图像的纹理、颜色等信息,没有高级语义特征,在复杂场景下分类效果不理想。
发明内容
本发明克服现有技术存在的不足,所要解决的技术问题为:提供一种能够充分感知互联网图像数据的场景类别信息,进而为互联网上海量图片的信息挖掘与快速检索提供便捷的互联网图片场景分类方法及其系统。
本发明提供的互联网图片场景分类方法包括:
S101、对输入的海量互联网图片进行预处理;
S102、对经过预处理后的互联网图片进行图像场景的深度感知特征提取;
S103、将提取后的深度感知特征输入分类器,用于判别最终场景类别。
进一步地,所述对输入的海量互联网图片进行预处理包括以下步骤:
首先对输入的海量互联网图片进行MD5特征去重,去除重复照片;
然后对经去重后的互联网图片进行解码,筛除解码失败的图片,对解码成功的图片进行归一化处理。
进一步的,所述对经过预处理的互联网图片进行图像场景的深度感知特征提取包括以下步骤:
S1021、将经过预处理后的互联网图片输入第一层卷积层进行处理;
S1022、将经过第一层卷积层处理后的互联网图片输入第二层卷积层进行处理;
S1023、将经过第二层卷积层处理后的互联网图片输入第三层卷积层进行处理;
S1024、将经过第三层卷积层处理后的互联网图片输入第四层卷积层进行处理;
S1025、将经过第四层卷积层处理后的互联网图片输入第五层卷积层进行处理;
S1026、将经过第五层卷积层处理后的互联网图片输入第一层全连接层进行处理;
S1027、将经过第一层全连接层处理后的互联网图片输入第二层全连接层进行处理;
更进一步的,在所述步骤S1011中还包括对经过第一层卷积层卷积处理后的互联网图片进行一次Relu激励以及数据的规则化,然后进行最大值池化处理;
在所述步骤S1022中还包括对经过第二层卷积层卷积处理后的互联网图片进行最大值池化处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京烽火软件科技有限公司,未经南京烽火软件科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611265192.4/2.html,转载请声明来源钻瓜专利网。