[发明专利]一种互联网图片场景分类方法及其系统在审

申请号：	201611265192.4	申请日：	2016-12-30
公开（公告）号：	CN108268882A	公开（公告）日：	2018-07-10
发明（设计）人：	王康;李峰岳;李倩玉;王明良;汤鲲	申请（专利权）人：	南京烽火软件科技有限公司
主分类号：	G06K9/62	分类号：	G06K9/62;G06K9/46;G06N3/04;G06N3/08
代理公司：	常州佰业腾飞专利代理事务所(普通合伙) 32231	代理人：	王玉平
地址：	210000 江苏省***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	场景分类互联网预处理深度感知图片互联网信息处理互联网数据标签类别快速检索特征输入特征提取图片信息图像场景分类器场景挖掘
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明属于互联网信息处理技术领域，公开了一种互联网图片场景分类方法及其系统，包括：S101、对输入的海量互联网图片进行预处理；S102、对经过预处理后的互联网图片进行图像场景的深度感知特征提取；S103、将提取后的深度感知特征输入分类器，用于判别最终场景类别；本发明提供的技术方案能够做到真正意义上的互联网数据场景分类，从而利用图片标签类别对图片进行快速检索，实现海量互联网图片信息价值的充分挖掘。

技术领域

本发明属于互联网信息处理技术领域，具体涉及一种互联网图片场景分类方法及其系统。

背景技术

在互联网社会，网络上存在大量的多媒体数据，其中图片数据占据着极大的比重，图片作为一种信息载体，蕴含了大量有价值的信息，如何去充分挖掘图片的价值，成了当前研究的热点。图像场景分类立足于快速的对图像场景信息的描述，例如对车辆、行人、包、鞋子、建筑等不同图像场景信息的描述，目前市面上还没有对互联网图片数据进行充分类别描述的相关产品。

目前的现有产品都只能分辨有限类的场景类别，具体存在如下问题：类别描述不充分，对图像场景的理解局限于对图像颜色、纹理等浅层的特征，无法感知图像的场景内容信息，并且对于多个类别的描述，效率非常低下。传统方法在对多类别场景进行分类描述时需要多个分类器的级联，每增加一个场景类别分类所用的时间都需要增加，且采用传统方法进行场景分类时提取的是图像的纹理、颜色等信息，没有高级语义特征，在复杂场景下分类效果不理想。

发明内容

本发明克服现有技术存在的不足，所要解决的技术问题为：提供一种能够充分感知互联网图像数据的场景类别信息，进而为互联网上海量图片的信息挖掘与快速检索提供便捷的互联网图片场景分类方法及其系统。

本发明提供的互联网图片场景分类方法包括：

S101、对输入的海量互联网图片进行预处理；

S102、对经过预处理后的互联网图片进行图像场景的深度感知特征提取；

S103、将提取后的深度感知特征输入分类器，用于判别最终场景类别。

进一步地，所述对输入的海量互联网图片进行预处理包括以下步骤：

首先对输入的海量互联网图片进行MD5特征去重，去除重复照片；

然后对经去重后的互联网图片进行解码，筛除解码失败的图片，对解码成功的图片进行归一化处理。

进一步的，所述对经过预处理的互联网图片进行图像场景的深度感知特征提取包括以下步骤：

S1021、将经过预处理后的互联网图片输入第一层卷积层进行处理；

S1022、将经过第一层卷积层处理后的互联网图片输入第二层卷积层进行处理；