[发明专利]一种商品图像视觉质量的自动分级方法有效
申请号: | 201210246598.3 | 申请日: | 2012-07-17 |
公开(公告)号: | CN102799669A | 公开(公告)日: | 2012-11-28 |
发明(设计)人: | 王海洋;黄琦;林建聪;王丰年;孙凯 | 申请(专利权)人: | 杭州淘淘搜科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 周烽 |
地址: | 310012 浙江省杭州市文二*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于商品的图像视觉质量自动分级方法。该方法首先将一批量图片作为训练样本,定义质量等级,人工标定每张图片的质量等级。提取训练图片的特征,包括颜色直方图、颜色和谐度、图片规则度,然后通过训练方式得到特征向量权值,建立图像质量自动分级SVM训练模型,提取待分级图片模糊因子、噪声比和对比度,检测文字在商品图片的数量以及位置,预先分级低质量图片;然后提取待分级图片训练特征并训练得到特征向量权值;最后计算待分级图片质量级别;本发明会在用户通过图像技术搜索得到的商品图中优先展示用户满意度高即高质量的图片。 | ||
搜索关键词: | 一种 商品 图像 视觉 质量 自动 分级 方法 | ||
【主权项】:
1.一种商品图像视觉质量的自动分级方法,其特征在于,包括以下步骤:(1)将一批量图片作为训练样本,定义质量等级(非常好、好、一般、差、极差),人工标定每张图片的质量等级;提取颜色直方图、颜色简洁度、颜色和谐度以及图片规则度作为训练样本的训练特征;(2)训练步骤1中提取的特征,得到上述特征向量的特征权值;(3)建立图像质量自动分级SVM模型;(4)图像质量预分级,具体步骤如下:(4.1)提取模糊度:模糊因子提取主要分为两步:提取边缘以及计算模糊因子;首先得到水平方向和竖直方向的边缘图;其次求得模糊因子图BR(x,y)以及反模糊因子,公式如下:BR h ( x , y ) = | f ( x , y ) - 1 2 A h ( x , y ) | 1 2 A h ( x , y ) ; ]]>BR v ( x , y ) = | f ( x , y ) - 1 2 A v ( x , y ) | 1 2 A v ( x , y ) ; ]]> 式中,Ah(x,y)、Av(x,y)分别为水平方向和竖直方向的边缘图,f(x,y)为原图;BRh(x,y)、BRV(x,y)分别表示水平方向和竖直方向的模糊因子,而反模糊因子则为BRh(x,y)和BRV(x,y)最大值;最后计算模糊均值和模糊比率;计算公式如下:Blur mean = Sum blur Blur cnt ]]>Blur ratio = Blur cnt Edge cnt ; ]]> 式中,Sumblur为反模糊因子的值和,Blurcnt为满足反模糊因子小于模糊度T的像素的个数和;Edgecnt为水平和竖直方向边缘像素的个数,Blurmean表示模糊均值,Blurrato表示模糊比率;(4.2)提取噪音比:噪音是影响图片质量的重要因子,具体步骤如下:首先对原图进行中值滤波,并求得滤波后水平方向以及竖直方向的边缘图;其次求得噪音图Ncnd(x,y),计算公式如下:
式中,Dh(x,y)、Dv(x,y)分别是水平方向和竖直方向的边缘图,Dh-mean、Dv-nean分别为水平方向和竖直方向上的阈值,Ncand(x,y)、Ncand分别表示噪音值和噪音图;最后计算噪音均值以及噪音比,计算公式如下:Nosie mean = Sum noise Nosie cnt ]]>Nosie ratio = Noise cnt M * N ]]> 式中,Sumnoise、Noisecnt分别为噪音图的像素值值的和以及噪音图非零值像素个数,Noisemean、Noisecnt分别表示噪音均值和噪音比,M、N为噪音图的长和宽;进行模糊度和噪音比的融合:进行模糊度和噪音比的融合公式如下:Metric=1-(w1Blurmean+w2Blurratio+w3Noisemean+w4Noiseratio);式中,Metric表示融合后特征值,Blurmean表示模糊均值,Blurrato表示模糊比率,,Noisemean表示噪音均值,Noisecnt表示噪音比;(4.3)提取weber对比度以及颜色对比度:其中,weber对比度公式如下:f wc = 1 M × N Σ x = 0 m Σ y = 0 n I ( x , y ) - I avg I avg ; ]]> 式中,fwc表示weber对比度,m、n为图像的长和宽,Iavg为图像的均值,I(x,y)表示在点(x,y)的像素值;颜色对比度公式如下:fcc=(‖MR||/‖R||)/(‖MI‖|/‖I‖);式中,fcc表示颜色对比度,R为主体商品区域,I为原图,MR、MI表示商品主体区域和原图区域像素值变化聚类像素的个数;(4.4)文字特征提取步骤如下:(4.4.1)离线学习训练图像中红色文字logo区域像素点值,根据公式计算色度的均值M和协方差C;(4.4.2)对于输入的每个像素,计算与离线训练模型的距离,检测输入相似是否为红色文字区域;(4.4.3)阈值分割得到二值掩码图像,提取各个连通区域;(4.4.4)对各个连通区域根据ORC算法精确定位是否属于文字logo区域,并识别文字在图像中的位置以及个数;(4.5)提取待分级图片特征,特征为步骤1中所述特征;(4.6)根据步骤2中计算得到的特征向量权值,对步骤5提取的特征进行多特征融合;(4.7)对步骤6得到的融合特征作为输入参数送入步骤3中所建立的SVM模型,得到待分级图片质量级别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州淘淘搜科技有限公司,未经杭州淘淘搜科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210246598.3/,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序