[发明专利]基于概率密度分布字典和马尔可夫转移特征的图像分类方法有效
申请号: | 202010542010.3 | 申请日: | 2020-06-15 |
公开(公告)号: | CN111783848B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 宋传鸣;葛明博;刘丹;王相海 | 申请(专利权)人: | 辽宁师范大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/84 |
代理公司: | 大连非凡专利事务所 21220 | 代理人: | 闪红霞 |
地址: | 116000 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 概率 密度 分布 字典 马尔可夫 转移 特征 图像 分类 方法 | ||
本发明公开一种基于概率分布参数特征和马尔可夫转移特征的图像分类方法,首先,采用柯西分布、拉普拉斯分布、广义高斯分布和α‑稳态分布为原子,建立一个分布字典,对输入图像的不同尺度、不同子带下的高频小波变换系数分布进行拟合;利用1阶差分算子分别计算离散余弦变换系数沿水平方向、竖直方向的马尔可夫转移概率;将概率密度分布参数特征和马尔可夫转移概率参数特征作为分类特征,以支持向量机LIBSVM作为分类器,以径向基函数作为核函数,训练得到一种基于支持向量机LIBSVM的、用于屏幕内容图像和自然图像的分类器,进而实现屏幕内容图像块和自然图像块的自动分类。
技术领域
本发明涉及屏幕内容的图像和视频处理领域,尤其是一种稳定高效、自适应性强、分类精度高、基于概率密度分布字典和马尔可夫转移特征的图像分类方法。
背景技术
复杂度适中、面向屏幕内容视频的高效率编码是视频编码领域具有挑战性的最新研究课题之一,学者们将其称为“屏幕内容视频编码”。目前,H.264/AVC、HEVC对屏幕内容中的线条、文字、图形等非连续色调内容的压缩效率尚未满足应用需求,且计算复杂度高。究其原因在于,屏幕内容由不连续色调区域和连续色调区域两部分共同组成,而二者的成像机制和获取手段却完全不同,使得其通道特性也大相径庭。在空间域中,不连续色调区域拥有背景简单、对比度高、色调数量有限的锐化边缘和线条,而连续色调区域的纹理特点却恰恰相反;在频率域中,与连续色调区域相比,不连续色调区域的离散余弦变换(DiscreteCosine Transform,DCT)系数分布呈现更加显著的非高斯特性。所以,无论在空间域,还是在频率域,不连续色调区域的统计分布规律都明显有别于连续色调区域,目前还不存在任何一种编码方法,能在这两类区域上均取得令人满意的编码效率。在这种情况下,面向屏幕内容视频的国际编码标准HEVC-SCC采用了一种混合编码框架对屏幕内容进行压缩,其主要思路是首先将待编码帧划分为不连续色调块和连续色调块,再为不同类型的块选择恰当的编码算法,从而形成复合码流。然而,由于研究人员目前尚缺乏对屏幕内容视频的统计分布特征,尤其是DCT系数统计分布特征的深入认识,HEVC-SCC编码器仅能依靠对不同编码模式的枚举和多次率失真选择,才能为每个待编码块确定恰当的图像块类型及其编码方法,其决策过程的计算负担非常繁重。因此,对自然图像块和屏幕内容图像块进行准确地自动分类,已经成为一个现实且重要的问题,它是指导SCC视频编码器实现快速块分类决策的关键环节,有利于加快编码器的编码模式决策和率失真优化的速度,进而提高编码器的时间效率。
目前,还鲜见对包含大量文字、电脑桌面内容的屏幕内容图像与自然图像进行分类的方法。现有方法主要集中于对自然图像和计算机生成图像的分类,这些方法大致可以分为三类:基于统计特征的分类方法、基于几何特征的分类方法和基于物理特征的分类方法。
在基于统计特征的分类方法方面,Fard等人对图像的RGB颜色通道采取4阶小波变换,然后提取每阶小波高频子带的216维统计特征,并采用SVM及LDA进行分类,其对自然图像的识别准确率为98.8%,但计算机生成图像的识别准确率仅66.8%,并且其特征维数较高,准确率也不足,尤其是计算机生成图像的分类识别精度不够。Chen等人提出采用图像特征函数的统计矩以及小波子带作为分类特征,应用小波系数直方图的特征函数来构造一个234维的区分特征,并采用LIBSVM在RBF核的基础上实现图像种类判别,其识别精度达到了82.1%。虽然精度有所提升,但特征向量的维度和计算复杂度均更高。Li等人在YCbCr颜色空间中提取均匀的59维灰度不变LBP特征,再使用SVM和多项式核函数完成图像分类,其平均精确度可以达到98.33%,但复杂度较高,鲁棒性也不尽人意。Wang等人利用同态滤波突出图像细节,用共生矩阵构建分类特征,再通过计算各灰度共生矩阵的能量、对比度、同质性、列平均最大值以及纹理相似性等特征,使平均分类精度达到了98%。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁师范大学,未经辽宁师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010542010.3/2.html,转载请声明来源钻瓜专利网。