[发明专利]基于支持向量机的图像插值算法无效
申请号: | 200610156538.7 | 申请日: | 2006-12-20 |
公开(公告)号: | CN101059867A | 公开(公告)日: | 2007-10-24 |
发明(设计)人: | 沈毅;马立勇;马家辰 | 申请(专利权)人: | 哈尔滨工业大学(威海) |
主分类号: | G06T3/40 | 分类号: | G06T3/40 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 264209*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 支持 向量 图像 算法 | ||
技术领域
本发明属于图像处理技术领域,具体涉及一种基于支持向量机的图像插值算法。
背景技术
图像插值能够对图像进行放大,便于进行观察和处理,被广泛应用于遥感、医学诊断、多媒体通讯、视频处理等领域中。图像插值算法就是根据已知图像中的像素对于放大后的图像中的未知像素进行计算的方法。
支持向量机[1][2]是借助于最优化方法解决机器学习问题的工具,是在统计学习理论的基础上发展起来的学习算法。应用支持向量机可以进行函数估计,又称为支持向量回归。
图像插值最为常用的算法是线性插值算法、三次插值算法[3]。这些算法假设图像灰度值符合线性或者三次曲线模型,从而采用线性或者三次模型对未知像素进行计算。
由于实际图像的像素灰度间并不满足线性或者三次曲线模型,线性插值、三次插值方法得到的结果图像存在较大的误差。为此提出了神经网络插值方法[4]。该方法首先采用多层感知器神经网络进行学习训练,训练样本为原图像中的像素,输入模式为原图像中该像素周围邻近像素的灰度值,输出为该像素的灰度值。然后利用训练后的神经网络对放大图像的未知像素进行估计,估计中输入未知像素周围邻近的已知像素灰度值,神经网络的输出就是该未知像素的灰度值。
另外一种插值方法是曲面拟合方法[5]。如果把二维数字图像的像素位置和灰度值看作坐标值和对应的曲面值,就可以使用曲面数据拟合的方法采用支持向量机进行图像插值计算。该方法对未知像素进行灰度值计算时,首先选取该像素周围最临近的4×4或者5×5个已知像素,然后把这些已知像素的相对坐标值作为输入模式,已知像素的像素灰度值作为输出模式对支持向量机进行训练。完成训练之后把待插值像素的相对坐标输入支持向量机,支持向量机的输出就是待插值像素的灰度值。
还有一种插值方法是相邻像素法[6]。在该方法中已知图像中的像素用作支持向量机训练样本。首先进行训练,样本中每个像素的灰度值及其相邻像素的灰度值分别作为支持向量机的输出模式和输入模式。然后每个待插值像素可以通过支持向量机估计得到,向支持向量机输入邻近像素灰度值,支持向量机的输出模式就是要估计的像素灰度值。
以上这些方法都能够进行插值计算,但是计算结果的准确性还不够高。在实际的图像处理中经常需要提供高准确性的插值结果图像,如用于诊断的医学图像需要提供准确的细节信息,以上这些方法不能完全满足这种高准确性的需要。为了提高插值计算的准确性,本发明采用应用支持向量机先进行学习训练,然后再用支持向量机进行估计计算的方法。在支持向量机的训练和估计的输入模式中,使用相邻像素之间的灰度平均值和灰度差值等图像的局部空间特性信息,使得支持向量机对于原图像的学习和估计更加准确,显著提高了插值计算的准确性。
发明内容
本发明的目的在于针对现有技术存在的不足,提出一种使用支持向量机学习图像的局部空间特性,然后利用完成训练的支持向量机进行未知像素灰度值估计的插值算法。这种算法适用于对图像进行整数倍的放大。此算法克服了以往的支持向量机学习方法中准确性不足的问题,显著提高了图像插值的准确性。
本发明是通过以下技术方案实现的:本发明首先确定待插值像素的周围最邻近6个已知像素区域,该区域由应用中具体的放大倍数决定;然后进行支持向量机训练,根据要插入像素的情况确定支持向量机的个数,对每个支持向量机分别训练,训练中原图像中的每个像素都是支持向量机的输入样本,输入模式包括选定区域中相邻6个已知像素的灰度值,以及相邻6个已知像素的灰度平均值、灰度差等局部空间特性;最后使用完成训练的支持向量机对每个待估计的像素进行插值计算,计算中的支持向量机输入模式和训练的输入模式相同,支持向量机的输出就是插值结果。
以下对本发明作进一步的说明,包括如下步骤:
第一步,确定待插值像素的周围最邻近6个已知像素区域。该区域根据已知像素之间待插值的像素个数,即放大倍数来确定。比如进行2倍行扩展插值,原来的两行之间加入一个新行,新行的像素是需要计算像素的未知行,则该最邻近已知像素区域选择为中间一个待插值像素,上面一行的3个最邻近已知像素,下面一行的3个最邻近已知像素。再比如对列进行3倍扩展,原来相邻的两个已知列之间需要插入两个未知列,就需要为新增加的两列各选择一个区域形状,共两个形状区域,区域中心是待插值像素,一侧是相邻已知列中最邻近的3个已知像素,另一侧是隔着一个未知列的已知列中的最邻近的3个像素。对于更一般的行和列同时扩展的情况,可以通过对原图像先实施行扩展插值,再实施列扩展插值的方法进行。
第二步,进行支持向量机训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(威海),未经哈尔滨工业大学(威海)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200610156538.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于减震器的防护盖
- 下一篇:一种具有干衣功能的热泵热水器
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序