[发明专利]基于分段投影与乐符结构的谱线检测及删除方法无效
申请号: | 201010275823.7 | 申请日: | 2010-09-07 |
公开(公告)号: | CN101964049A | 公开(公告)日: | 2011-02-02 |
发明(设计)人: | 邹采荣;杨银贤;赵力;奚吉;王开;陈存宝;王青云;余华 | 申请(专利权)人: | 东南大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 许方 |
地址: | 215123 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公布了一种基于分段投影与乐符结构的谱线检测及删除方法,纸质乐谱图像首先通过扫描仪或者数码拍摄设备输入到计算机,然后经过去噪,图像格式变换等预处理操作,变成二值乐谱图像;输入图像经过预处理后,首先计算出乐谱的谱线间距,并以此为参考将整幅图像在垂直方向上分割成若干段,通过对部分特殊图像段进行水平投影处理后获取图像的垂直倾斜度,实现谱线垂直方向的倾斜校正,然后对各段进行水平垂直投影,计算相邻两段投影的互相关,进而实现图像水平倾斜以及谱线弯曲的校正,进一步消除二值图像由于倾斜导致部分直线段出现像素重叠的问题。本发明的能有效的解决“误删”和欠删除现象。 | ||
搜索关键词: | 基于 分段 投影 结构 检测 删除 方法 | ||
【主权项】:
一种基于分段投影与乐符结构的谱线检测方法,其特征在于包括如下步骤:(1)扫描输入以后的图像经过滤波去噪、格式变换以后得到行和列分别为W×H的二值图像:B(x,y),(0≤x≤W;0≤y≤H),当像素点为黑色的目标点时B(x,y)=0,为白色的背景点时B(x,y)=1,其中(x、y)为像素点坐标;首先计算乐谱图像的谱线间距S,即找出图像中出现次数最多的垂直白色游程的长度;再将图像沿水平方向划分成N个条形区域Z1,Z2,…Zn,N=Ceil(W/(4×S)),Ceil表示朝∞方向取整数,其中前N‑1个区域的宽度w为4×S,最后一个区域宽度w为W‑(N‑1)×4×S,对最后两个区域内的子图像进行水平投影,得到投影队列: Proj v [ y ] = Σ k = ( N - 2 ) × 4 × S + 1 W B ( y , k ) , 1 ≤ y ≤ H , (2)垂直方向上的倾斜校正:根据投影队列找出第一根谱线和最后一根谱线的行位置row1和row2,沿谱线的位置分别在区域:Z1(x,y):(N‑2)×w<x≤W,row1‑S≤y≤row1+S,和Z2(x,y):(N‑2)×w<x≤W,row2‑S≤y≤row2+S中搜索出黑色像素的最大列值col1和col2,据此计算出整幅图像的垂直倾斜度φ:φ=arctan((row2‑row1)/(col2‑col1))及垂直方向上的最大倾斜长度q:q=(col2‑col1)×W/(row2‑row1);对图像进行垂直倾斜校正:B′(x,y)=B(x,y+Δ′),其中Δ′=floor(q×x/H),1≤x≤W,1≤y≤H,为不同像素在垂直方向上的校正量,B′(x,y)为垂直校正后的图像,floor表示向零方向取整;(3)水平方向上的倾斜及弯曲校正:对步骤(2)所划分的各个子区域进行水平投影,得到各条形子区域的水平投影队列: Proj [ y , n ] = Σ k = sp k = sp + w B ( y , k ) , 其中sp=(n‑1)×w,1≤n≤N,1≤y≤H,n为条形区域的段号;(4)相同的的两个曲线的相关系数最大,故对相邻两段的水平投影图进行互相关运算,得到互相关队列Cross(λ,n),以获得两个投影图对应谱线间的位置差d(n); Cross ( λ , n ) = Σ k = P 1 P 2 Proj ( k , n ) × Proj ( k + λ , n + 1 ) , 其中‑S<λ<S,1≤n≤N‑1。P1,P2为互相关计算的下限和上限,如果λ≤0,则P1=‑λ+1,P2=H,如果λ>0则P1=1,P2=H‑λ,λ为水平投影队列在垂直方向上移动的距离,其值设定在一个线间距之间,找出各互相关队列中的最大值所对应的λ(n),1≤n≤N‑1值,即为相邻图像段的谱线在水平位置上的偏移量d(n);d(n)=λ(n+1)‑λ(n),其中,1≤n≤N‑1,最后一段的偏移量d(N)=d(N‑1);(5)根据各区域的偏移量d(n),从左到由对整幅图像进行水平弯曲或者倾斜率校正公式如下: J ( n ) = Σ k = 2 N d ( k - 1 ) , 2 ≤ n ≤ N , J ( 1 ) = 0 Δ=floor((x%w)/w×d(n))‑J(n)B″(x,y)=B′(x+Δ,y),其中,1≤x≤W,1≤y≤H,floor表示向零方向取整,%表示整除后取余数操作,J(n),1≤n≤N表示各子区域的累计偏差量,Δ为不同的像素在水平方向上的偏移量,B′(x,y)为进行垂直倾斜校正后的图像,B″(x,y)为对原始图像进行水平倾斜、弯曲校正后的图像。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010275823.7/,转载请声明来源钻瓜专利网。