[发明专利]基于区域尺寸和弯曲度的化学分子结构图分割方法无效
申请号: | 201210366626.5 | 申请日: | 2012-09-28 |
公开(公告)号: | CN103700084A | 公开(公告)日: | 2014-04-02 |
发明(设计)人: | 李存华;管燕;仲兆满 | 申请(专利权)人: | 淮海工学院 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T5/00 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 刘喜莲 |
地址: | 222000 江苏省连云港市新浦*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于区域尺寸和弯曲度的化学分子结构图分割方法,其步骤如下:选择待处理的二维化学分子结构的BMP图;进行图像预处理,包括二值化、去噪等操作;采用8连通判别算法进行边界跟踪,给每个连通区域进行标记;根据连通区域尺寸大小,将化学分子结构图分割成两部分:一部分是由化学键组成的所有大尺寸连通区域的组合,另一部分是杂原子、基团和单化学键等小尺寸区域的组合;根据弯曲度将小尺寸组合图中的表示化学键的单线段和类线段提取出;最后根据位置等信息将类线段和单线段进行区分,将单线段的化学键和大尺寸连通区组合,完成了化学键与杂原子、基团的分离。该方法在进行图像分割时具有很好的分割效果。 | ||
搜索关键词: | 基于 区域 尺寸 弯曲 化学 分子 结构图 分割 方法 | ||
【主权项】:
1.一种基于区域尺寸和弯曲度的化学分子结构图分割方法,其特征在于,其具体步骤如下:(1)选择待处理的二维化学分子结构的图像,化学分子结构的图像的格式有BMP、TIFF、PNG、GIF;处理前将所有的非BMP格式的图像都转化成BMP格式;(2)进行化学分子结构图像预处理操作,所述的预处理操作为缝合、去噪、二值化、倾斜校正操作;(3)采用8连通判别算法,进行边界跟踪,给每个连通区域进行标记,每个连通区域被表述为平面上一列坐标为整数的有序点的集合:
;(4)基于区域尺寸对化学分子结构图像进行分割:首先设定尺寸阈值
,该值是一个随着图的变化而变化的动态值,接着基于该尺寸阈值,完成将化学分子结构图中的所有的连通区域分割成两部分操作,一部分是由有长链、环链或两者组合的区域组成,另一部分是由表示杂原子或基团的字母、数字,以及一些表示化学键的单直线段的连通区域组成;步骤(4)中所述基于区域尺寸对化学分子结构图像进行分割,其具体步骤如下:(4-1)获得尺寸阈值
:由人工选定图中一个大写字母,计算该字母的宽度
和高度
:
,高度
,
、
中较大的1.1倍作为
的值,即
;(4-2)计算所有连通区域的宽度
和高度
,
,
为连通区域的个数;将每个连通区宽度和高度中较大的值记下,用
表示,即
;(4-3)如
,则将所对应的连通区域分割出,将
的所有连通区域组成一新图;完成了将化学分子结构图中所有连通区域按尺寸大小可以分割成两部分:一部分是由有长链、环链或两者组合的区域;另一部分是由表示杂原子或基团的字母、数字,以及一些表示化学键的单直线段的连通区域;(5)基于弯曲度对化学分子结构图像进行进一步分割:直线段和一般字母、数字的最大区别就是,直线段是直的,而一般的字母、数字具有一定的弯曲度,基于弯曲度将单线段和字母、数字分离,将分离出单线段和基于区域尺寸图像分割中化学键组合,完成了化学键和杂原子、基团的分离;步骤(5)中所述基于弯曲度对化学分子结构图像进行进一步分割,其具体步骤如下:(5-1)取像素点
的一个领域
,其中
为像素点
的领域半径,是一个常数,一般取0-15;(5-2)以领域
,为子窗口在连通区域边界曲线上滑动,
的直线方程为
,利用计算公式![]()
,计算
点到直线
的距离;(5-3)如果
,则该连通区是一条直线段,如果在计算中发现有两个以上点到
距离大于
,就可以判定该连通区域是非直线,也就是字母或数字,不需要再计算其它点;通过该方法,实现将单线段和字母、数字分离;(6)区分“I”、“l”、“-”与直线段:在化学分子结构图中化学元素碘的“I”字母、表示氯元素的“cl”中的“l”,以及表示负电荷的“-”显示式样与直线段类似;基于弯曲度的对图像分割,“I”、“l”、“-”会被当作单线段的化学键分割出;“I”、“l”、“-”出现于杂原子或基团中,位于化学键,也就是直线段的端点处;表示化学键的单线段主要以两种方式出现:一种在碳链中充当双键或叁键的角色;另一种位于杂原子或杂原子与基团之间;本发明基于倾斜角度、位置信息将“I”、“l”、“-”与直线段区分出,在判断前,暂称“I”、“l”、“-”和单直线段为待测直线段;步骤(6)中所述完成“I”、“l”、“-”与直线段的区分,具体步骤如下:(6-1)提取基于区域尺寸图像分割获得的大连通区域图中的交点以及端点,将其与基于弯曲度图像分割中获得的字母、数字图中的每个连通区域的矩形区域组合,用★标识交点,▲标识端点,■标识字母、数字;(6-2)首先从待测直线段的倾斜角度来进行区分,如待测直线段和水平正方向的夹角非0°或90°,断定其是直线段;因在预处理时,对图像进行了倾斜校正,所有的字母、数字均端正显示,也就是类直线的字母“I”、“l”与水平正方向的夹角约90°,负电荷“-”与水平正方向的夹角约0°;而图中的表示化学键的直线段与水平正方向的夹角主要有0°、30°、90°、120°几种;(6-2)对于剩下的与水平正方向夹角为0°或90°左右待测线段,从其所处的位置进行判断;类直线的“I”、“l”、“-”位于端点处,而表示化学键的单线段位于两原子字母之间,或位于碳链中;取待测线段的两端点坐标,分别求与两端点一定距离范围内点的类型,如果只有端点,则其为非线段;如待测线段与水平正方向夹角为0°,且离其左侧端点较近的是一矩形区域,同时该线段位于该矩形区域的1/2高度以上,则该待测线段是伪线段,应该是负电荷“-”;如该线段与水平正方向的夹角是90°左右,同时,该待测线段的左侧是一矩形区域,那么它就是字母;非以上情况的,可判定为直线段。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于淮海工学院,未经淮海工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210366626.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种标签纸分发装置的出纸通道结构
- 下一篇:一种闪光材料