[发明专利]一种研报板式识别和分割的方法、系统及装置在审
申请号: | 201810906272.6 | 申请日: | 2018-08-10 |
公开(公告)号: | CN108960210A | 公开(公告)日: | 2018-12-07 |
发明(设计)人: | 赵勇 | 申请(专利权)人: | 武汉优品楚鼎科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 430000 湖北省武汉市东湖新技术开*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种研报板式识别和分割的方法、系统及装置。本发明通过截取PDF文件为图片;对所述图片进行一系列预处理操作,获取其图片的空白像素直方图;遍历所述空白像素直方图,获取其最低波谷位置;依据所述最低波谷位置在图片上标注,并依据所述标注对所述图片进行板式分割。发明基于研报板式的复杂多样,采用图像处理和正则表达式相结合的方法自动识别出各种板式的分栏并做分割,可以自动获取PDF文件中的每页中的各分栏。该发明为研报分析人员针对性的提取自己所需的分栏内容提供了便利性,大大降低了研报分析人员的工作量。 | ||
搜索关键词: | 板式 分栏 分割 系统及装置 波谷位置 空白像素 直方图 标注 图片 预处理操作 正则表达式 内容提供 图像处理 自动获取 自动识别 便利性 截取 遍历 工作量 分析 | ||
【主权项】:
1.一种研报板式识别和分割的方法,其特征在于所述方法步骤为:步骤101,转换模块将源文件转换为图片一;步骤102,预处理模块获取所述图片一执行预处理操作,生成预处理图片二;步骤103,分析模块获取所述预处理图片二,生成所述预处理图片二的空白像素直方图,分析所述空白像素直方图中的最低波谷,获取所述空白像素直方图中目标分栏的位置;步骤104,标注模块根据所述空白像素直方图中的所述目标分栏的位置,在所述图片一中进行所述目标分栏的位置标注,生成标注图片。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉优品楚鼎科技有限公司,未经武汉优品楚鼎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810906272.6/,转载请声明来源钻瓜专利网。