[发明专利]一种具有图像识别功能的数据处理方法及系统在审
申请号: | 201410288528.3 | 申请日: | 2014-06-24 |
公开(公告)号: | CN104156386A | 公开(公告)日: | 2014-11-19 |
发明(设计)人: | 李红梅;李华东;李勇;吴观斌;许乃媛;傅蓬;王慧慧 | 申请(专利权)人: | 国家电网公司;国网山东省电力公司电力科学研究院;山东亿云信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q10/06 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 张勇 |
地址: | 250002 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 具有 图像 识别 功能 数据处理 方法 系统 | ||
1.一种具有图像识别功能的数据处理方法,其特征是,包括如下步骤:
步骤一:采集的申报项目的数据信息存储到网络服务器的缓存区,主计算机调用网络服务器的缓存区的申报项目的数据信息并存储到主计算机的第一缓存区;采集的图片、Word和PDF文档数据以文件形式存储至主计算机的第二缓存区,将文档相对路径存储至项目申报数据库附件子数据表中;
步骤二:主计算机读取第一缓存区中的申报项目的信息,判断数据是否符合要求;对于图片文档,利用项目申报数据库附件子数据表中文档路径调用主计算机的第二缓存区图片文档,利用图像识别模块读取图片文档内容,完成单位盖章与完成单位数据表完成单位名称是否相符,如果项目申报数据表中申报项目的信息及图片文档均符合要求就进入步骤三,如果不符合就返回步骤一;
步骤三:将步骤二中符合要求的项目数据从项目申报数据库同步到评审数据库,该同步过程采取单向同步;对评审数据库的申报信息进行三次筛选,并将最终数据输出在服务器的浏览页面上;
所述步骤一中具体为:将与项目直接相关的数据存储到项目申报库主数据表中,每条数据对应唯一项目编号,与项目间接相关的数据存储到项目申报库各子数据表中,子数据表中将唯一项目编号设置为外键与主数据表关联;申报数据库的子数据表中还存储有历史项目申报信息。
2.如权利要求1所述一种具有图像识别功能的数据处理方法,其特征是,所述步骤二中,对项目申报库各子数据表存储的数据进行分词或者直接匹配,利用判断模块判断当前的申报项目的信息是否为项目名称或论文论著名称,如果是就进入关键词比较模块,如果不是,再进行判断是否为项目的完成人姓名及身份证号或知识产权号,如果是,则进入直接匹配模块;
利用关键词比较模块将当前的申报项目的信息的项目名称或论文论著名称与历史项目申报信息中的另一申报项目的项目名称或论文论著名称的关键词比较,如果相似度不低于设定值,判定重复,否则不重复;
利用直接匹配模块将当前的申报项目的信息项目的完成人姓名及身份证号或知识产权号与历史项目申报信息中的另一申报项目的项目完成人姓名及身份证号或知识产权号直接进行匹配,如果相同判定重复,否则不重复;
利用存储模块将关键词比较模块及直接匹配模块判定不重复申报项目的信息存储到主计算机的缓存区,将判定重复的申报项目的信息存储到主计算机中的项目申报数据库查重表中。
3.如权利要求2所述一种具有图像识别功能的数据处理方法,其特征是,所述关键词比较模块将当前的申报项目的信息的项目名称或论文论著名称与历史项目申报信息中的另一申报项目的项目名称或论文论著名称的关键词比较,如果相似度不低于设定值,判定重复,否则不重复,具体过程为:
利用关键词提取模块取出当前申报项目的信息及历史项目申报信息中的一个,对取出的信息进行分词,将分解出的关键词分别存储到主计算机中项目申报数据库对应的两个数组中;
利用关键词匹配模块对项目申报数据库对应的两个数组中的关键词进行遍历循环比较,得出相同关键词数及各组关键词数;
根据相似度模块得出当前申报项目的信息与历史项目申报信息中的项目信息的相似度,将该相似度与设定值比较,如果相似度不低于设定值,判定重复,否则不重复;
所述利用关键词提取模块取出当前申报项目的信息及历史项目申报信息中的一个,对取出的信息进行分词,采用ShootSearch组件分词;
所述相似度模块具体用于比较项目申报数据库对应的两个数组中关键词数大小,取出较小关键词数,用相同关键词数除以较小关键词数得出相似度。
4.如权利要求1所述一种具有图像识别功能的数据处理方法,其特征是,所述步骤三中对评审数据库的申报信息进行三次筛选,具体为:
对符合要求的评审数据库中的项目进行第一次筛选,根据项目信息遴选对应的网络评审专家,通过网络评审对同步到评审数据库中的数据进行筛选;将筛选出的申报项目数据存储到评审数据库中的第三缓存区;
对存储到第三缓存区中的申报项目数据进行第二次筛选;根据项目信息遴选资深专家,对第一次筛选取出的数据进行专家投票,从投票结果中取出初步获奖项目,将初步获奖项目的数据存储到评审数据库中的第四缓存区;
对存储到第四缓存区中的申报项目数据进行第三次筛选;根据项目信息遴选科技委员会专家,对第二次筛选中取出的数据进行专家审核,从审核结果中取出最终获奖项目,将最终获奖项目存储到评审数据库中的第五缓存区。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网公司;国网山东省电力公司电力科学研究院;山东亿云信息技术有限公司,未经国家电网公司;国网山东省电力公司电力科学研究院;山东亿云信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410288528.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:大数据环境下提高数据库性能的方法及系统
- 下一篇:业务数据处理方法及系统
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序