[发明专利]基于大数据的政务信息化项目的查重管理方法在审
申请号: | 202210430901.9 | 申请日: | 2022-04-23 |
公开(公告)号: | CN114780825A | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 王瑞 | 申请(专利权)人: | 重庆市小苹果科技有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F40/289;G06Q10/10 |
代理公司: | 北京高航知识产权代理有限公司 11530 | 代理人: | 乔浩刚 |
地址: | 401120 重庆市渝北区青枫北路1*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据 政务 信息化 项目 管理 方法 | ||
本发明涉及政务信息化项目查重管理技术领域,且公开了一种基于大数据的政务信息化项目的查重管理方法,通过获取政务信息化项目的标题,从标题中提取出核心特征词,采用核心特征词为检索依据,从存储有政务信息化项目的大数据网络中检索得到大数据项目,并提取出与核心特征词对应的关键词,对核心特征词与关键词的相似度进行评述,获得相似度值,计算得到用于评述政务信息化项目与大数据项目的综合相似度评价等级值,这使得在评述政务信息化项目与大数据项目的相似度时,不必依靠主观判断,而是拥有了客观科学的评述标准,该方法适用于跨计划项目查重领域。
技术领域
本发明涉及政务信息化项目查重管理技术领域,具体为一种基于大数据的政务信息化项目的查重管理方法。
背景技术
科技项目查重是避免重复立项、重复建设的重要措施之一,文献检索发现:姜韶华提出一种基于文本挖掘的科研项目管理原型系统,重点研究和解决科研项目文本的切分和特征建模等问题;左川提出一种基于非分词技术解决科技项目查重问题的方法,该方法不需要对文本进行分词处理,利用频繁闭项集构造向量空间模型对项目申请书进行建模并计算相似度;方延风提出将一种改进的TF-IDF方法用于科技项目查重,考虑了特征词的位置和长度两种因素;吴燕提出一种基于层次聚类的科技项目分类和查重方法,在计算科技项目相似性时综合考虑了应用领域、研究内容和技术来源等因素;林明才等提出一种改进的模糊聚类算法RM-FCM,在计算项目相似度时考虑了不同属性的特征项对科研项目的重要性;刘荫明等从科技查新实践、地区和部门多头管理、科研论文所依托的基金项目数量等方面研究我国科研的重复立项现象,通过对科研项目的申报与审批流程进行分析,提出避免重复立项的具体措施。
上述研究工作基本都是从项目申请书入手,对申请书进行分词或将其作为整体处理,然后提取特征向量,利用特征向量的相似度表示项目的相似度。一方面不同计划的申请书格式不同,学科领域差别较大,很难找到统一的描述模式;另一方面,项目申请书一般不对外公开,获取难度很大。因此,上述方法只是适应于在单个计划内部进行项目查重,而很难进行跨计划的项目查重。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供一种基于大数据的政务信息化项目的查重管理方法。
(二)技术方案
为实现上述目的,本发明提供如下技术方案:
一种基于大数据的政务信息化项目的查重管理方法,包括以下步骤:
步骤S1,获取需要查重政务信息化项目的标题,从标题中提取出核心特征词CFWi;其中,i为核心特征词CFW的序列编号,i=1,2,...,n1;
步骤S2,建立政务信息化项目的相似度评价等级,并确定相似度评价等级标准的量值范围[mJd,mJu];
其中,J为相似度评价等级的等级编号,J=1,2,...,n2;
步骤S3,采用至少包括其中一个核心特征词CFWi为检索依据,从存储有政务信息化项目的大数据网络中检索得到若干个大数据项目;
获取大数据项目的标题、并提取出与所述核心特征词CFWi对应的关键词Kdj;其中,j为关键词Kd的序列编号,j=1,2,...,n3;
步骤S4,评述并给出核心特征词CFWi与关键词Kdj之间的相似度值SVI;其中,I为相似度值SV的序列编号,I=1,2,...,n4;
步骤S5,构造用于表征相似度值SVI的评价等级属于程度的关联度值函数δ(SVI-J);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆市小苹果科技有限公司,未经重庆市小苹果科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210430901.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种建筑施工用砂浆回收处理方法
- 下一篇:吃药监督提醒装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置