[发明专利]一种核心专利判断方法及装置在审
申请号: | 202011178049.8 | 申请日: | 2020-10-29 |
公开(公告)号: | CN112307165A | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 程艳 | 申请(专利权)人: | 武汉蝉略科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/338;G06F16/36;G06F40/289;G06Q50/18 |
代理公司: | 武汉红观专利代理事务所(普通合伙) 42247 | 代理人: | 李季 |
地址: | 430000 湖北省武汉市东湖新技术*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 核心 专利 判断 方法 装置 | ||
本发明公开一种核心专利判断方法及装置,所述方法包括:获取同领域已授权专利数据库,对数据库中各个专利文档的独立权利要求进行技术特征提取,并根据技术特征为每个专利文档构建知识图谱;将各个专利文档的知识图谱进行融合,形成数据库的总知识图谱;统计所述总知识图谱中每个节点的分支数,筛选出分支数大于第一阈值的节点组成第一节点集;按照节点数从多到少的顺序从第一节点集中随机筛选多组候选节点,从数据库中过滤出同时包含某组候选节点且候选节点分支数总和最少的一个专利文档作为当前组候选节点对应的核心专利;对核心专利排序。本发明通过构建知识图谱筛选出本领域内核心技术点,基于核心技术点筛选核心专利,具有较高准确性。
技术领域
本发明涉及专利文本挖掘技术领域,具体涉及一种核心专利判断方法及装置。
背景技术
随着我国专利行业的发展,专利数量和质量已经成为衡量企业或单位核心竞争力的重要部分,核心专利,一殷指的是制造某个技术领域的某种产品必须使用的技术所对应的专利,而不能通过一些规避设计手段绕开。从大量的专利数据库中挖掘出某一技术领域的核心专利是技术发展脉络、进行行业技术分析和技术发展规划的基础。
现阶段专利挖掘技术大多提供专利检索和统计分析等功能,专利检索大多通过关键字、分类号或根据筛选条件组合生成检索式进行专利检索,专利统计分析的统计对象一般是以专利件数为单位,基于专利分类、专利权人、年度、国别等从不同角度进行。这些专利检索分析方法均无法从数据库中有效提取出核心专利,而人工分析又存在准确性问题。
发明内容
有鉴于此,本发明提出了一种核心专利判断方法,用于从目标数据库中提取出核心专利。
本发明第一方面,公开一种核心专利判断方法,所述方法包括:
获取同领域已授权专利数据库,对数据库中各个专利文档的权利要求书的独立权利要求进行技术特征提取,并根据技术特征为每个专利文档构建知识图谱;
将各个专利文档的知识图谱进行融合,形成数据库的总知识图谱;
统计所述总知识图谱中每个节点的分支数,筛选出分支数大于第一阈值的节点组成第一节点集;
按照节点数从多到少的顺序从第一节点集中随机筛选多组候选节点,从数据库中过滤出同时包含某组候选节点且候选节点分支数总和最少的一个专利文档作为当前组候选节点对应的核心专利;
按照候选节点数从多到少的顺序对所述核心专利排序。
优选的,所述获取同领域授权专利数据库的方法包括:分析输入的检索指令并生成检索式,根据检索式获取目标领域内已授权专利组成数据库。
优选的,所述对数据库中各个专利文档的权利要求书进行技术特征提取,并根据技术特征为每个专利文档构建知识图谱具体为:
对各个专利文档的权利要求书的独立权利要求进行分词、去停用词处理,提取关键词组成关键特征并抽取关键特征之间的关联关系;
根据所述关键特征,从独立权利要求中提取出对所述关键特征进一步限定的一个或多个第一子特征;
以所述关键特征为实体节点、以关键特征对应的第一子特征为属性节点构建各个专利文档的知识图谱;
若所述第一子特征还包括进一步限定的一个或多个第二子特征,则将第二子特征作为第一子特征的属性节点;以此方式提取同一独立权利要求的所有技术特征,直到所有技术特征均加入知识图谱。
优选的,所述将各个专利文档的知识图谱进行融合,形成数据库的总知识图谱具体为:
将不同专利文档的知识图谱进行指代消解、实体消歧、实体链接,确定相同实体节点或属性节点,将相同实体节点或属性节点合并,形成数据库的总知识图谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉蝉略科技有限公司,未经武汉蝉略科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011178049.8/2.html,转载请声明来源钻瓜专利网。