[发明专利]一种专利数据库自动去燥的方法和装置在审
申请号: | 202010098441.5 | 申请日: | 2020-02-18 |
公开(公告)号: | CN111324726A | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 邓梅 | 申请(专利权)人: | 江苏润桐数据服务有限公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/35;G06Q50/18 |
代理公司: | 苏州润桐嘉业知识产权代理有限公司 32261 | 代理人: | 吴筱娟 |
地址: | 215600 江苏省苏州市张家港*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 专利 数据库 自动 方法 装置 | ||
本发明提供了一种专利数据库自动去燥的方法和装置,通过获得第一专利数据库,包括M个专利文献;获得第一指令,表示为N个专利文献被用户删除;从N个专利文献中获得第一共性的关键特征;根据第一共性的关键特征从第一专利数据库中予以检索,获得P个专利文献;从M个专利文献中删除P个专利文献,获得第二专利数据库,第二专利数据库为目标数据库。解决现有技术中去噪过程人工处理,对用户目标专利把握度不足,无法进行准确检索,从而影响检索结果的可靠性的技术问题。达到通过对用户删除要求的分析,确定用户删除专利的具体特征,对第一专利数据库内的专利文献进行自动筛选去噪,从而提高目标检索专利文献的可靠度、准确性的技术效果。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种专利数据库自动去燥的方法和装置。
背景技术
专利文献检索即搜索专利及专利文献。中国专利检索系统(CPRS):是一种仅在国家知识产权局局域网中使用的专利检索与全文浏览系统。该系统包含:1985年以来三种中国专利著录数据及发明、实用新型全文说明书;1975年以来美国专利著录数据及全文说明书;1993年以来日本专利和实用新型各种全文说明书。专利文献检索是企业全面了解现有技术,提高研发起点,规避知识产权风险的基础工作。由于网上公开的原始专利数据信息不全、语言晦涩、冗长难懂,企业如果不掌握专业的检索方法和技能,检索存在困难。而随着社会制度的不断发展与完善,专利文献数量的迅速增加,使得各国企业对于专利权的保护越来越重视。对于企业而言,如何从大量的专利文献中精确地检索并分析出满足自身需求的信息,对整个企业的发展至关重要。
但本发明申请人发现现有技术至少存在如下技术问题:
现有技术中去噪过程人工处理,对用户目标专利把握度不足,无法进行准确检索,从而影响检索结果的可靠性的技术问题。
发明内容
本发明实施例提供了一种专利数据库自动去燥的方法和装置,解决了现有技术中去噪过程人工处理,对用户目标专利把握度不足,无法进行准确检索,从而影响检索结果的可靠性的技术问题。
鉴于上述问题,提出了本申请实施例以便提供一种专利数据库自动去燥的方法和装置。
第一方面,本发明提供了一种专利数据库自动去燥的方法,所述方法包括:获得第一专利数据库,其中,所述第一专利数据库中包括M个专利文献;获得第一指令,所述第一指令表示为N个专利文献被用户删除;从所述N个专利文献中获得第一共性的关键特征;根据所述第一共性的关键特征从所述第一专利数据库中予以检索,获得P个专利文献;从所述M个专利文献中删除所述P个专利文献,获得第二专利数据库,其中,所述第二专利数据库为目标数据库。
优选的,所述在所述获得第一专利数据库之前,所述方法包括:获得第一专利文献,其中,所述第一专利文献具有第一关键特征;根据所述第一关键特征从专利检索数据平台中获得第一专利数据库。
优选的,所述方法包括:判断所述第一共性的关键特征的每个特征与所述第一关键特征之间的关联性;获得所述每个特征与所述第一关键特征之间的关联性不满足预定条件的特征作为删除特征并根据所述删除特征从所述第一专利数据库中予以检索,获得O个专利文献;从所述M个专利文献中删除所述O个专利文献,获得第三专利数据库,其中,所述第三专利数据库为目标数据库。
优选的,所述方法还包括:所述第一专利文献还具有第二关键特征,所述第二关键特征用来检验自动删除的数据的准确性;获得所述第一共性的关键特征的每个特征与所述第二关键特征之间的关联性;获得所述每个特征与所述第二关键特征之间的关联性不满足预定条件的特征作为删除特征并根据所述删除特征从所述第一专利数据库中予以检索,获得U个专利文献;从所述M个专利文献中删除所述U个专利文献,获得第四专利数据库,其中,所述第四专利数据库为目标数据库。
优选的,所述方法还包括:所述的关联性表示为是在专利数据检索平台中,第一关键特征、第二关键特征分别与所述第一共性的关键特征中的每个特征为能相互替代的关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏润桐数据服务有限公司,未经江苏润桐数据服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010098441.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于语义分割的服装颜色识别方法、装置和系统
- 下一篇:学习装置单元