[发明专利]专利搜索的方法、服务器及计算机可读介质在审
| 申请号: | 201811041125.3 | 申请日: | 2018-09-07 |
| 公开(公告)号: | CN110888894A | 公开(公告)日: | 2020-03-17 |
| 发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 深圳中利汇信息技术有限公司 |
| 主分类号: | G06F16/242 | 分类号: | G06F16/242;G06F16/2457 |
| 代理公司: | 深圳市兰锋知识产权代理事务所(普通合伙) 44419 | 代理人: | 曹明兰 |
| 地址: | 518000 广东省深圳市龙华区大浪街道龙*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 专利 搜索 方法 服务器 计算机 可读 介质 | ||
本发明提供专利搜索的方法、服务器及计算机可读介质,所述专利搜索的方法包括:对专利数据库中的专利文本全文或指定部分进行识别,从所述专利文本中提取与所述专利文本的符号相对应的关键词;将提取到的所述关键词存储到关键词数据库,并存储所述关键词与对应的专利文本的对应关系;接收专利搜索请求,所述专利搜索请求包括非著录项目关键词;获取所述关键词数据库中与所述非著录项目关键词相匹配的关键词;根据所述关键词与所述对应文本的对应关系确定所述专利搜索请求的专利搜索结果;返回所述专利搜索结果,使用户可以快速找到实际需要的具有高价值的专利。
技术领域
本发明涉及计算机通信领域,具体涉及专利搜索的方法、服务器及计算机可读介质。
背景技术
在当前这个技术高速革新、新的发明创造不断涌现的时代,每天都有大量的发明创造以专利申请的形式提交,每周都有大量的新专利公开和授权。而对于从事发明创造工作,或对发明创造及其成果感兴趣的个人和组织机构而言,对这些包括发明创造的专利信息进行充分的挖掘,通过检索和分析来研究其内容并加以利用,就是一件非常有意义的事情。但因为专利申请中往往包括了很多相对不具价值的“垃圾”专利,导致从大量检索到的专利文献中找出实际需要的具有高价值的专利变得十分困难。传统的专利检索方法仅仅以搜索引擎提供的“相关度”排序,它过于依赖表象的专利检索关键词,用户难以快速找到实际需要的具有高价值的专利。
因此,亟需一种全新的专利搜索方法,以找出用户实际需要的具有高价值的专利。
发明内容
本发明正是基于上述问题,提出了专利搜索的方法、服务器及计算机可读介质,使用户可以快速找到实际需要的具有高价值的专利。
有鉴于此,本发明实施例第一方面提供了专利搜索的方法,该方法包括:
对专利数据库中的专利文本全文或指定部分进行识别,从所述专利文本中提取与所述专利文本的符号相对应的关键词;
将提取到的所述关键词存储到关键词数据库,并存储所述关键词与对应的专利文本的对应关系;
接收专利搜索请求,所述专利搜索请求包括非著录项目关键词;
获取所述关键词数据库中与所述非著录项目关键词相匹配的关键词;
根据所述关键词与所述对应文本的对应关系确定所述专利搜索请求的专利搜索结果;
返回所述专利搜索结果。
在一些可能设计中,从所述专利文本中提取与所述专利文本的符号相对应的关键词具体包括:
在所述专利文本中识别数字或英文字母或两者的结合获得第一候选符号;
遍历所述专利文本确定所述第一候选符号的出现次数,在所述第一候选符号中去除只出现一次的候选符号,获得第二候选符号;
比对相同的所述第二候选符号中每一个第二候选符号相邻位置的文字,将重复出现的文字相邻的第二候选符号确定为所述专利文本的符号。
在一些可能设计中,在比对相同的所述第二候选符号中每一个第二候选符号相邻位置的文字,将重复出现的文字相邻的第二候选符号确定为所述专利文本的符号之后,还包括:
将符号相邻位置重复出现的文字确定为所述专利文本的符号名称;
存储所述符号名称与所述符号的对应关系。
在一些可能设计中,所述符号名称的权重与所述符号名称在所述专利文本中出现的频率正相关。
在一些可能设计中,根据所述符号名称在每一个专利文本中的权重确定所述专利文本对应的专利在所述专利搜索结果中的排序。
在一些可能设计中,在将符号相邻位置重复出现的文字确定为所述专利文本的符号名称之后,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳中利汇信息技术有限公司,未经深圳中利汇信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811041125.3/2.html,转载请声明来源钻瓜专利网。





