[发明专利]专利搜索的方法、服务器及计算机可读介质在审
| 申请号: | 201811041125.3 | 申请日: | 2018-09-07 |
| 公开(公告)号: | CN110888894A | 公开(公告)日: | 2020-03-17 |
| 发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 深圳中利汇信息技术有限公司 |
| 主分类号: | G06F16/242 | 分类号: | G06F16/242;G06F16/2457 |
| 代理公司: | 深圳市兰锋知识产权代理事务所(普通合伙) 44419 | 代理人: | 曹明兰 |
| 地址: | 518000 广东省深圳市龙华区大浪街道龙*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 专利 搜索 方法 服务器 计算机 可读 介质 | ||
1.一种专利搜索的方法,其特征在于,包括:
对专利数据库中的专利文本全文或指定部分进行识别,从所述专利文本中提取与所述专利文本的符号相对应的关键词;
将提取到的所述关键词存储到关键词数据库,并存储所述关键词与对应的专利文本的对应关系;
接收专利搜索请求,所述专利搜索请求的专利搜索请求语包括非著录项目关键词;
获取所述关键词数据库中与所述非著录项目关键词相匹配的关键词;
根据所述关键词与所述对应文本的对应关系确定所述专利搜索请求的专利搜索结果;
返回所述专利搜索结果。
2.根据权利要求1所述的专利搜索的方法,其特征在于,从所述专利文本中提取与所述专利文本的符号相对应的关键词具体包括:
在所述专利文本中识别数字或英文字母或两者的结合获得第一候选符号;
遍历所述专利文本确定所述第一候选符号的出现次数,在所述第一候选符号中去除只出现一次的候选符号,获得第二候选符号;
比对相同的所述第二候选符号中每一个第二候选符号相邻位置的文字,将重复出现的文字相邻的第二候选符号确定为所述专利文本的符号。
3.根据权利要求2所述的专利搜索的方法,其特征在于,在比对相同的所述第二候选符号中每一个第二候选符号相邻位置的文字,将重复出现的文字相邻的第二候选符号确定为所述专利文本的符号之后,还包括:
将符号相邻位置重复出现的文字确定为所述专利文本的符号名称;
存储所述符号名称与所述符号的对应关系。
4.根据权利要求3所述的专利搜索的方法,其特征在于,所述符号名称的权重与所述符号名称在所述专利文本中出现的频率正相关。
5.根据权利要求4所述的专利搜索的方法,其特征在于,根据所述符号名称在每一个专利文本中的权重确定所述专利文本对应的专利在所述专利搜索结果中的排序。
6.根据权利要求4或5所述的专利搜索的方法,其特征在于,在将符号相邻位置重复出现的文字确定为所述专利文本的符号名称之后,还包括:
对所述符号名称进行分类,获得符号名称类别以及所述符号名称类别的权重,所述符号名称类别的权重为该类符号名称的权重之和;
以所述符号名称类别的权重为所述符号名称类别中的每一个符号名称的权重。
7.根据权利要求3所述的专利搜索的方法,其特征在于,在对专利数据库中的专利文本全文或指定部分进行识别,从所述专利文本中提取与所述专利文本的符号相对应的关键词之后,还包括:
在所述专利文本的附图的相邻区域配置对应的用于链接所述符号名称的符号控件。
8.根据权利要求3所述的专利搜索的方法,其特征在于,在所述专利文本的附图区域中的符号的相邻位置配置对应的符号名称。
9.一种服务器,其特征在于,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行根据权利要求1-8任一项所述的方法。
10.一种计算机可读介质,其特征在于,所述计算机存储介质有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行根据权利要求1-8任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳中利汇信息技术有限公司,未经深圳中利汇信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811041125.3/1.html,转载请声明来源钻瓜专利网。





