[发明专利]一种统一资源定位符提取方法、装置、设备和存储介质在审
申请号: | 202010251493.1 | 申请日: | 2020-04-01 |
公开(公告)号: | CN111563211A | 公开(公告)日: | 2020-08-21 |
发明(设计)人: | 吴汉桥 | 申请(专利权)人: | 深信服科技股份有限公司 |
主分类号: | G06F16/955 | 分类号: | G06F16/955 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 王军红;张颖玲 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 统一 资源 定位 提取 方法 装置 设备 存储 介质 | ||
1.一种统一资源定位符提取方法,其特征在于,所述方法包括:
确定待提取数据中的开始字符;
基于所述开始字符依次扫描所述待提取数据,根据预设的特殊字符确定所述待提取数据中的结束字符,所述特殊字符包括不属于URL中的字符;
根据所述开始字符和所述结束字符,提取URL。
2.根据权利要求1所述的方法,其特征在于,所述根据预设的特殊字符确定所述待提取数据中的结束字符,包括:
在所述待提取数据中查找到所述预设的特殊字符的情况下,确定查找到的所述预设的特殊字符对应的前一个字符为所述结束字符。
3.根据权利要求1所述的方法,其特征在于,所述根据预设的特殊字符确定所述待提取数据中的结束字符,包括:
在所述待提取数据中未查找到所述预设的特殊字符的情况下,确定所述待提取数据对应的最后一个字符为所述结束字符。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述特殊字符是除数字和字母以外的字符。
5.根据权利要求1所述的方法,其特征在于,所述确定待提取数据中的开始字符,包括:
在所述待提取数据中按照顺序查找第一个定位字符,所述定位字符表示预设的字符集合中的任一字符,确定查找到的第一个定位字符为所述开始字符。
6.根据权利要求5所述的方法,其特征在于,所述预设的字符集合包括字母和或/数字。
7.根据权利要求1所述的方法,其特征在于,所述待提取数据包括邮件正文数据。
8.一种统一资源定位符提取装置,其特征在于,所述装置包括:确定模块和提取模块,其中,
确定模块,用于确定待提取数据中的开始字符;
提取模块,用于基于所述开始字符依次扫描所述待提取数据,根据预设的特殊字符确定所述待提取数据中的结束字符,所述特殊字符包括不属于URL中的字符;根据所述开始字符和所述结束字符,提取URL。
9.一种电子设备,其特征在于,包括处理器和用于存储能够在处理器上运行的计算机程序的存储器;其中,
所述处理器用于运行所述计算机程序时,执行权利要求1-7任一项所述的统一资源定位符提取方法。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-7任一项所述的统一资源定位符提取方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深信服科技股份有限公司,未经深信服科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010251493.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种活性碳纤维物料运输泵
- 下一篇:一种门禁式防疫消毒装置