[发明专利]提供通知消息的方法及装置有效
申请号: | 201610562656.1 | 申请日: | 2016-07-15 |
公开(公告)号: | CN107623624B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 梁伟 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | H04L12/58 | 分类号: | H04L12/58 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 提供 通知 消息 方法 装置 | ||
1.一种提供通知消息的方法,其特征在于,包括:
提供待分析页面的地址信息以及信息提取模板信息;所述待分析页面为用于发布通知消息的页面,所述信息提取模板根据所述通知消息的特征生成;
根据所述地址信息,提取页面源文件内容;
当所述页面源文件内容中存在符合所述信息提取模板的目标消息内容时,提供提取结果,所述提取结果中包括所述目标消息内容及其所在的页面地址信息;
所述方法还包括:提供用于输入关键词的操作选项,以通过所述操作选项接收第一用户输入的关键词;
其中,所述信息提取模板根据所述关键词进行修正,所述目标消息内容根据修正后的目标提取模板进行提取。
2.根据权利要求1所述的方法,其特征在于,所述待分析页面包括分页显示页面,所述待分析页面的地址信息包括:所述待分析页面统一资源定位符URL的前缀部分、后缀部分,以及待分析的页码标识,所述根据所述地址信息,提取页面源文件内容,包括:
将所述待分析页面URL的前缀部分、待分析的页码标识以及后缀部分组合为目标地址;
通过预置的网页访问协议,获取所述目标地址的源文件内容。
3.根据权利要求1所述的方法,其特征在于,所述信息提取模板包括:根据所述通知消息特征生成的第一正则表达式;
所述方法还包括:
利用所述第一正则表达式,判断所述页面源文件内容中是否存在符合所述通知消息特征信息提取模板的所述目标消息内容。
4.根据权利要求1所述的方法,其特征在于,所述信息提取模板包括:根据预置的关键词以及所述通知消息特征生成的第二正则表达式;
所述方法还包括:
利用所述第二正则表达式,判断所述页面源文件内容中是否存在符合所述通知消息特征并且包含所述关键词信息提取模板的所述目标消息内容。
5.根据权利要求3或4所述的方法,其特征在于,所述通知消息包括文本类通知消息,所述通知消息的特征包括:通知消息的文本描述格式特征。
6.根据权利要求3或4所述的方法,其特征在于,所述通知消息的特征包括:通知消息的发布者账号特征。
7.根据权利要求1所述的方法,其特征在于,还包括:
确定为所述待分析页面配置的提取时间间隔信息;
按照所述提取时间间隔对所述待分析页面重新进行源文件内容的提取以及判断。
8.根据权利要求7所述的方法,其特征在于,不同页面性质的待分析页面对应不同的提取时间间隔。
9.一种提供通知消息的方法,其特征在于,包括:
服务器提供多种候选的信息提取模板,其中,所述信息提取模板根据通知消息的特征生成,每个信息提取模板关联多个待分析页面的地址信息;
根据客户端对目标提取模板的订阅请求,保存所述客户端关联的用户标识与所述目标提取模板之间的对应关系;
接收到所述客户端的信息提取请求时,利用该客户端关联的用户标识对应的目标提取模板,从对应的多个待分析页面中提取目标消息内容,并返回给客户端;
所述方法还包括:接收客户端发送的由第一用户输入的关键词;所述关键词通过操作选项接收;
其中,所述目标提取模板根据所述关键词进行修正,所述目标消息内容根据修正后的目标提取模板进行提取。
10.根据权利要求9所述的方法,其特征在于,在接收到对目标提取模板的订阅请求时,还包括:
提供该目标提取模板关联的多个待分析页面,以及对各待分析页面进行选择的操作选项;
接收客户端提交的对所述待分析页面的选择结果,并保存到该客户端关联的对应关系中;
所述提取目标消息内容,包括:
利用该客户端关联的用户标识对应的目标提取模板,从所述对应关系中保存的多个待分析页面中提取目标消息内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610562656.1/1.html,转载请声明来源钻瓜专利网。