[发明专利]落地页处理方法、装置、设备和介质有效
申请号: | 202010015501.2 | 申请日: | 2020-01-07 |
公开(公告)号: | CN113159807B | 公开(公告)日: | 2023-10-13 |
发明(设计)人: | 路华生;刘林 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06Q30/0251 | 分类号: | G06Q30/0251;G06Q30/0241 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 落地 处理 方法 装置 设备 介质 | ||
本申请公开了一种落地页处理方法、装置、设备和介质,涉及智能搜索技术领域。具体实现方案为:获取广告页面对应的落地页;识别所述落地页中包含的广告转化组件;建立所述广告转化组件与所述广告页面的绑定关系。本申请实施例能够基于该绑定关系准确确定落地页中所包含的广告转化组件,进而使客户端在展示落地页的摘要信息时,能够基于绑定关系将广告转化组件直接地展示给用户,解决了用户需多次操作才能查找到广告转化组件的问题,提高了广告的转化效率。
技术领域
本申请涉及计算机技术领域,尤其涉及一种智能搜索技术,具体涉及一种落地页处理方法、装置、设备和介质。
背景技术
一般情况下,广告页面对应的落地页中会包含广告的转化组件,用户可以通过点击广告的转化组件与广告方取得联系或获取广告相关的进一步信息。
然而,如何确定落地页中包含哪些转化组件,目前还没有具体的实现方案。
发明内容
本申请实施例提供一种落地页处理方法、装置、设备和介质,以解决如何确定落地页中包含的广告转化组件的问题。
本申请实施例公开了一种落地页处理方法,该方法包括:
获取广告页面对应的落地页;
识别所述落地页中包含的广告转化组件;
建立所述广告转化组件与所述广告页面的绑定关系。
上述实施例具有如下优点或有益效果:识别广告页面对应落地页中的广告转化组件,并建立广告转化组件与广告页面的绑定关系,从而可以基于该绑定关系准确确定落地页中所包含的广告转化组件。
进一步地,获取广告页面对应的落地页,包括:
从预设数据库中获取广告页面对应的落地页的地址信息;
基于所述地址信息,通过爬虫浏览器爬取落地页。
据此,上述实施例具有如下优点或有益效果:通过根据落地页的地址信息爬取落地页,从而便于后续对落地页进行分析确定其中包含的广告转化组件,并建立绑定关系,实现全面地对落地页进行分析。
进一步地,识别所述落地页中包含的广告转化组件,包括:
通过字符识别,查找所述落地页的超文本标记语言HTML文件中的预设标签;
通过字符串匹配,获得位于所述预设标签后满足设定条件的字符串,将该字符串对应的组件作为广告转化组件。
据此,上述实施例具有如下优点或有益效果:通过查找预设标签,从而便于更加快速高效地查找到预设标签后的内容,通过字符串匹配,将满足预设条件的字符串对应的组件作为广告转化组件,从而准确地识别落地页中的广告转化组件。
进一步地,识别所述落地页中包含的广告转化组件,包括:
查找所述落地页的HTML文件中的dom节点;
对所述dom节点进行模拟点击;
截取模拟点击后发送的网络请求;
通过字符串匹配,获得所述网络请求中包含的满足预设条件的字符串,将该字符串对应的组件作为广告转化组件。
据此,上述实施例具有如下优点或有益效果:能够准确的识别通过前端脚本动态绑定的广告转化组件,以实现更加全面高效地对落地页中广告转化组件进行识别,避免了通过字符串匹配未能识别出广告转化组件导致遗漏广告转化组件的问题。
进一步地,在建立所述广告转化组件与所述广告页面的绑定关系之后,所述方法还包括:
接收客户端发送的搜索请求,根据所述搜索请求获取搜索结果列表;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010015501.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:页面生成方法、装置、设备和介质
- 下一篇:一种薄膜处理系统