[发明专利]一种互联网视听节目地址自动化解析方法及系统在审
申请号: | 202210499616.2 | 申请日: | 2022-05-09 |
公开(公告)号: | CN115002068A | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 李宏健;郭忠武;殷松迁;冯慧;李国华;王荣芳;韩煜;睢连杰 | 申请(专利权)人: | 北京市博汇科技股份有限公司 |
主分类号: | H04L61/103 | 分类号: | H04L61/103;H04L67/02;H04L67/51;H04L67/60 |
代理公司: | 北京知呱呱知识产权代理有限公司 11577 | 代理人: | 郑兴旺 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 互联网 视听 节目 地址 自动化 解析 方法 系统 | ||
本发明公开了一种互联网视听节目地址自动化解析方法及系统,基于服务对浏览器窗口进行编排,浏览器不限于开源或者闭源,不限制平台,驱动浏览器窗口并行加载节目,配合自研解析引擎,在浏览器窗口获取到对应节目请求的响应内容,将响应内容按照适配的规则进行解析,获取到节目视频的真实地址,通过引擎将真实地址回推给服务,服务将真实地址交由下载器进行下载。
技术领域
本发明涉及互联网技术领域,具体涉及一种互联网视听节目地址自动化解析方法及系统。
背景技术
现有互联网视听节目地址解析主要有以下方案:方案一、通过对网站的请求进行抓包分析,需要人工解析网页中节目真实地址或者解析节目地址所需要携带的内容(比如请求头或者网站生成的一些混淆参数),然后形成逻辑,交由服务去自动化执行解析;方案二、基于开源windows浏览器内核进行视频地址解析,借助浏览器开放的API接口,通过操控浏览器的API接口来解析视频地址。
目前方案一的方法只适用于一些规模较小的网站,针对一些规模较大的网站,比如爱奇艺、腾讯视频,对于视频地址的加密极其其严格,仅通过人为抓包分析是很难解析出其真实地址,尤其是请求所需的混淆参数。方案二的方法只能在Windows平台运行,并且由于是基于开源的浏览器内核,因此会出现版本的升级,就可能会出现API接口的变更,就需要人为去跟踪浏览器的版本升级迭代内容,对应调整自身的应用程序。
发明内容
为此,本发明提供一种互联网视听节目地址自动化解析方法及系统,以解决现有的互联网视听节目地址解析方案存在的通过人为抓包分析很难解析出其真实地址、基于开源windows浏览器内核进行视频地址解析需要人为去跟踪浏览器的版本升级迭代内容,对应调整自身的应用程序的问题。
为了实现上述目的,本发明提供如下技术方案:
根据本发明实施例的第一方面,提出了一种互联网视听节目地址自动化解析方法,所述方法包括:
在浏览器端加载视听节目地址解析引擎;
接收请求方发起的视听节目请求,启动浏览器窗口调用所述请求中包含的节目地址以向响应方发起节目请求;
通过所述解析引擎获取响应方发送的所述请求的响应结果,并根据预设解析规则对所述响应结果进行地址解析,获取视听节目真实地址,将解析结果返回给请求方。
进一步地,所述方法还包括:
驱动浏览器启动多个空闲窗口并放入窗口池,所述窗口池用于窗口实例的存/取操作及状态维护;
解析操作时,从所述窗口池中获取空闲窗口向响应方进行请求。
进一步地,所述方法还包括:
对当前使用的窗口进行锁定以防止被其他请求误用;
解析操作完成后将浏览器窗口放回窗口池以供其它请求再次使用。
进一步地,所述方法还包括:
通过所述解析引擎对接入浏览器的所有请求进行提取,匹配内置的解析适配规则,判断请求是否需要进行地址解析,针对需要进行地址解析的请求,获取其响应内容并根据配置的解析规则进行地址解析。
进一步地,所述方法还包括:
通过抓包对不同网站视频规则进行分析和适配,将规则内置入引擎脚本。
进一步地,所述方法还包括:
基于服务实现驱动浏览器载入解析引擎载入、浏览器窗口的获取和归还、获取引擎的解析结果并返回给请求方。
进一步地,所述方法还包括:
在非Windows系统的浏览器中,基于容器化技术中模拟出Windows环境以进行地址解析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市博汇科技股份有限公司,未经北京市博汇科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210499616.2/2.html,转载请声明来源钻瓜专利网。