[发明专利]一种互联网音视频下载方法无效
申请号: | 201110431579.3 | 申请日: | 2011-12-21 |
公开(公告)号: | CN102510536A | 公开(公告)日: | 2012-06-20 |
发明(设计)人: | 林卫国;王利;杨皓然;孙付栋 | 申请(专利权)人: | 中国传媒大学 |
主分类号: | H04N21/438 | 分类号: | H04N21/438;H04N21/4385;H04N21/64 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100024*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 互联网 视频 下载 方法 | ||
技术领域
本发明涉及网络通信技术领域,更具体地,本发明涉及一种互联网音视频下载的方法。
背景技术
监管部门需要对其在线音视频节目进行有效地发现和下载,以实现监看和管理。互联网音视频节目下载就是随着近年来网络音视频节目的增长,尤其是FLV格式的视频的增长而发展起来。互联网音视频下载的关键在于网络音视频节目地址的发现,该问题面临的困难主要是,包含音视频节目的页面复杂的脚本难以处理,以及FLV视频的地址难以从页面分析获得。用户在观看视频的过程中,没法下载,在线观看又要面对不断的缓冲,而对这些视频文件的分析处理也需要下载文件。因此,对于监管部门来说,高效的音视频文件地址解析与下载具有重要的现实意义。
目前存在一些类似功能的专门针对FLV视频的地址解析与下载软件,但这些软件处理站点数量有限,不够灵活。在解析地址方面,一般还局限在通过后缀名来判定,对目前的视频节目中包含复杂脚本和FLV格式视频的网络地址无法有效获取。在下载方面,一般只是对单个任务进行处理,不能实现多任务并发的工作。在软件架构方面,基本属于客户端应用,不适应大规模的处理。
发明内容
为了克服互联网音视频下载过程中网络音视频节目地址解析面临的无法处理具有复杂脚本和FLV格式视频的网络地址而导致不能下载该音视频的问题,本发明提出了一种互联网音视频下载方法。
一种互联网音视频下载方法,其特征在于包括以下步骤:
1)、将音视频节目播放网页链接获取,并将这些链接放入解析队列;
2)、取出音视频节目播放网页链接,用浏览器去访问,以便网页中的播放器播放该音视频;
3)、所述播放器通过网络请求所述网页,所述浏览器显示请求结果,并返回页面中的超链接页面元素再次进行请求,当请求的音视频播放器已经就绪,音视频播放器根据页面传递的参数从远程读取数据源并进行播放;
4)、在所述音视频播放器与网站进行交互的过程中,获取二者之间交互的信息;
交互的信息至少包括音视频文件地址结构,所述音视频文件地址结构包括seed、key1、key2、fileid和segs信息;应用系统当前时间和随机数算出sid,sid为最终音视频文件网络地址的一部分;应用fileid和seed字段生成fileID,fileID为最终音视频文件网络地址的一部分;应用key1和key2字段生成key,key为最终音视频文件网络地址的一部分;将sid、fileID、key合并起来,得到音视频文件的首段网络地址;若音视频未分段,即为该音视频文件的网络地址;若音视频分段,根据segs字段的值,修改首段网络地址的部分值,即可得到每段音视频文件的网络地址;
5)、将所获得的音视频节目地址放入下载队列进行下载。
进一步,其特征在于:
步骤2)中,当所述音视频播放器不能自动播放时:通过识别页面是否包含Object或者Embed标签,将不包含所述标签内容的页面过滤;通过对页面中包含的Object或者Embed元素的尺寸进行识别,将不包含视频节目的页面过滤;通过对页面中包含的Object或者Embed元素的尺寸信息的识别,将音视频播放器与广告的Object或者Embed元素相区分;通过对网页中播放器的尺寸结构和控制按钮分布进行确定,对按钮分布的固定相对位置的配置,调用JavaScript脚本触发事件,实现音视频网站播放器的自动点击播放。
进一步,其特征在于:
步骤4)中,在所述音视频播放器与网站进行交互的过程中,为每个音视频网站建立特征描述集,每个特征描述集描述了音视频网站的特征信息;所述网站的特征信息包括音视频播放器类型、网站音视频文件类型或音视频文件地址字符串特征之一或多种。
进一步,其特征在于:
步骤5)中,将已经解析出来的音视频节目的真实地址放入下载队列,通过并发机制,实现多任务下载。
本发明充分利用用户对浏览音视频页面的访问特性与音视频节目地址类的HTTP网络特征,通过分析截获的HTTP头信息,实现了对网络音视频地址解析的较通用判定,最终实现互联网音视频节目的下载。
利用浏览器控制与网络地址监听相结合的方式来发现网络音视频地址,并应用浏览器判定页面是否包含音视频播放器和控制播放器的播放,解决音视频网页脚本复杂以及FLV难以从页面获取地址的问题,同时,解决了这类用户点击才能播放的这类网页的自动化地址发现问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国传媒大学,未经中国传媒大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110431579.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高浓度餐厨垃圾厌氧处理工艺
- 下一篇:板材厚度和重量在线检测一体机