[发明专利]一种基于自适应神经网络的视频传输丢包恢复方法无效
申请号: | 201110341336.0 | 申请日: | 2011-11-02 |
公开(公告)号: | CN102413378A | 公开(公告)日: | 2012-04-11 |
发明(设计)人: | 柳毅;王晓耘;周涛;刘大为 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | H04N21/647 | 分类号: | H04N21/647 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 杜军 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自适应 神经网络 视频 传输 恢复 方法 | ||
技术领域
本发明属于视频数据技术领域,涉及一种基于自适应神经网络的视频传输丢包恢复技术。
背景技术
随着3G技术和宽带网络的发展,以及终端的不断推陈出新,视频通信业务将得到长足的发展,因此视频传输系统对实时性和准确性的要求越来越高。在网络的视频传输过程中,影响音频音质的主要因素有时延、静电干扰、丢包和抖动等。其中,丢包问题一直是一个影响视频交互服务质量的最核心因素。尽管网络传输中使用的协议低层有纠错码,但只能解决包内误码,无法解决丢包问题。TCP协议的错误重发机制可以保证网络数据流的正确性,但是它无法满足视频信号传输的实时性要求,特别是在多组广播的情况下,不同的接受者有不同的丢包重发要求,这不仅会增大网络带宽的消耗,而且反过来导致网络传输堵塞,造成更大的数据包丢失。因此,需要对应用层的丢包恢复处理技术加以研究,以提高视频传输的质量。
反向传播自适应神经网络(Back Propagation Neural Network,简称BP网络)是目前应用最为广泛和成功的一种人工神经网络。主要由输入层、隐含层和输出层组成。前向网络是指,只存在不同层神经元之间的权值连接,而不存在同一层神经元之间的连接,而且神经元之间的连接,只是在相邻层之间的连接,而不出现隔层连接的情况。现己证明:一个具有S型激活函数的单隐含层前向网络,只要隐含层有充分多的神经元,它就能够以任意的精度逼近任意一个已知函数,从而表明BP神经网络可以作为一个通用的函数逼近器。将BP神经网络应用于视频传输丢包之中,能克服传统丢包检测视频恢复技术的缺陷,因而具有良好的应用和推广前景。
发明内容
本发明提出一种基于自适应神经网络的视频传输丢包恢复技术,包括网络丢包模型和基于反向传播自适应神经网络(Back Propagation Neural Network, BP网络)的丢包恢复技术,提高视频传输系统的实时性和准确性。
本发明采用如下技术解决方案:首先视频信息作为当前环境的状态输入,输出在这些输入状态下应该使用的视频编码码率。其主要的网络丢包模型使用了基于反向传播自适应神经网络的AHC模型(或称为Actor-Critic模型),其中Actor负责产生当前状态条件下的一个动作,Critic则负责学习预测当前状态条件下可能得到的奖励, Value(x)即为Critic对环境奖励进行预测的函数。学习过程中,Critic接受环境的奖励反馈,更新Value(x),并将奖励预测误差以外界反馈的形式交给Actor模块,用于指导Actor纠正选取动作的策略。其中,Value(x)依据Q-learning更新规则进行学习,Actor则采用 Gaussian ASLA动作函数来实现,Actor与Critic都使用BP(Back-Propagation)神经网络来进行泛化的工作。
本发明具体方法包括以下步骤:
步骤1.选择视频丢包恢复模型的输入变量和输出变量,确定训练样本;具体方法为:
输入变量包括三类网络参数信息及视频信息,所述的三类网络参数信息分别是4个时延状态值、4个抖动状态值、1个丢包率状态值;
所述的视频信息为6个帧复杂度状态值;
输出变量为使用的视频编码码率。
步骤2.数据归一化处理,对输入和输出序列中的数据进行归一化处理,具体是对时延、抖动和帧复杂度的状态变量参数进行规格化处理,转化为[0, 1]范围的值。
步骤 3.视频传输网络丢包模型使用了基于反向传播自适应神经网络的AHC模型(Actor-Critic模型),具体方法是:
通过使用三个神经网络分别用来拟合Critic中的Value(x)、Actor中的μ(x)和α(x),其中μ(x)和α(x)分别表示输出值的均值和标准差;
所述的Actor负责产生当前状态条件下的一个动作,
所述的Critic则负责学习预测当前状态条件下可能得到的奖励;
所述的Value(x)为Critic对环境奖励进行预测的函数;
三个神经网络的输入相同,都是规格化之后的变量状态值,输入层共有15个输入单元为Inputl-Inputl5;每个神经网络有一个隐层,隐层有三个神经元组成为Hiden1-Hiden3;输出层有一个输出神经元为Out;网络中的每个神经元的门限函数使用的是可微的Sigmoid函数。
步骤4.训练BP神经网络的学习过程中;具体方法是:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110341336.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种锁体的闭锁结构
- 下一篇:构建前列腺癌细胞体外浸润模型