[发明专利]一种音频流量的压缩算法在审

申请号：	202110682109.8	申请日：	2021-06-20
公开（公告）号：	CN113436637A	公开（公告）日：	2021-09-24
发明（设计）人：	黄超;蒋泽飞	申请（专利权）人：	杭州登虹科技有限公司
主分类号：	G10L21/0208	分类号：	G10L21/0208;G10L21/0232;G10L21/0316;G10L19/00
代理公司：	暂无信息	代理人：	暂无信息
地址：	310012 浙江省杭州市西***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种音频流量压缩算法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种音频流量的压缩算法，包括以下步骤；步骤一、进行去噪处理；步骤二、对去噪处理后的音频数据计算功率谱密度，如果功率谱密度小于所设定的阈值，则把音频数据包标识为音频静态帧格式，并把向服务器发送的音频数据包数据字段填为空；步骤三、服务端收到带有音频静态帧的数据包之后，对音频数据进行转发；步骤四、客户端PC软件或APP软件收到服务端转发的音频数据包之后，在播放的时候客户端对带有音频静态帧的数据包标识为静音。本发明能够对前端摄像机芯片编码输出的音频数据的噪声进行去除，可以改善客户端播放音频声音的用户体验，减轻了服务端的流量压力，降低了服务器的使用费用。

技术领域

本发明涉及电子信息技术领域，具体为一种音频流量的压缩算法。

背景技术

音频压缩技术主要是对原始的数字音频信号(PCM)进行编码，编码成G.711A、G.711U、AAC、Opus等格式进行传输，或者在不损失有用音频信息的基础上，对一些可忽略的音频数据进行滤除，减少传输过程中占用网络带宽的压力，但是，在对原始PCM格式的音频信号进行编码的时候，会使得音频信号出现大量的噪声和失真的现象，而且，直接采用PCM格式的音频数据进行存储和传输会占用大量的物理空间和网络带宽，所以，数字音频信号在数据存储和传输上有尤为突出的优点，也有相应的缺点。数字音频压缩编码是在确保音频信号在听觉上不产生失真的情况下，对音频数据进行尽可能的压缩，而且，对声音中冗余的信息进行去除，冗余成分指的是音频中不能被人耳感知到的信息，这些冗余信息对确定声音的音色，音调等信息没有任何的帮助，所以，在安防行业摄像机音频码流网络传输中同样存在相应急需解决的问题。

摄像机编码输出的音频数据存在一些无用的噪声信息和用户认为无用的音频信息，一旦接入平台的摄像机达到千万甚至上亿级别，这么多摄像机在向服务器同时传送巨量的音频数据的时候，会对服务器造成较大的流量压力，为了节省服务器的流量费用，需要对摄像机传输的音频数据进行优化。

发明内容

本发明的目的在于提供一种音频流量的压缩算法，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：一种音频流量的压缩算法，包括以下步骤；

步骤一、进行去噪处理；

步骤二、对去噪处理后的音频数据计算功率谱密度，如果功率谱密度小于所设定的阈值，则把音频数据包标识为音频静态帧格式，并把向服务器发送的音频数据包数据字段填为空；

步骤三、服务端收到带有音频静态帧的数据包之后，对音频数据进行转发；

步骤四、客户端PC软件或APP软件收到服务端转发的音频数据包之后，在播放的时候客户端对带有音频静态帧的数据包标识为静音。

优选的，在所述客户端PC软件或者APP中有对音频的功率谱密度值配置的配置项。

优选的，用户可以根据当前监控的周围环境声音情况，通过配置项对功率谱密度值进行调节，选择要保留的有用的声音信息，滤除用户认为无用的声音信息。

本发明提出的一种音频流量的压缩算法，有益效果在于：

1、本发明能够对前端摄像机芯片编码输出的音频数据的噪声进行去除，可以改善客户端播放音频声音的用户体验；