[发明专利]一种音频竖线波形图的生成方法有效
申请号: | 201810163270.2 | 申请日: | 2018-02-27 |
公开(公告)号: | CN108399921B | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 郭艳杰 | 申请(专利权)人: | 北京酷我科技有限公司 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L19/16 |
代理公司: | 北京国标律师事务所 11753 | 代理人: | 姚克枫 |
地址: | 100080 北京市海淀区农大*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 竖线 波形 生成 方法 | ||
本发明涉及一种音频竖线波形图的生成方法,步骤如下:创建AVAsset对象,读取音频文件中的音轨AudioTrack,ASBD数据结构,得到音频文件描述信息,获取声道数和采样率,将音频总时间转换为总帧数,得到总采样帧数,将总采样帧数除以波形图宽度像素数,得到每像素需要展现的帧数,生竖线线条时,首先建立宽度像素值个数的矩形区域Layer,然后按每像素一个Layer排列,最后对音频数据进行格式化,设定矩形区域Layer的高度。本发明,获取音频后,将波形图每像素和音频的帧数相对应,根据音频数据格式化的形成波形图的像素,处理速度快,图形准确性好,系统开销较佳,可作为波形图标准生成模块供其他功能调用,易于后期维护及使用。
技术领域
本发明涉及波形图绘制技术领域,具体说是一种音频竖线波形图的生成方法。
背景技术
声波是一种纵波,来回振动导致空气分子产生疏密相间的排列。但是这种二维空间的方式非常不便于表示声音的属性,于是我们取任意一个点,测量这个点的气压随时间的变化,这样就变成了横轴为时间,纵轴为压力变化的图像。气压距离标准值偏差越大,说明振动越剧烈,响度越大,所以振幅越大的波形表示声音越大。波形越紧密说明单位时间内振动的次数越多,频率越高,音高越高。
但是这样有个问题,就是对于单频率的振动,可以很容易表示出来,而我们听到的声音往往是很复杂的频率的叠加。因为各个频率的波形都叠在一起了,就像把很多个周期振幅相位都不等的三角函数图像加在一起,导致波形图难以直观的看出有用的信息。此时,我们就需要频谱来帮忙了。频谱通过对波形的傅里叶变换,把波形中的每个频率拆开来,再在纵轴上展开,越往上频率越高。频谱是三维的,越亮表示在这个频率上越响,越暗表示越弱。所以频谱相对于波形图,是包含有更多信息的,唯一的缺点就是无法表示整体音量总和的大小,所以一般和波形配合观看。
综上,波形是将声音的振幅图形化,频谱是将声音的频率图形化。
波形声音设备(例如麦克风)可以捕捉声音,并将其转换为数值,然后把它们储存到内存或者磁盘中形成波形文件,波形文件的扩展名是.WAV。这样,声音就可以播放了。波形文件是数字化的波形声音,是一种使用二进制表示的串行比特流,它遵循一定的标准或者规范编码,其数据是按时间顺序组织的。
采样的位数指的是描述数字信号所使用的位数。8位(8bit)代表2的8次方=256,16位(16bit)则代表2的16次方=65536/1024=64K。
采样率(采样频率)是一秒钟内对声音信号的采样次数,采样率越高声音音质理论就越真实,音频文件(波形文件)就越大。
我们可以根据波形文件的头信息获取他的采样,然后从录音缓存区中随着时间顺序去读取对应的一个数值,然后通过这个数值去绘制对应的波形图,但目前没有相应的具体算法被公开。
波形文件的头信息即wav格式的音频数据的头部信息基本上是固定不变的,总共44个字节,包括以下内容:
1.RIFF(4个字节)
固定字符串,RIFF是英文Resource Interchange File Format的缩写
2.录音数据长度 +(44 -8) (4个字节)
类型可以是int或long,但必须保证类型占4个字节大小
3.WAVE (4个字节)
固定字符串,表示是wav文件
4.fmt (4个字节)
固定字符串,注意最后有一个空格
5.size1(4个字节)
值为16,如果为18则最后多了2个字节的附加信息
6.format tag(2个字节)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京酷我科技有限公司,未经北京酷我科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810163270.2/2.html,转载请声明来源钻瓜专利网。