[发明专利]一种改进的IFFT图声转换方法有效

申请号：	201410152883.8	申请日：	2014-04-17
公开（公告）号：	CN103956161B	公开（公告）日：	2017-04-26
发明（设计）人：	汪剑鸣;原野;王琦	申请（专利权）人：	天津工业大学
主分类号：	G10L13/02	分类号：	G10L13/02;G10L19/02;G06K9/00
代理公司：	暂无信息	代理人：	暂无信息
地址：	300387 ***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种改进的IFFT图声转换方法，属于助盲领域。本发明可以将图像转换为有效频率范围内的声音信号。本发明通过以下步骤得以实现(1)设定图声转换后持续时间T，采样点数NS；(2)将输入图像转换为灰度图像；(3)提取一列像素；(4)将图像像素映射为声音的频域幅值；(5)对提取的像素进行数据变换首先拓宽频带提高声音信号的丰满度，然后对声音信号进行移频提高听觉舒适度，最后将数据进行对称变换；(6)对变化后的数据进行IFFT变换，将图像转换为成声音时域信号；(7)判断数据是否为图像的最后一列，若是则图声转换完成；若不是，则提取图像的下一列，重复步骤(3)到(6)，直到整幅图像转换成声音。
搜索关键词：	一种改进 ifft 转换方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种改进的IFFT图声转换方法，包括下列步骤：(1)设定图声转换后持续时间T，采样点数Ns；采样频率为最小的频率间隔，即频率分辨率为(2)输入一幅M×N的图像，将其转换为灰度图像，使像素值介于0‑255之间；(3)提取(2)中的一列像素，该列像素的像素值为Xj(0)，Xj(1)，…，Xj(N‑1)，j为提取图像像素所在列序号；(4)根据vOICe系统的映射原理，将图像像素映射为声音的频域幅值；将Xj(0)和Xj(N‑1)分别映射为声音信号中最高频与最低频对应的幅值，相邻像素对应的频率分辨率为Δf；(5)对(4)中提取的像素进行数据变换，具体步骤如下：(a)设满足要求的声音信号的频带宽度为ΔFHz，其对应的频率分量数为为拓宽频带，相邻像素间插入个频率分量，其幅值为“0”；(b)为了提高声音信号的听觉舒适度，将(a)中的数据频移至图声转换的有效频率范围f∈[f1，f2]＝[f1，f1+ΔF]Hz内；为了获得声音信号完整的频域响应，在f1前补充个频率分量，f2后补充个频率分量，将其幅值均设为“0”；(c)根据实数信号FFT结果的对称性，将(b)中进行对称变换，为了减少计算量，将对称部分用“0”代替；(6)对数据变化后的(5)中的数据进行IFFT变换，将图像转换为成声音时域信号；(7)判断(6)中的数据是否为图像的最后一列，若是则图声转换完成；若不是，则取图像的下一列，重复步骤(3)到(6)，直到整幅图像转换成声音。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于天津工业大学，未经天津工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201410152883.8/，转载请声明来源钻瓜专利网。

上一篇：爪形干式真空泵的双向同步螺旋组合式密封结构
下一篇：空压机余热回收系统

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L13-00 语音合成；文本-语音合成系统
G10L13-02 .产生合成语音的方法；语音合成设备
G10L13-06 .语音合成设备中使用的基本语音单位；级联规则
G10L13-08 .文本分析或文本以外的语音合成参数的产生，例如语义图翻译为音素、韵律产生、重音或声调测定
G10L13-04 ..语音合成系统的零部件，例如合成设备结构或存储器管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种改进的IFFT图声转换方法有效

专利文献下载