[发明专利]一种英语有声影像资料自动加注英语字幕的方法在审
申请号: | 201610345908.5 | 申请日: | 2016-05-23 |
公开(公告)号: | CN105845126A | 公开(公告)日: | 2016-08-10 |
发明(设计)人: | 姜华;顾艳;胡帅;丛岩;周健敏;杜连艳;李一飞;姚大伟 | 申请(专利权)人: | 渤海大学 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/02;G10L21/06;G10L25/24;G10L25/45;G10L25/48;G10L25/57;H04N21/435;H04N21/439 |
代理公司: | 北京远大卓悦知识产权代理事务所(普通合伙) 11369 | 代理人: | 周明飞 |
地址: | 121000 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种英语有声影像资料自动加注英语字幕的方法,包括如下步骤:步骤一、获取有声影像中语音信号x(n)及该语音在有声影像中所对应的时间;步骤二、对原始信号x(n)进行预加重和加汉明窗;步骤三、进行离散傅里叶变换得到频谱;步骤四、将频谱系数用三角滤波器进行滤波处理,得到每个滤波器输出的对数能量;步骤五、进行离散余弦变换,得到MFCC参数;步骤六、提取MFCC特征向量;步骤七、将MFCC特征向量与数据库中存储的单词的特征向量进行匹配,以得到相匹配的单词文字;步骤八、将相匹配的单词文字在所对应的时间上显示到声影像资料中。 | ||
搜索关键词: | 一种 英语 有声 影像 资料 自动 加注 字幕 方法 | ||
【主权项】:
一种英语有声影像资料自动加注英语字幕的方法,其特征在于,包括如下步骤:步骤一、获取有声影像中语音信号x(n)及该语音在有声影像中所对应的时间,其中n为采样点标号;步骤二、对原始信号x(n)进行预加重,得到加重后信号y(n)=x(n)‑0.95x(n‑1),加汉明窗sw(n)=y(n)*w(n)其中,w(n)=0.54‑0.46cos(2nπ/N‑1),n=0,1,Κ,N‑1,sw(n)为加窗后的信号,N为最后一个采样点的标号;步骤三、对sw(n)进行离散傅里叶变换得到频谱:![]()
其中,j为虚数单位;步骤四、将频谱系数用三角滤波器进行滤波处理,得到每个滤波器输出的对数能量:![]()
其中,M为滤波器的个数;步骤五、进行离散余弦变换,得到MFCC参数:![]()
步骤六、将对数能量和C1,C2,Κ,C12组成一个13维特征向量C,并将C连续进行两次差分,得到ΔC和ΔΔC,将C、ΔC、ΔΔC组成的39维特征向量作为MFCC特征向量;步骤七、将MFCC特征向量与数据库中存储的单词的特征向量进行匹配,以得到相匹配的单词文字;步骤八、将相匹配的单词文字在所对应的时间上显示到声影像资料中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于渤海大学,未经渤海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610345908.5/,转载请声明来源钻瓜专利网。
- 上一篇:内部电压发生电路及包括其的半导体器件
- 下一篇:旋转自锁打击鼓垫装置