[发明专利]一种基于语音技术的视频标记装置在审
申请号: | 201410633175.6 | 申请日: | 2014-11-07 |
公开(公告)号: | CN104469543A | 公开(公告)日: | 2015-03-25 |
发明(设计)人: | 涂勇;凌静 | 申请(专利权)人: | 重庆晋才富熙科技有限公司 |
主分类号: | H04N21/84 | 分类号: | H04N21/84;H04N21/472;G11B27/10 |
代理公司: | 上海光华专利事务所 31219 | 代理人: | 李强 |
地址: | 400039 重庆市九龙坡*** | 国省代码: | 重庆;85 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语音 技术 视频 标记 装置 | ||
1.一种基于语音技术的视频标记装置,其特征在于,包括:
语音录入模块,用于于视频中选定待标记点,输入语音信息;
预处理模块,用于接收所述语音信息,并对所述语音信息进行采集以形成模拟语音信号;
数模转换模块,用于将所述模拟语音信号转换成数字语音信号;
语音识别模块,用于对所述数字语音信号进行语音文本转换识别,以生成与所述数字语音信号对应的文字信号;
控制处理模块,将所述文字信号添加/嵌入到所述待标记点所在的视频文件中,且在视频播放至所述待标记点时将所述文字信号予以显示出来。
2.根据权利要求1所述的基于语音技术的视频标记装置,其特征在于,所述语音录入模块还用于选定一个标记点以对某一个视频点进行标注。
3.根据权利要求1所述的基于语音技术的视频标记装置,其特征在于,所述语音录入模块还用于选择两个标记点,以对所述两个标记点之间的视频段进行标注。
4.根据权利要求1所述的基于语音技术的视频标记装置,其特征在于,所述预处理模块还用于剔除所述语音信号中的空白信号,以形成具有完整语音内容的新语音信号。
5.根据权利要求1-4任一项所述的基于语音技术的视频标记装置,其特征在于,所述视频标记装置还包括:
文字显示控制模块,用于判断所述文字信号所对应的文字长度是否超过预设值:若所述文字的长度不超过所述预设值,则将所述文字信号嵌入到所述视频文件中,并在视频播放到所述待标记点时显示在播放画面中;若所述文字的长度超过所述预设值,则将所述文字信号叠加到所述视频文件中,并在视频播放到所述待标记点时显示在播放画面外的窗口中。
6.根据权利要求5所述的基于语音技术的视频标记装置,其特征在于,所述预设值为20-60字节。
7.根据权利要求1-4任一项所述的基于语音技术的视频标记装置,其特征在于,所述视频标记装置还包括:
文字校正模块,用于在对所述数字语音信号进行语音文本转换后,将所述数字语音信号对应的文字予以预览显示,并进行乱码检测:若存在乱码,则将所述文字切换至可编辑模式以供学习者对其校正;若不存在乱码,则将所述语音信号予以保存。
8.根据权利要求7所述的基于语音技术的视频标记装置,其特征在于,所述文字校正模块中还包括用于以改变所述文字的显示格式的文字格式编辑模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆晋才富熙科技有限公司,未经重庆晋才富熙科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410633175.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:无线AP固设夹具
- 下一篇:一种多媒体系列文件处理方法及电子设备