[发明专利]信息处理方法、设备和介质有效
申请号: | 202110307569.2 | 申请日: | 2021-03-23 |
公开(公告)号: | CN113066498B | 公开(公告)日: | 2022-12-30 |
发明(设计)人: | 胡其斌;董宗保;单益峰 | 申请(专利权)人: | 上海掌门科技有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;H04N5/278;H04N21/488 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 田宏宾 |
地址: | 201806 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 方法 设备 介质 | ||
1.一种信息处理方法,其特征在于,包括:
将字幕对应的语音转换为声学基元,以及,确定所述语音的时间信息;
根据预先建立的映射关系,确定与所述声学基元对应的内容单元,所述内容单元为所述字幕对应的文本中的内容单元,所述映射关系包括所述声学基元与所述内容单元之间的映射关系;
基于所述时间信息和所述内容单元,构建包含时间信息的文本,并基于所述包含时间信息的文本,构建字幕文件;
其中,所述映射关系具体为:所述内容单元对应的内容单元信息,与所述声学基元对应的关联信息的对应关系;
所述根据预先建立的映射关系,确定与所述声学基元对应的内容单元,所述内容单元为所述字幕对应的文本中的内容单元,包括:
基于所述声学基元确定关联信息;
在预先建立的内容单元信息与关联信息的对应关系中,查找与所述关联信息对应的内容单元信息;
将所述内容单元信息,对应的内容单元确定为所述声学单元对应的内容单元;
所述内容单元信息包括内容单元的文字编码;
所述关联信息为:文字的声学基元,或者,文字的声学基元对应的数字索引;
所述内容单元信息与关联信息的对应关系,采用如下方式建立:
将所述字幕对应的文本中的每个文字,转换为文字编码;
获取所述每个文字的声学基元,并确定所述声学基元对应的关联信息;
建立所述文字编码与所述关联信息的对应关系。
2.根据权利要求1所述的方法,其特征在于,所述将字幕对应的语音转换为声学基元,包括:
采用预先建立的深度神经网络模型,将字幕对应的语音转换为声学基元,所述深度神经网络模型用于将语音转换为声学基元。
3.根据权利要求1所述的方法,其特征在于,还包括:
在拍摄视频时,采集所述视频中的语音,作为所述字幕对应的语音。
4.根据权利要求1所述的方法,其特征在于,所述基于所述时间信息和所述内容单元,构建包含时间信息的文本,包括:
对应所述内容单元组成的句子,添加所述句子对应的时间信息,以得到包含时间信息的句子;
按所述包含时间信息的句子的时间顺序,依序排列所述包含时间信息的句子,组成包含时间信息的文本。
5.根据权利要求1所述的方法,其特征在于,还包括:
将所述字幕文件与所述字幕文件对应的视频进行合成,以得到包含字幕的视频。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述声学基元为汉字的拼音,所述内容单元为汉字。
7.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的方法。
8.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-6中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海掌门科技有限公司,未经上海掌门科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110307569.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种磁保持功率继电器
- 下一篇:一种淀粉基原料生产燃料乙醇的节能工艺