[发明专利]一种视听字幕制作系统及方法有效
申请号: | 201210389708.1 | 申请日: | 2012-10-15 |
公开(公告)号: | CN102937972A | 公开(公告)日: | 2013-02-20 |
发明(设计)人: | 张云梯;庄智象;黄卫;黄河;张中良 | 申请(专利权)人: | 上海外教社信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G10L15/26;G10L15/14 |
代理公司: | 上海百一领御专利代理事务所(普通合伙) 31243 | 代理人: | 马育麟 |
地址: | 200083 上海市虹*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种视听字幕制作系统及方法,所述系统包括原始文本处理模块、注音模块、原始声音处理模块、强制切分模块、切分可信度评估模块、错误处理模块、字幕生成模块。本发明能自动处理原始文本,分割为限定长度的句子或短语;采用形近词替代等方法自动处理非登录词,建立多发音注音网络;将注音网络展开为隐含马尔科夫识别语音对齐网络,使用强容错隐含马尔科夫声学模型对文本自动对齐强制切分;通过语音识别技术对每个切分段的切分结果进行可信度评估,可很容易发现切分错误以便进一步处理;直接根据切分结果生成各种格式适用于各种设备的视听字幕文件。借此,本发明可在无人工干预或很少人工干预的情况下直接得到高质量的视听字幕文件。 | ||
搜索关键词: | 一种 视听 字幕 制作 系统 方法 | ||
【主权项】:
一种视听字幕制作系统,其特征在于,所述系统包括:原始文本处理模块,用于将输入的原始文本分词后按指定规则分割为合适长度的句子或短语,并将所述句子或短语发送到注音模块;注音模块,用于处理所述句子或短语中的非登录词,然后通过查注音词典生成注音网络,并将所述注音网络发送到强制切分模块; 原始声音处理模块,用于将输入的原始声音处理成预定要求的声音流,并将所述声音流发送到强制切分模块;强制切分模块,用于将所述注音网络切分为隐含马尔科夫识别语音的对齐网络,然后将所述声音流提取为特征流并在所述对齐网络对齐,并将切分结果输入到切分可信度评估模块; 切分可信度评估模块,用于通过语音识别对所述切分结果中每个切分段进行可信度评估得到切分可信度评估结果,若所述切分可信度评估结果达到预定值,则将所述切分结果直接发送到字幕生成模块,否则将所述切分可信度评估结果发送到错误处理模块;错误处理模块,用于显示所述切分可信度评估结果,判断是所述原始文本有误还是所述切分结果需要人工微调,若所述切分结果需要人工微调则人工微调所述切分结果并发送到字幕生成模块,若是所述原始文本有误则人工修改原始文本后重新交由所述原始文本处理模块切分;字幕生成模块,用于结合预定的字幕文件格式,将所述切分结果输出字幕文件。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海外教社信息技术有限公司,未经上海外教社信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210389708.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种网页搜索设备和方法
- 下一篇:一种多节点固件升级方法和装置