[发明专利]字幕校正方法和装置有效
申请号: | 201410254927.8 | 申请日: | 2014-06-10 |
公开(公告)号: | CN104093037A | 公开(公告)日: | 2014-10-08 |
发明(设计)人: | 傅鸿城;赵伟;曹海峰 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | H04N21/235 | 分类号: | H04N21/235;G06F17/30 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 滕一斌 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字幕 校正 方法 装置 | ||
1.一种字幕校正方法,其特征在于,所述方法包括:
获取多媒体文件的反馈数据,所述反馈数据是针对所述多媒体文件的字幕文件的错误所反馈的数据;
根据所述反馈数据识别所述多媒体文件的字幕文件的错误类型;
根据所述错误类型对所述多媒体文件的字幕文件进行校正。
2.根据权利要求1所述的方法,其特征在于,所述根据所述反馈数据识别所述多媒体文件的字幕文件的错误类型,包括:
若所述反馈数据为按钮反馈数据,则提取所述按钮反馈数据中携带的错误类型,作为所述字幕文件的错误类型,所述按钮反馈数据是通过按压错误类型按钮上报的反馈数据,每个错误类型按钮对应无词、时序问题、内容问题和无错误共四种错误类型中的任意一种。
3.根据权利要求1所述的方法,其特征在于,所述根据所述反馈数据识别所述多媒体文件的字幕文件的错误类型,包括:
若所述反馈数据为文本反馈数据,则提取所述文本反馈数据中的至少一个关键词,所述文本反馈数据是通过文本上报的反馈数据;
将所述至少一个关键词输入错误类型分类器中,识别出对应的错误类型;所述错误类型分类器是预先通过文本反馈数据样本集训练得到的,所述错误类型包括无词、时序问题、内容问题和无错误中的至少一种。
4.根据权利要求3所述的方法,其特征在于,所述将所述至少一个关键词输入错误类型分类器中,识别出对应的错误类型之前,还包括:
获取至少一个文本反馈数据以及每个文本反馈数据所对应的错误类型,生成所述文本反馈数据样本集;
提取所述文本反馈数据样本集中文本反馈数据的关键词,得到至少一个关键词;
计算每个关键词在不同错误类型中出现的概率,筛选出每个错误类型所对应的特征关键词;
根据每个错误类型所对应的特征关键词以及每个特征关键词在所述错误类型中出现的概率,训练得到所述错误类型分类器。
5.根据权利要求1至4任一所述的方法,其特征在于,所述根据所述错误类型对所述多媒体文件的字幕文件进行校正,包括:
若识别出的所述错误类型为无词,则搜索与所述多媒体文件匹配的字幕文件;
若识别出的所述错误类型为时序问题和/或内容问题,则向目标终端发送所述多媒体文件的标识和错误类型,所述目标终端为校正人员所使用的终端;
若识别出的所述错误类型为无错误,不做处理或继续下一个多媒体文件的字幕文件的校正。
6.根据权利要求1至4任一所述的方法,其特征在于,所述方法还包括:
在获取所述多媒体文件的反馈数据失败时,分析所述多媒体文件的音频波形特征;
根据所述多媒体文件的音频波形特征确定所述多媒体文件中语音信号的开始时刻和结束时刻;
根据所述多媒体文件中语音信号的开始时刻和结束时刻以及所述字幕文件中的播放时间轴确定所述字幕文件是否存在时序问题。
7.根据权利要求1至4任一所述的方法,其特征在于,所述获取多媒体文件的反馈数据,包括:
获取至少一个用户针对所述多媒体文件上报的至少一个反馈数据;
根据预设条件对所述至少一个反馈数据进行过滤,得到有效的反馈数据;所述预设条件包括:
当前反馈数据所对应的用户所对应的等级高于预定等级;和/或,
当前反馈数据所对应的用户在指定时间段内播放多媒体文件的频率高于预定频率;和/或,
当前反馈数据所对应的用户历史反馈的反馈数据的有效性高于预定阈值。
8.根据权利要求1至4任一所述的方法,其特征在于,所述根据所述错误类型对所述多媒体文件的字幕文件进行校正之前,还包括:
若针对所述多媒体文件的字幕文件所对应的反馈数据不止1个,则计算识别出的各个错误类型的出现概率,选择出现概率达到预定概率的错误类型作为所述多媒体文件的字幕文件所对应的错误类型。
9.一种字幕校正装置,其特征在于,所述装置包括:
第一获取模块,用于获取多媒体文件的反馈数据,所述反馈数据是针对所述多媒体文件的字幕文件的错误所反馈的数据;
第一识别模块,用于根据所述反馈数据识别所述多媒体文件的字幕文件的错误类型;
字幕校正模块,用于根据所述错误类型对所述多媒体文件的字幕文件进行校正。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410254927.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:在线媒体播放方法、服务器及系统
- 下一篇:图像解码方法和图像解码设备