[发明专利]基于比较的视频字幕错别字词纠错的方法及装置有效
申请号: | 201710187454.8 | 申请日: | 2017-03-27 |
公开(公告)号: | CN106973333B | 公开(公告)日: | 2019-11-12 |
发明(设计)人: | 罗华欣 | 申请(专利权)人: | 山东浪潮商用系统有限公司 |
主分类号: | H04N21/488 | 分类号: | H04N21/488;H04N21/435 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 姜明 |
地址: | 250100 山东省济南市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供了一种基于比较的视频字幕错别字词纠错的方法及装置,涉及智能电视技术领域,用以降低字幕中出现错别字的现象,提高用户体验。所述方法包括:获取n个字幕文件,并在所述n个字幕文件中确定出应用字幕文件及备用字幕文件;所述n为大于2的整数;所述应用字幕文件是播放装置待使用的字幕文件;将所述n个字幕文件中的每个字幕文件划分为至少一个字幕数组;其中,所述字幕数组中包含有字幕条目及所述字幕条目对应的播放时间;根据所述备用字幕文件的至少一个字幕数组,依次对应用字幕文件的至少一个字幕数组进行字幕检验;在检验出所述至少一个字幕数组中存在错别字词时,纠正所述错别字词。 | ||
搜索关键词: | 基于 比较 视频 字幕 错别字 纠错 方法 装置 | ||
【主权项】:
1.一种基于比较的视频字幕错别字词纠错的方法,其特征在于,包括:获取n个字幕文件,并在所述n个字幕文件中确定出应用字幕文件及备用字幕文件;所述n为大于2的整数;所述应用字幕文件是播放装置待使用的字幕文件;将所述n个字幕文件中的每个字幕文件划分为至少一个字幕数组;其中,所述字幕数组中包含有字幕条目及所述字幕条目对应的播放时间;根据所述备用字幕文件的至少一个字幕数组,依次对应用字幕文件的字幕数组进行字幕检验,在检验出所述应用字幕文件的字幕数组中存在错别字词时,纠正所述错别字词包括:将第i个字幕数组中的字幕条目与所有备用字幕文件中的所有字幕数组的字幕条目进行字符串匹配,确定所有备用字幕文件中的所有字幕数组的字幕条目中是否存在至少两个字幕条目与所述第i个字幕数组中的字幕条目相同;i为大于0,不大于应用字幕文件划分的字幕数组的总个数的整数;若不存在,则在所述各个备用字幕文件中确定出各个校验字幕数组;所述校验字幕数组中的字幕条目对应的播放时间与所述第i个字幕数组中的 字幕条目对应的播放时间间隔不超过预设阈值;将所述各个校验字幕数组中的字幕条目进行比较,确定是否存在相似字幕条目;若存在相似字幕条目,且相似字幕条目的数量达到预设相似阈值,则确定所述第i个字幕数组中的字幕条目存在错别字词;在检验出所述第i个字幕数组中存在错别字词时,纠正所述错别字词;更新i的取值,继续检验应用字幕文件的下一个字幕数组。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东浪潮商用系统有限公司,未经山东浪潮商用系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710187454.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种弹幕消息处理方法、解析方法及系统
- 下一篇:一种无线路由器收纳装置