[发明专利]一种字幕显示方法及显示设备在审
申请号: | 202111280246.5 | 申请日: | 2021-10-29 |
公开(公告)号: | CN114007145A | 公开(公告)日: | 2022-02-01 |
发明(设计)人: | 段宝山 | 申请(专利权)人: | 青岛海信传媒网络技术有限公司 |
主分类号: | H04N21/488 | 分类号: | H04N21/488;H04N21/435;H04N21/431;H04N21/44 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 逯长明;许伟群 |
地址: | 266100 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 字幕 显示 方法 设备 | ||
本发明公开一种字幕显示方法及显示设备,显示设备接收资源服务器同步发送的视频数据和字幕数据,所述字幕数据包括字幕信息、时间信息和用于指示所述字幕信息的发声对象的目标信息;根据所述视频数据和所述目标信息,计算所述发声对象在视频画面中的相对位置和尺寸信息;根据所述时间信息、所述发声对象在视频画面中的相对位置和尺寸信息,在所述视频画面上显示所述字幕信息。本申请能提升字幕显示的精准性和丰富性,从而为用户,尤其是听力障碍人士提供更好的视频及其字幕的观看体验。
技术领域
本发明涉及显示设备领域,尤其涉及一种字幕显示方法及显示设备。
背景技术
显示设备在播放视频资源时,视频画面中一般显示字幕信息,字幕信息与视频画面中人物的人声和对话同步,通过显示字幕信息,一方面提供语言翻译功能,将人声转化为用户习惯的语言文字,另一方面还能为听力障碍人士提供帮助,便于用户理解视频播放的内容。常规的字幕信息是在视频画面上的固定位置(例如底部)逐句显示,但这种字幕显示方式对于具有听力障碍的用户并不友好,比如视频中多人同时发声,听力障碍人士就无法获知当前字幕对应于哪一人物。
发明内容
为解决上述背景技术中存在的问题,本发明提供一种字幕显示方法及显示设备,以提升字幕显示的精准性和丰富性,从而为用户,尤其是听力障碍人士提供更好的视频及其字幕的观看体验。
第一方面提供一种显示设备,包括:
显示器,用于显示视频及其字幕信息;
通信器,用于与资源服务器通信连接;
控制器,被配置为执行:
接收所述资源服务器同步发送的视频数据和字幕数据,所述字幕数据包括字幕信息、时间信息和用于指示所述字幕信息的发声对象的目标信息;
根据所述视频数据和所述目标信息,计算所述发声对象在视频画面中的相对位置和尺寸信息;
根据所述时间信息、所述发声对象在视频画面中的相对位置和尺寸信息,控制显示器在所述视频画面上显示所述字幕信息。
在第一方面第一种示例性的实现方式中,所述目标信息中包括所述发声对象的形象特征和位置分布,则所述控制器被配置为按照如下方式计算所述发声对象在视频画面中的相对位置和尺寸信息:
从所述视频数据中提取目标视频图像;
根据所述目标信息,从所述目标视频图像中分割及识别出所述发声对象;
计算所述发声对象在图像坐标系中的坐标、以及,计算所述发声对象的宽度和高度。
在第一方面第二种示例性的实现方式中,所述目标信息中包括所述发声对象的状态描述信息,则所述控制器被配置为按照如下方式显示所述字幕信息:
确定与所述状态描述信息相匹配的展示特效;
根据所述展示特效和所述发声对象的尺寸信息,绘制当前的字幕模板;
在达到所述时间信息指示的时间节点时,控制显示器在所述视频画面上发声对象所在的位置按照所述字幕模板,加载显示所述字幕信息。
在第一方面第三种示例性的实现方式中,所述控制器被配置为按照如下方式计算所述发声对象在视频画面中的相对位置和尺寸信息:
调用本地存储的处理模型;
将所述目标视频图像输入至所述处理模型,控制所述处理模型对所述目标视频图像进行处理;
获取所述处理模型的输出结果,所述输出结果包括从所述目标视频图像中分割出的对象元素,以及各对象元素的坐标、宽度和高度;
从所述对象元素中筛选出与所述目标信息相匹配的发声对象。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛海信传媒网络技术有限公司,未经青岛海信传媒网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111280246.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种医用熔喷无纺布生产工艺
- 下一篇:一种传动式叶片生产用的晾晒装置