[发明专利]一种唇音同步的测试方法、装置、电子设备和存储介质在审
| 申请号: | 202211599754.4 | 申请日: | 2022-12-12 |
| 公开(公告)号: | CN116437068A | 公开(公告)日: | 2023-07-14 |
| 发明(设计)人: | 陈慧 | 申请(专利权)人: | 北京飞讯数码科技有限公司 |
| 主分类号: | H04N17/00 | 分类号: | H04N17/00;H04N7/14 |
| 代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 卢万腾 |
| 地址: | 100176 北京市大兴区北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 唇音 同步 测试 方法 装置 电子设备 存储 介质 | ||
本申请提供了一种唇音同步的测试方法、装置、电子设备和存储介质,所述方法包括:对接收端接收到的声音和图像进行录制,得到目标录制文件,其中,所述声音和所述图像是发送端发送给所述接收端的;确定所述目标录制文件中的声音播放时刻和预设视频帧的视频帧时刻;记录所述视频帧时刻和所述声音播放时刻之间的测试延迟时长;确定所述测试延迟时长和所述发送端中原始播放文件的标准延时时长之间的时长差值;根据所述时长差值和设定差值指标之间的关系,确定唇音同步是否符合要求。本申请提高了唇音同步测试准确性。
技术领域
本申请涉及媒体通讯技术领域,尤其涉及一种唇音同步的测试方法、装置、电子设备和存储介质。
背景技术
在视频指挥系统中,声音和视频是分别编码、分别传输的,当受到网络传输或编解码延时处理的影响时,会存在声音和视频不同步的现象,因此唇音同步是视频指挥系统的一项重要指标要求。
为了检测唇音同步是否符合指标要求,目前搭建的测试环境如附图1所示。唇音测试过程如下:指挥终端A视频呼叫指挥终端B,二者建立音视频通话链接,相互看到对端图像,听到对端声音;测试人员A面对着指挥终端A的摄像机镜头,开始数数“1,2,3”,保证摄像机能够采集到测试人员A的口型;测试人员B在指挥终端B的显示器上查看测试人员A的口型,并同时监听测试人员A的声音,若查看到测试人员A的口型和听到的声音一致(例如:口型为1,听到的声音也为1),则说明唇音同步;若不一致,则唇音不同步。
当前测试方法存在的问题为:不同测试人员感知误差程度不同,测试方法的主观性较大,不能客观精准的计算出唇音误差数值,导致唇音测试不准确。
发明内容
本申请实施例的目的在于提供一种唇音同步的测试方法、装置、电子设备和存储介质,以解决唇音测试不准确的问题。具体技术方案如下:
第一方面,提供了一种唇音同步的测试方法,所述方法包括:
对接收端接收到的声音和图像进行录制,得到目标录制文件,其中,所述声音和所述图像是发送端发送给所述接收端的;
确定所述目标录制文件中的声音播放时刻和预设视频帧的视频帧时刻;
记录所述视频帧时刻和所述声音播放时刻之间的测试延迟时长;
确定所述测试延迟时长和所述发送端中原始播放文件的标准延时时长之间的时长差值;
根据所述时长差值和设定差值指标之间的关系,确定唇音同步是否符合要求。
可选的,所述确定所述目标录制文件中的声音播放时刻和预设视频帧的视频帧时刻之前,所述方法还包括:
将所述目标录制文件的起始视频帧作为所述预设视频帧。
可选的,所述确定所述目标录制文件中的声音播放时刻和预设视频帧的视频帧时刻之前,所述方法还包括:
通过分析所述目标录制文件中的人物画面,获取包含有人物说话画面的初始视频帧;
将所述初始视频帧作为所述预设视频帧。
可选的,所述通过分析所述目标录制文件中的人物画面,获取包含有人物说话画面的初始视频帧包括:
将所述目标录制文件的每个视频帧逐帧输入识别模型;
通过所述识别模型对视频帧的画面进行分析,识别包含有人物说话画面的多个待选视频帧;
从所述多个待选视频帧中选取出首张视频帧作为所述初始视频帧;
通过所述识别模型输出所述初始视频帧。
可选的,所述目标录制文件包括至少两个子录制文件,确定所述测试延迟时长和所述发送端中原始播放文件的标准延时时长之间的时长差值包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京飞讯数码科技有限公司,未经北京飞讯数码科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211599754.4/2.html,转载请声明来源钻瓜专利网。





