[发明专利]一种新闻拆条方法及系统有效
| 申请号: | 201910362409.0 | 申请日: | 2019-04-30 |
| 公开(公告)号: | CN110267061B | 公开(公告)日: | 2021-07-27 |
| 发明(设计)人: | 罗媺;陈舟锋 | 申请(专利权)人: | 新华智云科技有限公司 |
| 主分类号: | H04N21/234 | 分类号: | H04N21/234;H04N21/233;H04N21/439;H04N21/44;H04N21/845;G06K9/00 |
| 代理公司: | 杭州裕阳联合专利代理有限公司 33289 | 代理人: | 姚宇吉 |
| 地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 新闻 方法 系统 | ||
1.一种新闻拆条方法,其特征在于,包括以下步骤:
获取待拆条的新闻的音频帧和视频帧;
预处理所述音频帧,获取静音时间段,并获取各静音时间段对应的断句开始时间点和断句结束时间点;预处理所述视频帧,获取主播特征数据;
提取各断句开始时间点相对应的视频帧,获得相应的断句开始图像,提取各断句结束时间点相对应的视频帧,获得相应的断句结束图像;
根据所述主播特征数据判断一一对应的断句开始图像和断句结束图像是否存在主播切换,当存在主播切换时,根据相应静音时间段提取对应的视频帧,获得停顿段落;
获取所述停顿段落的待拆分点,并根据各待拆分点对新闻视频进行拆条;
所述主播特征数据包括与主播对应的原始模板图像和特征描述子,所述预处理所述视频帧,获取主播特征数据的方法为:
从第一张视频帧起,每隔K抽取一张视频帧对各人像进行骨架分析,对视频帧中属于主播的人像进行标注,获得标签图像,所述K为预设值,其为帧数或时间;
采集所述标签图像中标记为主播的人像的人脸,获得模板图像,同时将所述模板图像对应的视频帧作为原始模板图像进行保存;
将模板图像根据人脸空间位置的偏移进行归类保存,直至获得N*M的主播模板图像序列,其中N为主播人数,M为模板图像数;
提取N*M的主播模板图像序列中各模板图像的特征描述子。
2.根据权利要求1所述的一种新闻拆条方法,其特征在于,根据所述主播特征数据判断一一对应的断句开始图像和断句结束图像是否存在主播切换的方法为:
将断句开始图像、断句结束图像和原始模板图像进行匹配,匹配成功则标注为导播台,并输出导播台标签图像,否则标注为无主播,输出主播标签图像;
利用所述特征描述子对导播台标签图像中主播进行标注,输出主播标签图像;
根据主播标签图像判断一一对应的断句开始图像和断句结束图像是否存在主播切换。
3.根据权利要求2所述的一种新闻拆条方法,其特征在于,断句开始图像、断句结束图像和原始模板图像进行匹配的方法如下:
提取断句开始图像、断句结束图像和原始模板图像的主题色特征向量;
计算断句开始图像/断句结束图像与各原始模板图像主题色特征向量的余弦距离,直至所述余弦距离大于距离阈值,标注为导播台,并输出导播台标签图像,否则标注为无主播,输出主播标签图像。
4.根据权利要求3所述的一种新闻拆条方法,其特征在于,利用所述特征描述子对导播台标签图像中主播进行标注的具体方法为:
将导播台标签图像中各人像与特征描述子进行人脸对比,获得人脸相似度的最大评分;
将所述人脸相似度的最大评分与评分阈值相比对,当人脸相似度的最大评分大于评分阈值,则标注该人像为对应主播,输出主播标签图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华智云科技有限公司,未经新华智云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910362409.0/1.html,转载请声明来源钻瓜专利网。





