[发明专利]一种新闻标题检测方法及装置有效
申请号: | 201810503681.1 | 申请日: | 2018-05-23 |
公开(公告)号: | CN108734166B | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 徐佳宏;尹杰;莫愁;曾勇;李思萌 | 申请(专利权)人: | 深圳市茁壮网络股份有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V10/26;G06V30/10 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518004 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 新闻标题 检测 方法 装置 | ||
本发明公开了一种新闻标题检测方法及装置,该方法包括:对待检测的新闻视频的图像帧进行文字检测,获得第一文字区域;对所述第一文字区域进行文字融合处理,得到第二文字区域;获取所述第二文字区域的目标信息,并根据所述目标信息建立所述第二文字区域的文字信息链表;根据所述文字信息链表剔除所述第二文字区域中的干扰文字信息,得到第三文字区域;对所述第三文字区域中的文字进行颜色聚类,并基于所述文字信息链表从颜色聚类后的文字区域中筛选出新闻标题。通过本发明实现了筛选出的标题更加准确和合理的目的。
技术领域
本发明涉及文字检测技术领域,特别是涉及一种新闻标题检测方法及装置。
背景技术
新闻视频中蕴含着大量的最新咨询信息,是重要事件的及时的、全面的报道,它作为提供信息量最大的视频之一,其语义的自动分类与检索具有重要的应用价值。新闻视频中通常存在各种类型的文字,例如标题、对话、描述性文字、介绍性文字、滚动文字、logo(标识)文字以及其他一些背景文字等等,如何有效的检测判断出新闻视频中的标题文字对于新闻视频中各个新闻故事的切分提取也是至关重要的一个环节。
目前关于新闻标题检测的方法都只是针对标题进行分析,总结出标题的个别特征,然后根据个别特征来判断是否为标题。例如,针对标题出现的时长、文字的颜色、文字变化情况等等。但是,实际新闻视频中是存在各种各样的文字的,不同文字存在不同的特征也会存在类似特征,如果只分析标题的个别特征来进行检测肯定是不完整的,提取出的标题也会存在不合理和不准确的现象。
发明内容
针对于上述问题,本发明提供一种新闻标题检测方法及装置,实现了筛选出的标题更加准确和合理的目的。
为了实现上述目的,本发明提供了如下技术方案:
一种新闻标题检测方法,包括:
对待检测的新闻视频的图像帧进行文字检测,获得第一文字区域;
对所述第一文字区域进行文字融合处理,得到第二文字区域;
获取所述第二文字区域的目标信息,并根据所述目标信息建立所述第二文字区域的文字信息链表;
根据所述文字信息链表剔除所述第二文字区域中的干扰文字信息,得到第三文字区域;
对所述第三文字区域中的文字进行颜色聚类,并基于所述文字信息链表从颜色聚类后的文字区域中筛选出新闻标题。
可选地,还包括:
若筛选出的新闻标题包括主标题和副标题,基于所述文字信息链表,确定所述新闻标题中的文字的节点信息,其中,所述节点信息包括节点个数信息、节点平均位置信息、节点存在时长信息和节点存在的时间信息;
依据所述节点信息,在所述新闻标题中筛选出主副标题,并清除非主副标题的文字信息。
可选地,还包括:
将所述非主副标题文字信息保存至预设位置,实现对所述非主副标题文字信息漏选的回收。
可选地,所述对待检测的新闻视频的图像帧进行文字检测,获得第一文字区域,包括:
对待检测的新闻视频的图像帧进行边缘检测和角点检测,获得候选区域;
根据所述新闻视频的文字分布和文字颜色,确定剪裁比例;
依据所述剪裁比例对所述候选区域进行剪裁,得到第一文字区域。
可选地,所述对所述第一文字区域进行文字融合处理,得到第二文字区域,包括:
比较相邻图像帧的第一文字区域中是否满足预设条件,如果是,则将所述相邻图像帧对应的第一文字区域进行融合处理,得到第二文字区域,其中,所述预设条件指示所述相邻图像帧的第一文字区域中的文字完全相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市茁壮网络股份有限公司,未经深圳市茁壮网络股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810503681.1/2.html,转载请声明来源钻瓜专利网。