[发明专利]一种新闻人物照片提取方法、装置、设备及存储介质在审
申请号: | 201911311983.X | 申请日: | 2019-12-18 |
公开(公告)号: | CN111061887A | 公开(公告)日: | 2020-04-24 |
发明(设计)人: | 邓立邦 | 申请(专利权)人: | 广东智媒云图科技股份有限公司 |
主分类号: | G06F16/432 | 分类号: | G06F16/432 |
代理公司: | 北京权智天下知识产权代理事务所(普通合伙) 11638 | 代理人: | 王新爱 |
地址: | 510000 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 新闻 人物 照片 提取 方法 装置 设备 存储 介质 | ||
1.一种新闻人物照片提取方法,其特征在于,包括:
基于新闻文章信息中的单个人脸图像和人名信息的对应关系建立关键人物面部识别模型;
利用所述关键人物面部识别模型确定新闻文章信息中的人物照片所对应的人名信息,并利用所述人名信息对所述人物照片进行关联;
基于所述人名信息和所述人物照片之间的关联关系建立关键人物库;
根据待检索人名和人名信息的匹配情况,确定所述关键人物库中与所述待检索人名对应的人物照片。
2.根据权利要求1所述的新闻人物照片提取方法,其特征在于,所述基于新闻文章信息中的单个人脸图像和人名信息的对应关系建立关键人物面部识别模型之前,还包括:
通过网络获取新闻门户网站上的新闻网页信息;
获取所述新闻网页信息中的图片内容及对应的标题内容和正文内容,并将所述图片内容、所述标题内容和所述正文内容作为新闻文章信息。
3.根据权利要求2所述的新闻人物照片提取方法,其特征在于,所述基于新闻文章信息中的单个人脸图像和人名信息的对应关系建立关键人物面部识别模型,包括:
对所述新闻文章信息中的图片内容进行人脸识别,得到人脸特征数据,筛选出包含单个人脸的图片内容作为单个人脸图像;
通过语义分析技术对与所述单个人脸图像对应的标题内容和正文内容提取人名信息;
以单个人脸图像对应的人脸特征数据为输入,单个人脸图像对应的人名信息为输出,利用卷积神经网络进行训练,得到关键人物面部识别模型。
4.根据权利要求1所述的新闻人物照片提取方法,其特征在于,所述利用所述关键人物面部识别模型确定新闻文章信息中的人物照片所对应的人名信息,并利用所述人名信息对所述人物照片进行关联之前,还包括:
对新闻文章信息中的图片内容进行人脸识别,得到人脸特征数据,筛选出包含人脸的图片内容作为人物照片。
5.根据权利要求1所述的新闻人物照片提取方法,其特征在于,所述利用所述关键人物面部识别模型确定新闻文章信息中的人物照片所对应的人名信息,并利用所述人名信息对所述人物照片进行关联,包括:
将新闻文章信息中的人物照片的人脸特征数据输入所述关键人物面部识别模型中得到对应于所述人脸特征数据的相似度以及对应人名信息的相似概率;
根据所述相似度和所述相似概率确定与所述人物照片对应的人名信息;
利用与所述人物照片对应的人名信息对所述人物照片进行标记。
6.根据权利要求5所述的新闻人物照片提取方法,其特征在于,所述将新闻文章信息中的人物照片的人脸特征数据输入所述关键人物面部识别模型中得到对应于所述人脸特征数据的相似度以及对应人名信息的相似概率之前,还包括:
获取新闻文章信息中的人物照片包含的人脸数量及每个人对应的人脸区域大小;
据所述人脸区域大小选择若干人脸区域;
获取所述人物照片中选中的所述人脸区域对应的人脸特征数据;
所述利用与所述人物照片对应的人名信息对所述人物照片进行标记,包括:
利用与所述人物照片不同人脸区域对应的人名信息对所述人物照片进行标记。
7.根据权利要求1-6任一项所述的新闻人物照片提取方法,其特征在于,所述根据待检索人名和人名信息的匹配情况,确定所述关键人物库中与所述待检索人名对应的人物照片,包括:
获取检索人名,在所述关键人物库中检索与所述检索人名匹配的人名信息,生成指向人名信息的匹配结果;
根据所述匹配结果指向的人名信息,确定所述关键人物库中与所述待检索人名对应的人物照片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东智媒云图科技股份有限公司,未经广东智媒云图科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911311983.X/1.html,转载请声明来源钻瓜专利网。