[发明专利]一种基于社交网络的短图片文本识别方法及装置有效

专利信息
申请号: 201510907490.8 申请日: 2015-12-09
公开(公告)号: CN105528618B 公开(公告)日: 2019-06-04
发明(设计)人: 李金奎 申请(专利权)人: 微梦创科网络科技(中国)有限公司
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 北京卓岚智财知识产权代理事务所(特殊普通合伙) 11624 代理人: 任漱晨
地址: 100080 北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 社交 网络 图片 文本 识别 方法 装置
【说明书】:

发明实施例提供一种基于社交网络的短图片文本识别方法及装置,所述基于社交网络的短图片文本识别方法包括:接收基于社交网络的短图片文本;获取所述短图片文本的图片数量、所述短图片文本的评论特征,并获取预先构建的所述短图片文本所对应用户具备的能力标签;利用短图片文本分类器,确定所述短图片文本对应的能力标签,其中,所述短图片文本分类器是根据所述短图片文本的图片数量、所述短图片文本的评论特征和所述短图片文本所对应用户具备的能力标签训练出的;为所述短图片文本设置对应的能力标签。本发明技术方案引入发布者的能力标签及评论特征,在图片本身包含的信息之外引入了多个数据源,能有效提高短图片文本分类的准确率和覆盖率。

技术领域

本发明涉及社交网络技术领域,尤其涉及一种基于社交网络的短图片文本识别方法及装置。

背景技术

在社交网络的短话题文本识别领域中涉及几个概念:短图片文本,是指在微博等社交网络中,有些账号发表的博文没有或有少量的文本信息,主要通过博文中发表的N(N>1)张图片来传达信息,此类博文属于短图片文本。用户能力标签,是指描述用户在社交网络中通过自填信息、发表的博文等信息所呈现出的能力特征的标签。短图片文本对应的能力标签,是指描述用户发表的某一篇博文内容的能力标签。

现有技术基于图像识别的方案主要是利用标注的大量图片作为训练集,然后基于训练集学习出一个图像识别模型,利用学习出的模型对新发表的图片进行识别分析,识别出图片中的人物、动物、物品等信息,然后将识别出的信息同内容标签进行映射。其存在图片识别准确率偏低,误判率较高,而且识别出的图片信息同用户标签关联难度大的技术缺陷。

发明内容

本发明实施例提供一种基于社交网络的短图片文本识别方法及装置,以有效提高短图片文本分类的准确率和覆盖率。

一方面,本发明实施例提供了一种基于社交网络的短图片文本识别方法,所述基于社交网络的短图片文本识别方法包括:

接收基于社交网络的短图片文本;

获取所述短图片文本的图片数量、所述短图片文本的评论特征,并获取预先构建的所述短图片文本所对应用户具备的能力标签;

利用短图片文本分类器,确定所述短图片文本对应的能力标签,其中,所述短图片文本分类器是根据所述短图片文本的图片数量、所述短图片文本的评论特征和所述短图片文本所对应用户具备的能力标签训练出的;

为所述短图片文本设置对应的能力标签。

另一方面,本发明实施例提供了一种基于社交网络的短图片文本识别装置,所述基于社交网络的短图片文本识别装置包括:

接收单元,用于接收基于社交网络的短图片文本;

获取单元,用于获取所述短图片文本的图片数量、所述短图片文本的评论特征,并获取预先构建的所述短图片文本所对应用户具备的能力标签;

分类单元,用于利用短图片文本分类器,确定所述短图片文本对应的能力标签,其中,所述短图片文本分类器是根据所述短图片文本的图片数量、所述短图片文本的评论特征和所述短图片文本所对应用户具备的能力标签训练出的;

标签单元,用于为所述短图片文本设置对应的能力标签。

上述技术方案具有如下有益效果:现有技术的短图片文本分类识别,首先识别出图片中的物体或人物对象,然后将识别结果再同标签进行映射,在识别和映射的过程中,利用的仅仅都是图片本身的信息,会造成准确率和覆盖率偏低。而本发明技术方案引入发布者的能力标签及评论特征,在图片本身包含的信息之外引入了多个数据源,能有效提高短图片文本分类的准确率和覆盖率。

附图说明

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微梦创科网络科技(中国)有限公司,未经微梦创科网络科技(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510907490.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top