[发明专利]一种面向视力残疾人网页内容无障碍访问的图片自动描述方法无效
申请号: | 201210062709.5 | 申请日: | 2012-03-09 |
公开(公告)号: | CN102662972A | 公开(公告)日: | 2012-09-12 |
发明(设计)人: | 王灿;卜佳俊;汪兆鹏;陈纯;陈争光 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵;黄美娟 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 视力 残疾人 网页 内容 障碍 访问 图片 自动 描述 方法 | ||
1.一种面向视力残疾人网页内容无障碍访问的图片自动描述方法,其特征在于该方法的步骤如下:
1)抓取网络上带标签的图片作为已标注图片的样本库;
2)对已标注图片样本库中的图片标签进行排序以实现标签去噪;
3)利用样本库中的相似图片对文本中的插图产生标签推荐词;
4)结合标签推荐词在图片上下文中抽取句子以作为图片的描述。
2.根据权利要求1所述的一种面向视力残疾人网页内容无障碍访问的图片自动描述方法,其特征在于:所述抓取网络上带标签的图片作为已标注图片的样本库,是从图片分享网站抓取图片及其对应标签,作为图片标签推荐的样本库。
3.根据权利要求1所述的一种面向视力残疾人网页内容无障碍访问的图片自动描述方法,其特征在于:对已标注图片样本库中的图片标签进行排序以实现标签去噪,其步骤如下:
1)采用邻居投票的方式对图片标签进行排序,作为排序初始结果;
2)利用用户、标签和图片三者之间的关系,构建用户和标签、标签和图片之间的有向图,该图的边分别代表着用户对标签的标注关系、标签之间的相似度和图片之间的相似度,根据相似度,得到该有向图的矩阵表示W;
3)将原始的标签顺序作为标签偏好的初始值,利用随机跳转概率,对标签排序结果进行排序精化,排序精化可以有以下三种选项:
a)利用第二步得到的有向图,使用图排序算法进行排序精化,假设某一标签的排序分数为xi,则该排序分数可通过其近邻计算加权平均得到,即ix=λ+∑jwijxj,其中xj代表近邻标签分数,λ是代表对该标签排序分数的预估常数,wij为第二步得到的有向图中定点之间的边权重;
b)利用图片相似度信息,对图片的标签进行投票,即统计在相似图片中某标签出现的频率,从而得到标签的排序精化;
c)使用概率模型对图片和标签之间的关系进行建模,并最终对标签进行排序精化;
4.根据权利要求1所述的一种面向视力残疾人网页内容无障碍访问的图片自动描述方法,其特征在于:利用样本库中的相似图片对文本中的插图产生标签推荐词,是指从样本库中选取与文本插图特征相似的图片,采用相似图片排序靠前的标签作为推荐标签的候选词,为文本插图产生推荐标签。
5.根据权利要求1所述的一种面向视力残疾人网页内容无障碍访问的图片自动描述方法,其特征在于:结合标签词在图片上下文中抽取句子以作为图片的描述,其步骤如下:
1)对图片上下文的文本进行分词,提高名词的权重,提高标签推荐词及其同义词匹配词汇的权重;
2)对图片上下文的句子进行权重计算,根据三个方面来确定句子的权重:
a)句子词汇的权重总和,为避免句子过长,除以句子的词汇数;
b)句子所处位置,与图片所处位置越近,句子权重系数越大;
c)句子的线索词,句子中包含与图相关的线索词,则句子权重系数越大;
3)输出权重最大的1-2个句子作为图片描述。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210062709.5/1.html,转载请声明来源钻瓜专利网。