[发明专利]一种用于辅助视觉障碍者理解图片的方法及装置在审
申请号: | 202310049314.X | 申请日: | 2023-02-01 |
公开(公告)号: | CN116030264A | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 王玉堂;倪永桃 | 申请(专利权)人: | 安徽信息工程学院;王玉堂 |
主分类号: | G06V10/40 | 分类号: | G06V10/40;G10L13/02;G10L21/10;G10L21/06;G06V10/74;G06V30/148 |
代理公司: | 北京同辉知识产权代理事务所(普通合伙) 11357 | 代理人: | 张恩慧 |
地址: | 241199 *** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 辅助 视觉 障碍 理解 图片 方法 装置 | ||
1.一种用于辅助视觉障碍者理解图片的装置,其特征在于,包括:数据采集模块、数据处理模块、数据分析模块、执行模块,
所述数据采集模块用于采集用户上传的图像,并且将用户上传的图像发送至数据处理模块进行数据处理;
所述数据处理模块在接收到数据采集模块发送的用户上传的图像后,将用户上传的图像标记为图像数据,并对图像数据进行数据处理,通过计算得出图像判定系数,将图像判定系数发送至数据分析模块进行数据分析;
所述数据分析模块在接收到数据处理模块发送的图像判定系数后,进行数据分析,设定设定标准图像判定系数和判定阈值,利用图像判定系数和标准图像判定系数计算得出判定系数,并且将所有的判定系数合成为判定集合,将判定阈值和判定集合进行特征匹配,若判定阈值与判定集合内的部分判定系数相匹配,则将匹配的判定系数所对应的图像数据进行提取并标记为二次图像数据,发送至执行模块;
所述执行模块在接收到数据分析模块发送的二次图像数据后,将图像数据内的文本信息进行提取,并且转换为语音信息,然后将语音信息转换成语音提供给视觉障碍者。
2.根据权利要求1所述的一种用于辅助视觉障碍者理解图片的装置,其特征在于,所述数据处理模块包括图像特征提取网络模型,用于对图像进行特征提取。
3.根据权利要求2所述的一种用于辅助视觉障碍者理解图片的装置,其特征在于,所述数据处理模块的处理过程包括以下步骤:
将图像数据进行特征提取,所述特征提取的部分包括图像的特征点数量、图像的特征点分布率、图像高度和图像宽度;
将图像的特征点数量标记为Si,图像的特征点分布率标记为Fi,图像高度标记为Gi,图像宽度标记为Ki,其中,i为采集次数标号,且i=1、2、3、...、n,n为采集次数总数;
利用公式计算得出图像判定系数Pdi,式中,S0为标准特征点数量,F0为标准特征点分布率,G0为标准图像高度,K0为标准图像宽度,α为特征点数量影响系数,β为特征点分布率影响系数,a为图像高度影响系数,b为图像宽度影响系数。
4.根据权利要求1所述的一种用于辅助视觉障碍者理解图片的装置,其特征在于,所述数据分析模块包括图像特征判别模型,用于对图像进行特征判别。
5.根据权利要求4所述的一种用于辅助视觉障碍者理解图片的装置,其特征在于,所述数据分析模块的分析过程包括以下步骤:
设定标准图像判定系数Pd0,判定阈值Yz0,利用公式计算判定系数Pyi,并且将各判定系数Pyi合成为判定集合{Pyi},且{Pyi}=(Py1、Py2、...、Pyn),将判定阈值Yz0和判定集合{Pyi}进行特征匹配,若判定阈值Yz0与判定集合{Pyi}内的部分判定系数相匹配,则将匹配的判定系数所对应的图像数据进行提取,并标记为二次图像数据,并且发送二次图像数据和执行信号至执行模块进行执行操作。
6.根据权利要求1所述的一种用于辅助视觉障碍者理解图片的装置,其特征在于,所述执行模块包括信息提取单元、语音转换单元和扩音器,所述信息提取单元用于对文本信息进行提取,所述语音转换单元用于将提取的文本信息转换为语音信息,扩音器用于将语音信息转换成语音提供给视觉障碍者听。
7.一种用于辅助视觉障碍者理解图片的方法,其特征在于,方法包括以下步骤:
获取用户上传图像,并且对图像进行特征提取,包括图像的特征点数量、图像的特征点分布率、图像高度和图像宽度;
对图像的特征点数量、图像的特征点分布率、图像高度和图像宽度进行标记,并且利用图像的特征点数量、图像的特征点分布率、图像高度和图像宽度计算得出图像判定系数;
设定标准图像判定系数和判定阈值,利用图像判定系数和标准图像判定系数计算得出判定系数,并且将所有的判定系数合成为判定集合,将判定阈值和判定集合进行特征匹配,若判定阈值与判定集合内的部分判定系数相匹配,则将匹配的判定系数所对应的图像数据进行提取;
将匹配的判定系数所对应的图像数据的文本信息进行提取,并且将文本信息转换为语音信息,并将语音信息转换成语音提供给视觉障碍者听。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽信息工程学院;王玉堂,未经安徽信息工程学院;王玉堂许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310049314.X/1.html,转载请声明来源钻瓜专利网。