[发明专利]数据确定方法、数据获取方法、装置及设备在审

专利信息
申请号: 202110706563.2 申请日: 2021-06-24
公开(公告)号: CN115601770A 公开(公告)日: 2023-01-13
发明(设计)人: 庞芸萍 申请(专利权)人: 北京小米移动软件有限公司
主分类号: G06V30/40 分类号: G06V30/40;G06V10/774;G06V30/148;G06V10/40;G06F16/583
代理公司: 北京英创嘉友知识产权代理事务所(普通合伙) 11447 代理人: 魏嘉熹
地址: 100085 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 本公开涉及一种数据确定方法、数据获取方法、装置及设备。数据确定方法包括:获取单字书法图片,对单字书法图片进行二值化处理,得到二值化的单字书法图片;通过图像编码模型提取二值化的单字书法图片的特征向量,输出二值化的单字书法图片的第一特征向量;从预设数据集中获取与单字的统一码对应的多个书法图片,确定第二特征向量中与第一特征向量相似度最高的目标特征向量;根据与第一特征向量相似度最高的第二特征向量,确定与二值化的单字书法图片相似度最高的候选书法图片,得到目标候选书法图片;基于与目标候选书法图片对应的汉字和单字书法图片的对应关系,得到目标书法数据库。
搜索关键词: 数据 确定 方法 获取 装置 设备
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司,未经北京小米移动软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202110706563.2/,转载请声明来源钻瓜专利网。

同类专利
  • 一种三维图文模板自动重组方法、设备及系统-202311188895.1
  • 陈尧森;韩兴;温序铭 - 成都索贝数码科技股份有限公司
  • 2023-09-15 - 2023-10-24 - G06V30/40
  • 本发明提供了一种三维图文模板自动重组方法、设备及系统,包括:S1、在三维图文模板库中获取包含各个类别的图文模板数据集;S2、通过图文模板数据集对预训练好的CLIP模型进行微调;S3、对输入图像进行图像区域分割;S4、将分割后的图像区域与图文模板数据集输入到微调后的CLIP模型,得到满足条件的图像区域及对应的图文模板类别;S5、输出图像区域位置以及对应的图文模板类别;S6、获取图像区域控制参数;S7、根据控制参数、图像区域位置以及对应的图文模板类别完成输入图像的图文模板重组。本发明实现了自动化的图文模板重组生成,为图文展示、报告生成等领域提供了更高的效率、准确性和灵活性。
  • 一种基于AI视觉下的阅读能力辅助评估方法及系统-202010499710.9
  • 范骁骏;高旻昱 - 上海翎腾智能科技有限公司
  • 2020-06-04 - 2023-10-24 - G06V30/40
  • 本发明涉及阅读能力评估的技术领域,提供了一种基于AI视觉下的阅读能力辅助评估方法及系统,方法包括:S1:在AI设备能够识别的范围内任意阅读,AI设备从首次翻页开始分析用户阅读,直至用户离开阅读状态;S2:分析出从首次翻页开始到用户离开阅读状态的时间;S3:在用户阅读行为过程中,通过AI设备识别扫描用户的阅读内容中出现的单字或单词的数量;S4:识别阅读内容,判断阅读内容的难度;S5:通过包括阅读时间、阅读量、阅读难度在内的因素,推算出用户的阅读能力分值。解决了现有技术中没有一个方法能够对读者的阅读能力,尤其是对于阅读纸质书本的阅读能力进行实时的分析的问题。
  • 一种从图像中提取结构化数据的方法、装置和设备-201880029640.1
  • 叶奕斌;朱声高;王晶;杜奇;梁辉;涂丹丹 - 华为云计算技术有限公司
  • 2018-12-07 - 2023-10-17 - G06V30/40
  • 本申请公开了一种从图像中提取结构化数据的方法,涉及人工智能领域,该方法包括:利用图像文字提取模型获取所述图像中的第一信息集合和第二信息集合,所述图像中包括至少一条结构化数据;根据所述第一信息集合包括的至少一个第一信息获取所述图像中的至少一个文字子图像;识别所述至少一个文字子图像中的文字信息;根据所述至少一个文字子图像中的文字信息与所述第二信息集合包括的至少一个第二信息,获得所述图像中的至少一条结构化数据。通过利用图像文字提取模型和文字识别模型,提升了结构化数据提取的效率和准确率。
  • 一种图像识别方法、装置及电子设备-202011638538.7
  • 陈淑兰;李想;饶丰;赵晖;王雨轩 - 北京一起教育科技有限责任公司
  • 2020-12-31 - 2023-10-17 - G06V30/40
  • 本发明提供了一种图像识别方法、装置及电子设备,其中,该方法包括:检测目标图像,得到至少一个脱式框、结尾框和口算框;将任一个脱式框作为目标脱式框,查找到关联所述目标脱式框的所有关联脱式框并与目标脱式框并合并为整体框;在所有所述结尾框中查找到匹配所述整体框的目标结尾框,并在所有所述口算框中查找到匹配所述整体框的目标口算框;识别出所述目标口算框包含的目标脱式计算题目、所述整体框包含的目标完整解题步骤和所述目标结尾框包含的目标计算结果并合得到该目标脱式计算题目的完整识别结果。通过本发明实施例提供的一种图像识别方法、装置及电子设备,用以完整的识别出脱式计算题目及其解题步骤和计算结果。
  • 一种基于多感知数据的交互式文本识别方法和系统-202010737768.2
  • 万享;罗登;樊向东;张玉志 - 深圳市点通数据有限公司
  • 2020-07-28 - 2023-10-17 - G06V30/40
  • 本发明提供一种基于多感知数据的交互式文本识别方法和系统,所述基于多感知数据的交互式文本识别方法包括:步骤S1,对待识别图像进行拍照识别;步骤S2,将后台识别好的结果发送至前端进行显示,并通过前端对识别结果进行确认和纠错;步骤S3,结合历史数据统计对下一步操作的效果进行成本预测估算;步骤S4,根据成本预测估算结果选择下一步操作,并对当前结果进行二次确认。本发明引入了音频信息和触觉信息以增强场景适应性,提升了识别正确率,在此基础上,还通过对下一步操作的效果进行成本预测估算,以便实现智能排序和推送操作选择,确保达到以与用户相适的操作以获得更高的识别率,并有效地提升了产品的人性化设计程度和适应性能。
  • 一种现实场景下的阅读综合行为的识别方法及系统-202010499715.1
  • 范骁骏;高旻昱 - 上海翎腾智能科技有限公司
  • 2020-06-04 - 2023-10-13 - G06V30/40
  • 本发明涉及阅读综合行为识别的技术领域,提供了一种现实场景下的阅读综合行为的识别方法及系统,其方法包括:S1:获取真实阅读场景下的信息载体图像;S2:对信息载体图像进行定位和边缘位置检测,对书本内部的图像内容进行检测,实现对翻页行为的识别;S3:针对页面范围内的信息进行随机采样,对候选焦点语言特征点图片组进行综合分析,实现对焦点页面语言的识别;S4:对行的信息进行定位,获得行数和每一行的行宽,估算出每一行的文字数量和页面内的文字总数量;S5:获取两次翻页事件之间的时间间隔内阅读文字的总数量,计算出单位时间内的阅读文字总量。能够对读者的阅读行为,尤其是针对于阅读纸质书本的阅读行为进行实时的分析。
  • 文档图像方向识别方法、装置及模型的训练方法、装置-202010136041.9
  • 周锴;张睿 - 北京三快在线科技有限公司
  • 2020-03-02 - 2023-10-10 - G06V30/40
  • 本申请公开了文档图像方向识别方法、装置及模型的训练方法、装置。文档图像识别模型的训练方法包括:根据注意力机制,生成训练图像的注意力裁剪图像和注意力抹除图像,以及分别确定训练图像、注意力裁剪图像以及注意力抹除图像各自的注意力融合特征;根据各注意力融合特征分别识别相应图像的方向,得到相应的识别结果;根据各识别结果计算交叉熵损失值,以及根据各注意力融合特征计算中心损失值,根据交叉熵损失值和中心损失值对文档图像方向识别模型进行参数优化或停止训练。利用注意力裁剪和注意力抹除,让文档图像方向识别模型更容易聚焦至文档图像中有区分度的文字部分特征,并且通过减少类内距离,达到了更好的通用文档图像方向判断效果。
  • 单据拍摄图像识别方法及装置-202010337450.5
  • 张瀚文 - 中国工商银行股份有限公司
  • 2020-04-26 - 2023-10-10 - G06V30/40
  • 本申请实施例提供一种单据拍摄图像识别方法及装置,方法包括:应用预获取的目标单据拍摄图像中的各个文本区域框以及预设的图像坐标系,确定各个所述文本区域框各自对应的顶点坐标;基于各个所述文本区域框各自对应的顶点坐标获取所述目标单据拍摄图像中的单据所在区域的位置信息,并根据该单据区域的位置信息自所述目标单据拍摄图像中提取对应的目标单据图像;根据预定义的版式信息将所述目标单据图像切割为多个子区域,并对各个所述子区域分别进行文字识别。本申请能够有效简化单据拍摄图像识别的过程,并能够提高单据所在区域的位置信息的获取效率及准确性,进而能够有效提高对单据拍摄图像中的单据文字识别的准确性及识别效率。
  • 一种基于答案库的手写样本集的自动生成方法-201910678950.2
  • 田博帆 - 南京红松信息技术有限公司
  • 2019-07-25 - 2023-10-10 - G06V30/40
  • 本发明公开了一种基于答案库的手写样本集的自动生成方法,具体包括以下步骤:(1)手印分离:将含有手写体文本的作业或试卷的图片中的印刷体和手写体字符进行分离;(2)字符定位:对所述字符图片中的字符进行定位,得到定位坐标;(3)答案获取:确定手写体的答案坐标;(4)答案对齐:对题目的答案做实际排序和对齐操作,完成检测答案和答案库数据的对应关系;(5)答案分类:根据答案库的数据信息判断出字符类别并裁剪出对应的手写体答案,将裁剪的答案图片作为基础样本保存至文件夹中;(6)样本合成:根据步骤(5)得到的基础样本的数据集通过随机读取文件夹名和文件夹中的文件,自动合成出训练样本集。
  • 医药影印件的信息提取方法和系统-202010657780.2
  • 常帅东;周日贵 - 上海海事大学
  • 2020-07-09 - 2023-10-03 - G06V30/40
  • 本发明公开了一种医药影印件的信息提取方法和系统,方法包含:将医药影印件文件转换成待识别电子文件;采用光学字符识别方法对所述待识别电子文件进行字符识别,得到电子文档和特征信息;根据所述特征信息对所述电子文档进行模糊分类;对经模糊分类处理的电子文档根据其所属的类别进行信息提取,得到初步提取结果;对初步提取结果进行纠错处理得到有效的电子文档;根据预设信息提取条件,对有效的电子文档进行第二次信息提取,得到关键信息;根据所述关键信息,对经有效的电子文档进行分类,得到分类结果,本发明可以实现在显著的减少人工成本的情况下具有更加精确的文字识别准确率,且能根据文本的特征自动识别并归类,达到统一化处理的目的。
  • 结构化文档信息标注的方法、装置及电子设备-202010538181.9
  • 李乔伊;黄相凯;李煜林;黄聚;钦夏孟;秦铎浩;刘明浩;韩钧宇 - 北京百度网讯科技有限公司
  • 2020-06-12 - 2023-09-29 - G06V30/40
  • 本申请公开了结构化文档信息标注的方法、装置及电子设备,涉及人工智能领域、深度学习领域以及大数据领域。具体实现方案为:获取结构化文档的模板图像以及所述模板图像的至少一个待填充字段的标注信息,所述标注信息包括所述待填充字段的属性值、历史内容以及所述待填充字段在所述模板图像中的历史位置。根据所述待填充字段的属性值、所述待填充字段的历史内容以及所述待填充字段在模板图像中的历史位置,生成所述待填充字段的目标填充信息。根据所述待填充字段的目标填充信息,得到标注的结构化文档的图像。该方法能够实现结构化文档的快速准确的标注。
  • 一种融合双向视觉注意力机制的数学公式识别方法及装置-201911295399.X
  • 张婷;何彬;余新国;陈治平;曾致中;孙超 - 华中师范大学
  • 2019-12-16 - 2023-09-26 - G06V30/40
  • 本发明公开了一种融合双向视觉注意力机制的数学公式识别方法及装置。该方法包括:接收输入的数学公式图像,提取数学符号区域并获取每个所述数学符号区域的特征作为自下而上信息;构建标记语言的条件语言模型,预测每个输出数学符号的条件概率分布,获取所述条件语言模型的时刻状态,将所述条件语言模型的时刻状态联合已输出的数学符号共同组成了自上而下信息;构建融合双向视觉注意力机制的注意力模型,融合自下而上和自上而下的双向信息预测注意力分布。本发明可以有效利用多粒度视觉信息的问题,从而提高数学公式识别的准确率。
  • 文字识别方法、装置、电子设备及存储介质-202110068580.8
  • 刘翔;刘莹 - 平安科技(深圳)有限公司
  • 2021-01-19 - 2023-09-26 - G06V30/40
  • 本发明涉及图像检测领域,揭露了一种文字识别方法,包括:获取文本图像,对所述文本图像进行文字检测,得到文字检测框;对所述文字检测框进行筛选及合并,得到目标文字框;对所述目标文字框进行无文字区域裁剪,得到裁剪文字框;对所述裁剪文字框进行文字提取,得到初始文字集。提取所述初始文字集中的关键文字,并利用正则校验技术对所述关键文字进行校验,将检验成功的所述关键文字作为所述文本图像的文字识别结果。此外,本发明还涉及区块链技术,所述关键文字可存储于区块链中。本发明可以提高文字识别的准确性。
  • 一种公式检测的方法、装置、电子设备和存储介质-202010496715.6
  • 熊勋;邓小兵;张春雨 - 广东小天才科技有限公司
  • 2020-06-03 - 2023-09-26 - G06V30/40
  • 本发明实施例涉及智能设备技术领域,公开了一种公式检测的方法、装置、电子设备和存储介质。该方法包括:获取目标图片,将目标图片输入预先训练的公式识别模型,确定初始公式框坐标;利用初始公式框坐标,在目标图片中分割得到初始公式框坐标内的图像,记为初始公式图像;将初始公式图像输入预先训练的目标分类识别模型,确定最终的公式图像。实施本发明实施例,通过结合深度学习的目标检测与分类算法,得到检测页面中公式的位置框,不仅解决了传统算法对于具有空间结构、复杂光照的公式鲁棒性较差的问题,而且公式被误检为英文的问题也得到了改善,提高了公式检测的准确率和召回率,为后续完成自动批改等做好了铺垫。
  • 一种听写内容识别方法及电子设备-201910648392.5
  • 彭婕 - 广东小天才科技有限公司
  • 2019-07-17 - 2023-09-26 - G06V30/40
  • 本发明涉及教育技术领域,公开一种听写内容识别方法及电子设备,包括:对采集到的包含书写页面的图像进行识别,确定书写页面中的若干个书写区域;检测任一个书写区域中书写内容的总数量,并计算任一个书写区域的内容重复率;以内容重复率和书写内容数量为依据,从若干个书写区域中确定出听写区域;确定听写区域中包含的书写内容为听写内容。实施本发明实施例,能够将采集到的书写页面分割为若干个书写区域,进而根据各个书写区域的内容重复率以及书写内容数量确定出听写区域,以使电子设备可以将听写内容存在的书写区域从书写页面中识别出,进而提升电子设备识别听写内容的准确性。
  • 直线检测方法、信息提取方法、装置、设备及存储介质-202011478759.2
  • 熊军 - 中国平安人寿保险股份有限公司
  • 2020-12-14 - 2023-09-26 - G06V30/40
  • 本发明涉及一种图像检测技术,揭露了一种直线检测方法、信息提取方法、装置、设备及存储介质,直线检测方法包括:获取二值化后的文档图片,采用霍夫直线检测方法检测所述文档图片;获取检测出的各条直线,计算各条直线的长度,对长度小于预设第一阈值的直线进行剔除;分别获取经剔除后所述文档图片中剩余的各条直线对应的截距,基于所述截距对所述剩余的各条直线进行过滤处理,将经过滤处理后得到的各条直线作为所述文档图片的各条检测直线。本发明能够提高直线检测的准确性。
  • 快件末端地址的标准化处理方法、装置和设备-202010303834.5
  • 曹文军 - 上海中通吉网络技术有限公司
  • 2020-04-17 - 2023-09-19 - G06V30/40
  • 本发明涉及一种快件末端地址的标准化处理方法、装置和设备,将修正快件地址输入到预设的六级地址处理模型中,获取输出的当前六级地址;在标准地址库中确定与当前六级地址匹配度最高的第一标准六级地址,若匹配度第一等级为中匹配度,解析当前六级地址的地理信息,得到当前经纬度地址,确定与当前经纬度地址匹配度最高的标准经纬度地址作为标准地址。派件员可以根据标准地址派送快件,不需要派件员对快件地址进行进一步地辨认和分析,降低了派件员的工作量,缩短了快件的转运时间。而且,标准地址达到末端单元级别,从而对快递行业的末端派送产生实际的促进作用,以便于进行快递柜选址、快递派送时效制度完善、快递刷单管控以及客户精准画像等。
  • 一种票据图像识别方法、装置、设备及存储介质-202010517447.1
  • 李煜林;黄聚;钦夏孟;韩钧宇 - 北京百度网讯科技有限公司
  • 2020-06-09 - 2023-09-19 - G06V30/40
  • 本申请公开了一种票据图像识别方法、装置、设备及存储介质,涉及人工智能深度学习和图像处理领域。具体实现方案为:对票据图像进行文本检测,确定所述票据图像中的至少两个文本框的属性信息集和关系信息集;根据所述文本框的属性信息集和关系信息集,确定所述文本框的类型,以及与所述文本框存在结构关系的关联文本框;根据所述文本框的类型,以及与所述文本框存在结构关系的关联文本框,提取所述票据图像的结构化票据数据。本申请实施例的方案能够支持自动识别多种不同版本的票据图像,且识别过程无需借助模板,提高了票据图像识别的通用性和准确性。
  • 图像处理方法、图像处理装置、电子设备和存储介质-202010776656.8
  • 徐青松;李青 - 杭州睿琪软件有限公司
  • 2020-08-05 - 2023-09-15 - G06V30/40
  • 一种图像处理方法、图像处理装置、电子装置、存储介质。图像处理方法包括:获取输入图像,输入图像包括M个字符行;对输入图像进行全局校正处理,以得到中间校正图像;对中间校正图像进行局部调整,以得到目标校正图像。对中间校正图像进行局部调整,以得到目标校正图像,包括:确定M个字符行下边界;根据M个字符行下边界、中间校正图像的第一图像边界和第二图像边界,确定中间校正图像中的所有像素的相对偏移量;根据中间校正图像中的所有像素的相对偏移量,确定中间校正图像中的所有像素的局部调整偏移量;根据中间校正图像中的所有像素的局部调整偏移量对中间校正图像进行局部调整,以得到目标校正图像。
  • 同行文本判定方法、文档排序方法及其应用-202311009385.3
  • 陶提 - 浙江太美医疗科技股份有限公司
  • 2023-08-11 - 2023-09-12 - G06V30/40
  • 本申请公开了一种同行文本判定方法、文档排序方法及其应用,该同行文本判定方法包括确定第一文本段的第一主方向,以及确定第二文本段的第二主方向;基于第一主方向和第二主方向,确定第一文本段和第二文本段的目标重叠投影和目标偏差角,目标重叠投影表示第一文本段和第二文本段在所述第一主方向和/或第二主方向上垂直投影范围的重叠程度,目标偏差角表示第一文本段和第二文本段延伸方向的差异;基于目标重叠投影和目标偏差角,判定第一文本段和第二文本段是否同行。如此,可以提高文档图像同行文本判定的准确度,进而确保对文档中文本段排序的可靠性。
  • 还原图像中字符排版的方法-202310436511.7
  • 高子军;方俊 - 福昕鲲鹏(北京)信息科技有限公司
  • 2023-04-21 - 2023-09-08 - G06V30/40
  • 本发明提供一种还原图像中字符排版的方法,涉及图像识别技术领域,包括:对目标图像进行图像识别,得到所述目标图像中各字符和所述各字符的外接矩形信息;针对每个字符,根据所述字符和所述字符的外接矩形信息,从各字符样式的配置数据集合中,分别筛选所述字符的目标配置数据;根据所述目标配置数据对应的字符样式确定所述字符的目标字符样式,并根据所述目标配置数据和所述外接矩形信息,确定所述字符的目标字号和位置信息;根据所述各字符的目标字符样式、目标字号和位置信息,还原所述目标图像中所述各字符的字符排版。本发明可以比较准确地还原目标图像中字符的原始排版效果,提高还原字符排版的准确度和可靠性。
  • 字符识别模型生成方法、装置、计算机设备和存储介质-202110787681.0
  • 孙鲲;姚旭峰;沈小勇;吕江波 - 深圳思谋信息科技有限公司;上海思谋科技有限公司
  • 2021-07-13 - 2023-09-08 - G06V30/40
  • 本申请涉及一种字符识别模型生成方法、装置、计算机设备和存储介质,方法包括:获取多个已识别字符数据集与待识别字符数据集之间的相似度,将与待识别字符数据集之间的相似度匹配的已识别字符数据集,作为目标字符数据集;获取与目标字符数据集对应的预训练模型,根据预训练模型构建目标训练模型;预训练模型为经过预先训练后的用于识别目标字符数据集的模型;根据已识别字符数据集与待识别字符数据集,生成目标训练数据集;根据目标训练数据集,对目标训练模型进行训练,得到与待识别字符数据集对应的字符识别模型。本申请字符数据集之间的相似度,实现了在模型训练时进行学习迁移,从而提高了字符识别模型的生成效率。
  • 票据识别核验方法、装置、计算机设备及存储介质-202310678487.8
  • 张皓 - 平安科技(深圳)有限公司
  • 2023-06-08 - 2023-09-05 - G06V30/40
  • 本申请实施例属于数字医疗领域,应用于医疗相关票据识别领域中,涉及一种票据识别核验方法、装置、计算机设备及存储介质,包括接收医疗相关票据识别请求,医疗相关票据包括个人健康档案、处方、检查报告等;根据预训练完成的像素定位识别模型,识别出目标像素区域;对目标像素区域内字符进行提取,获得实际值和预估值;根据实际值和预估值的对比结果,判断目标票据是否核验成功。利用OCR识别结果与宽表结果对比方式,进行OCR识别核验,通过核验结果,进行校验优化,并利用增量式的核验方式,实现对不同种类的票据根据其业务种类和核验优先级调度进行OCR识别,保证了票据识别速度,智能化的识别医疗票据中的医疗数据,降低了医生的人力审阅消耗。
  • 票据识别方法、装置、电子设备以及存储介质-202210211125.3
  • 何烩烩;王佳阳;向宇波 - 北京百度网讯科技有限公司
  • 2022-03-03 - 2023-09-01 - G06V30/40
  • 本公开提供了一种票据识别方法、装置、电子设备以及存储介质,涉及深度学习、模式识别领域,可以为:获取待识别的目标票据;分别对多个文本块在目标票据上的二维位置信息进行编码处理,得到多个编码结果;分别对多个编码结果进行图卷积处理,得到多个卷积结果;基于第一条件随机场模型对每个卷积结果进行识别,得到目标票据的文本块级别的第一预测结果,第一条件随机场模型与第二条件随机场模型之间协同训练,第二条件随机场模型用于对每个卷积结果进行识别,以得到目标票据的字级别的第二预测结果。避免了第二条件随机场模型引入的切分误差,在提升第二条件随机场模型的性能的同时,也促进了第一条件随机场模型的预测性能。
  • 一种在线学习方法、装置、设备和存储介质-202010995715.0
  • 侯在鹏 - 百度在线网络技术(北京)有限公司;上海小度技术有限公司
  • 2020-09-21 - 2023-09-01 - G06V30/40
  • 本申请公开了一种在线学习方法、装置、设备和存储介质,涉及语音识别、自然语言处理和计算机视觉等人工智能技术领域。具体实现方案为:响应于当前用户的在线学习请求,确定所述当前用户的学习属性信息;根据所述当前用户的学习属性信息和候选用户的学习属性信息,从所述候选用户中为所述当前用户选择陪伴用户;为所述当前用户和选择的陪伴用户提供公共虚拟学习房间,用于相互陪伴学习。本申请能够一定程度的提高用户在线学习的积极性。
  • 基于字符分割的多方向自然场景文本检测方法-202010579227.1
  • 刘姝;邹北骥;杨文君;姜灵子 - 中南大学
  • 2020-06-23 - 2023-09-01 - G06V30/40
  • 本发明公开了一种基于字符分割的多方向自然场景文本检测方法,包括获取训练数据集并标定;建立基于字符分割的多方向自然场景文本检测初步模型;用标定的训练数据对基于字符分割的多方向自然场景文本检测初步模型进行训练得到基于字符分割的多方向自然场景文本检测模型;采用基于字符分割的多方向自然场景文本检测模型对自然场景的文本进行检测。本发明采用基于实例分割的方法分割文字字符实例,因此可以不必考虑文字的排列方向;同时,本方法结合了双向长短期记忆网络提取字符的上下文信息,预测字符之间的亲和度,从而可以更准确地将字符组合为文本行;因此,本发明方法可靠性高、实用性好且准确率较高。
  • 一种端到端税务票据文本检测与识别方法-201911220830.4
  • 刘新宇;李锐;于治楼 - 山东浪潮科学研究院有限公司
  • 2019-12-03 - 2023-09-01 - G06V30/40
  • 本发明特别涉及一种端到端税务票据文本检测与识别方法。该端到端税务票据文本检测与识别方法,首先采用目标检测算法粗略检测文本区域,根据税务票据文本某些文字之间间距大的特性提出边界注意力机制,细化文本区域;然后利用语义分割技术检测税务印章中的弯曲文本,同时进行文本识别。该端到端税务票据文本检测与识别方法,利用检测加分割技术既可以检测水平和多方向文本又可以检测弯曲文本,同时利用注意力机制通过迭代的方式实现了字间距大的文本实例的检测,而且实现了端到端的检测与识别,既可以提高检测与识别的准确率又可以提高整个流程的效率。
  • 图像识别方法装置、设备和存储介质-202210023327.5
  • 于海鹏;李煜林;钦夏孟;黄聚;姚锟 - 北京百度网讯科技有限公司
  • 2022-01-10 - 2023-08-29 - G06V30/40
  • 本公开提供了一种图像识别方法装置、设备和存储介质,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可应用于OCR等场景。具体实现方案为:基于待识别图像的特征图,得到多个键实例特征和多个值实例特征;将所述多个键实例特征和所述多个值实例特征进行匹配,得到多个实例特征组合;对所述多个实例特征组合中的每个实例特征组合中的键实例特征和值实例特征进行融合,得到所述每个实例特征组合所对应的融合特征;基于与所述多个实例特征组合分别对应的多个融合特征,得到所述待识别图像的多个键值识别结果。根据本公开的技术,可以充分利用图像中键实例丰富的语义信息,帮助值实例实现更好的分类解析,输出更加准确的图像识别结果。
  • 文档图像朝向检测方法和装置-202010376696.3
  • 曲福;庞敏辉;韩光耀;姜泽青 - 北京百度网讯科技有限公司
  • 2020-05-07 - 2023-08-25 - G06V30/40
  • 本申请公开了文档图像朝向检测方法和装置,涉及计算机视觉技术领域。该方法的一具体实施方式包括:将待测文档的图像中的前景点向第一坐标轴进行投影,得到多个第一投影点的分布信息,其中,第一坐标轴与图像的像素行方向或列方向平行;基于多个第一投影点分布信息,确定待测文档的文本行方向。该实施方式可以准确、高效地检测具有密集文本的文档的文本行朝向。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top