[发明专利]文本行提取有效

专利信息
申请号: 202080062570.7 申请日: 2020-07-29
公开(公告)号: CN114341954B 公开(公告)日: 2023-06-30
发明(设计)人: 大卫·赫伯特 申请(专利权)人: 迈思慧公司
主分类号: G06V30/32 分类号: G06V30/32;G06V10/82;G06V10/44;G06N3/047;G06N3/09
代理公司: 北京信慧永光知识产权代理有限责任公司 11290 代理人: 姚鹏;曹正建
地址: 法国*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文本 提取
【权利要求书】:

1.一种在计算设备上处理文本手写的方法,所述计算设备包括处理器、存储器和用以在所述处理器的控制下识别输入的至少一个非暂时性计算机可读介质,所述方法包括:

在显示区域中显示沿手写取向输入的数字墨水的笔划;

执行文本行提取以从所述笔划提取文本行,所述文本行提取包括:

将所述显示区域切片成横向于所述手写取向延伸的条带,其中相邻的条带彼此部分地重叠,使得每个笔划包含在至少两个相邻的条带中;

针对每个条带,对至少部分地包含在所述条带中的所述笔划进行排序,以生成按时间顺序排列的第一时间排序的笔划列表和根据至少一个相应的空间标准排序的至少一个第一空间排序的笔划列表,从而形成排序列表的第一集合;

针对每个条带,通过分别从所述第一时间排序的笔划列表和所述至少一个第一空间排序的笔划列表中过滤出低于大小阈值的笔划,形成包括第二时间排序的笔划列表和至少一个第二空间排序的笔划列表的排序列表的第二集合;

执行神经网络分析,以针对所述第一集合和所述第二集合的每个排序列表中的每对连续笔划,作为决策类确定相应对的所述笔划是否属于同一文本行,关联所述决策类的概率分数;

针对包括在所述第一集合和所述第二集合的至少一个排序列表中的每对连续笔划,选择在所述神经网络分析期间被确定为具有最高概率分数的决策类;以及

通过基于针对每对连续笔划选择的具有最高概率分数的所述决策类将笔划组合到行假设中来定义文本行。

2.如权利要求1所述的方法,其中所述数字墨水的笔划以没有任何手写引导约束的自由手写格式输入。

3.如权利要求1所述的方法,其中所述切片被配置为使得所述条带沿相同的条带取向延伸。

4.如权利要求3所述的方法,其中所述切片包括:

基于所述笔划的比例确定所述条带的宽度;以及

将每个笔划分配给所述笔划至少部分地包含在其中的每个条带。

5.如权利要求3所述的方法,其中所述切片被配置为使得每对相邻的条带彼此部分地重叠,以共享它们的相应面积的50%与85%之间。

6.如权利要求3所述的方法,其中在所述排序中针对每个条带生成的所述至少一个第一空间排序的笔划列表包括以下项中的至少一者:

空间排序的笔划列表,所述空间排序的笔划列表根据所述条带的每个笔划的相应重心沿所述条带取向的位置进行排序;

空间排序的笔划列表,所述空间排序的笔划列表根据所述条带的每个笔划在沿所述条带取向的第一方向上的最外侧坐标进行排序;以及

空间排序的笔划列表,所述空间排序的笔划列表根据所述条带的每个笔划在沿所述条带取向的与所述第一方向相反的第二方向上的最外侧坐标进行排序。

7.如权利要求1所述的方法,其中所述形成排序列表的第二集合包括:针对每个条带,

基于所述条带的每个笔划在所述条带取向上的高度或最大距离中的至少一者评估所述笔划的第一大小,并且基于所述条带的每个笔划的长度评估所述笔划的第二大小;

当所述第一大小或所述第二大小低于大小阈值时,从所述第一时间排序的笔划列表和所述至少一个第一空间排序的笔划列表中移除每个笔划,从而分别生成所述第二时间排序的笔划列表和所述至少一个第二空间排序的笔划列表。

8.如权利要求1所述的方法,其中所述神经网络分析包括:

通过至少一个人工分类器或神经网络计算概率分数,所述概率分数表示包括在排序列表的所述第一集合和所述第二集合的所述排序列表中的每对连续笔划中的所述笔划属于同一文本行的概率;

针对每对连续笔划,如果所述概率分数达到至少概率阈值,则作为决策类确定相应对的所述笔划属于同一文本行。

9.如权利要求8所述的方法,其中在所述神经网络分析期间,所述至少一个人工神经网络循序地分析所述第一集合和所述第二集合的每个排序列表中的每对连续笔划,以基于与所述排序列表中的所述笔划相关的空间和时间信息确定相应的决策类和概率分数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于迈思慧公司,未经迈思慧公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202080062570.7/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top