[发明专利]文本行提取有效
| 申请号: | 202080062570.7 | 申请日: | 2020-07-29 |
| 公开(公告)号: | CN114341954B | 公开(公告)日: | 2023-06-30 |
| 发明(设计)人: | 大卫·赫伯特 | 申请(专利权)人: | 迈思慧公司 |
| 主分类号: | G06V30/32 | 分类号: | G06V30/32;G06V10/82;G06V10/44;G06N3/047;G06N3/09 |
| 代理公司: | 北京信慧永光知识产权代理有限责任公司 11290 | 代理人: | 姚鹏;曹正建 |
| 地址: | 法国*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 提取 | ||
本发明涉及一种由设备实现的用于在显示区域中显示数字墨水的笔划(ST)以及用于执行文本行提取以从所述笔划(ST)提取文本行的方法。特别地,所述文本行提取可涉及:将所述显示区域切片成条带(SP);针对每个条带(SP),将所述笔划(ST)排序为排序列表,所述排序列表共同形成排序列表的第一集合;针对每个条带(SP),通过从所述第一集合的所述排序列表中过滤出低于给定大小阈值的笔划来形成排序列表的第二集合;以及基于所述第一集合和所述第二集合执行神经网络分析,以针对每个笔划确定它所属于的相应文本行。
技术领域
本公开总体涉及能够识别用户文本手写输入的计算设备接口的领域。具体地,本公开涉及用于从数字墨水的笔划中识别文本行的计算设备和对应的方法。
背景技术
计算设备在日常生活中变得越来越普遍。它们可采取各种形式,诸如计算机台式电脑、膝上型电脑、平板电脑、混合式计算机(二合一)、电子书阅读器、移动电话、智能电话、可穿戴计算机(包括智能手表、智能眼镜/耳机)、全球定位系统(GPS)单元、企业数字助理(EDA)、个人数字助理(PDA)、游戏机等。此外,计算设备正被并入车辆和装备中,诸如汽车、卡车、农用装备、制造装备、建筑环境控制(例如,照明、HVAC)以及家用和商用电器中。
已知各种形式的计算设备用于输入和识别用户手绘或手写的输入元素,诸如文本内容(例如,字母数字字符)或非文本内容(例如形状、图画)。为此,已知的计算设备通常配备有触敏表面等,以使用户能够以可显示在显示屏上的数字墨水笔划的形式输入手写内容。
用户通常可使用输入表面(或任何适当的用户界面)以自由手写格式(或自由手写模式)(即,不受文本手写输入的位置、大小和取向的任何手写约束)在计算设备上手写输入笔划。在自由手写模式下,不将线条图案强加给用户以进行手写。自由手写格式在手写输入期间给予用户完全的自由,这有时是期望的,例如以进行快速和杂项笔记或进行文本和非文本的混合输入。
图1A示出计算设备1的实例,所述计算设备1包括显示设备,所述显示设备使用适当的用户界面显示用户以自由手写模式手绘或手写的墨水输入元素。在这种情况下,计算设备1检测并显示文本内容4和6以及非文本内容8、10和12。这些元素中的每一个由一个或多个数字墨水笔划形成。输入元素可包括例如文本手写、图表、音乐注释等。在此实例中,非文本内容8是构成包含文本内容6的容器(框)的矩形等,使得可一起选择和操纵文本内容6和非文本内容8。
此外,也可由计算设备通过实施各种已知技术来执行手写识别。用户手写输入通常使用实时手写识别系统或方法来解释。可使用在线系统(使用基于云的解决方案等执行的识别)或离线系统。一旦被识别,计算设备就可将输入笔划转换成排版版本,如图1B中的这个实例中所描绘的。
文本行提取是文本手写识别的一个关键步骤。此操作旨在从用户以自由手写格式输入的文本内容中识别不同的文本行。换句话说,文本行提取允许计算设备确定各种输入笔划属于哪个文本行。虽然在一些情况下文本行提取可能相对简单,但它也可能变得特别复杂,并且在其他情况下,特别是当用户没有按年月顺序手写时可能导致错误。在许多情况下,用户以逻辑时间顺序手写文本,使得计算设备可依赖每个输入笔划的时间顺序来鉴定每个文本行的开始和结束。然而,当用户手写延迟笔划,即以非时间顺序时,难度急剧增加。
用户可例如决定沿着某个方向手写一组字符而不使用变音符号以节省时间,并且稍后决定用丢失的变音符号来补充所有字符组。一些语言特别倾向于这种非年月顺序的手写输入。例如,图2A和图2B示出以阿拉伯语和越南语手写输入的实例。可以看出,大量不同形式和风格的变音符号附在字符上。在此类语言中,非年月顺序的手写输入的问题变得至关重要。已知的计算设备可能特别难以确定给定的变音符号是附在字符的顶部处(这意味着变音符号属于下面的文本行)还是附在另一个字符的底部处(这意味着变音符号属于上面的文本行)。类似地,标点符号可能在手写完整的句子等之后添加在数据包中,从而产生更多的不确定性。例如,变音符号可能很容易与昏迷(coma)等混淆,从而使文本行提取任务变得更加复杂。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于迈思慧公司,未经迈思慧公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080062570.7/2.html,转载请声明来源钻瓜专利网。





