[发明专利]信息处理设备和信息处理方法在审
申请号: | 201410602515.9 | 申请日: | 2014-10-31 |
公开(公告)号: | CN105630748A | 公开(公告)日: | 2016-06-01 |
发明(设计)人: | 杨华;张军 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/22 | 分类号: | G06F17/22;G06F17/27 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 韩炜;王萍 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 设备 方法 | ||
技术领域
本发明涉及信息处理领域,尤其涉及一种用于对层级结构布局的文档 信息进行处理的信息处理设备、信息处理方法以及电子装置。
背景技术
随着个人计算机和互联网的广泛应用,诸如电子书、电子文章等的电 子文档由于其便于保存、检索和携带而越来越受到人们的欢迎。由此,在 当前的信息处理领域中,人们越来越关注如何高效率地将纸质文档转换为 适合在计算机等电子设备上使用和进一步处理的文本文档。目前,用于转 换文本显示的电子文档的设备通常需要手动生成目录,使得从纸质文档到 电子文档的转换非常耗时,因此亟需一种能够提高电子文档转换效率的信 息处理设备。
发明内容
在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些 方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。 它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范 围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详 细描述的前序。
鉴于现有技术的上述缺陷,本发明的目的之一是提供一种信息处理设 备、信息处理方法以及电子装置,以至少克服现有的问题。
根据本公开的一个方面,提供一种信息处理设备,包括:预处理单元, 用于对按照层级结构布局的待处理文本信息进行预处理以生成可编辑文 本;以及目录识别单元,用于根据所述可编辑文本的正文中各个段落的段 落特征,对所述可编辑文本的目录中的各个层级进行识别,以生成具有层 级结构的目录。
根据本公开的另一方面,提供一种信息处理方法,包括:对按照层级 结构布局的待处理文本信息进行预处理以生成可编辑文本;以及根据所述 可编辑文本的正文中各个段落的段落特征,对所述可编辑文本的目录中的 各个层级进行识别,以生成具有层级结构的目录。
根据本公开的另一个方面,还提供了一种电子设备,该电子设备包括 如上所述的信息处理设备。
依据本公开的其它方面,还提供了一种使得计算机用作如上所述的信 息处理设备的程序。
依据本公开的又一方面,还提供了相应的计算机可读存储介质,该计 算机可读存储介质上存储有能够由计算设备执行的计算机程序,该计算机 程序在执行时能够使计算设备执行上述信息处理方法。
上述根据本公开实施例的信息处理设备和方法以及电子装置,至少能 够获得以下益处之一:能够自动生成目录;提高了文本识别的准确率。
通过以下结合附图对本公开的最佳实施例的详细说明,本公开的这些 以及其他优点将更加明显。
附图说明
本公开可以通过参考下文中结合附图所给出的描述而得到更好的理 解,其中在所有附图中使用了相同或相似的附图标记来表示相同或者相似 的部件。所述附图连同下面的详细说明一起包含在本说明书中并且形成本 说明书的一部分,而且用来进一步举例说明本公开的优选实施例和解释本 公开的原理和优点。其中:
图1是示意性地示出根据本公开实施例的信息处理设备的一种示例 结构的框图。
图2是示意性地示出图1中的目录识别单元的一种示例结构的框图。
图3是示意性地示出图2中的目录层级识别子单元的一种示例结构的 框图。
图4是示意性地示出图3中的遍历模块的示例性操作的示意图。
图5是示意性地示出遍历模块的确定目录层级的具体操作的示意图。
图6是示意性示出待处理信息的目录的一部分的示意图。
图7是示出根据本公开实施例的信息处理设备的另一种示例结构的 框图。
图8是示意性地示出图7中的阈值确定单元的一种示例结构的框图。
图9是示意性地示出图8中的聚类子单元的一种示例结构的框图。
图10是示出经聚类子单元聚类后的各组稳定质心之差的分布情况。
图11是示意性地示出图1中的预处理单元的一种示例结构的框图。
图12是示出了根据本公开的校正单元执行校正处理的用户界面的示 意图。
图13是示意性示出根据本公开实施例的信息处理方法的流程图。
图14是示出了可用来实现根据本公开实施例的信息处理设备和信息 处理方法的一种可能的硬件配置的结构简图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410602515.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:新型保温多管除尘器
- 下一篇:超声电机预压力自动调整装置