[发明专利]一种文档字符格式信息获取方法、系统、终端及存储介质在审

专利信息
申请号: 202010189557.X 申请日: 2020-03-18
公开(公告)号: CN111414730A 公开(公告)日: 2020-07-14
发明(设计)人: 苗功勋;李显程;王金国;崔新安;董盼山 申请(专利权)人: 中孚安全技术有限公司;中孚信息股份有限公司;北京中孚泰和科技发展股份有限公司;南京中孚信息技术有限公司
主分类号: G06F40/109 分类号: G06F40/109;G06F16/33;G06F16/31
代理公司: 济南舜昊专利代理事务所(特殊普通合伙) 37249 代理人: 曹媛媛
地址: 250101 山东省济南市高新*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 文档 字符 格式 信息 获取 方法 系统 终端 存储 介质
【说明书】:

发明提供一种文档字符格式信息获取方法、系统、终端及存储介质,所述方法包括:采集文件信息块的格式偏移参数和格式长度参数;根据信息偏移参数和信息长度参数通过IStream接口提取文档全部字体格式信息;采集文档PlcBteChpx数据,根据所述PlcBteChpx数据获取待查询字符的字体格式信息索引值;根据所述索引值读取所述待查询字符对应的字体格式信息。本发明通过分析doc文件格式,可直接定位字符位置和获取字符的字体和颜色信息。不仅可获取全部字符颜色、字体,也可以根据需要获取单个字符颜色、字体。提高了获取的doc文件格式信息的准确性,省时省力,且不存在兼容性问题。

技术领域

本发明涉及文件处理技术领域,具体涉及一种文档字符格式信息获取方法、系统、终端及存储介质。

背景技术

在使用doc文档时,对doc文档中的字符格式信息的获取需要人工去校对,当doc文档较大时,人工校对费时费力,且准确性不高。

基于此,需要直接查看文档的全部格式信息。但是目前对于doc文件的解析程序,需要获取文件中字符的颜色和字体时,无法利用Win32 API直接获取数据,需要调用二次开发接口来实现。如此操作有如下几个缺点:

依赖Office Word开发组件,即必须预先安装对应的Office Word程序,才能正常使用开发接口。效率低。容易受本地化设置的影响,且容易出现错误弹框,兼容性低。

发明内容

针对现有技术的上述不足,本发明提供一种文档字符格式信息获取方法、系统、终端及存储介质,以解决上述技术问题。

第一方面,本发明提供一种文档字符格式信息获取方法,包括:

采集文件信息块的格式偏移参数和格式长度参数;

根据信息偏移参数和信息长度参数通过IStream接口提取文档全部字体格式信息;

采集文档PlcBteChpx数据,根据所述PlcBteChpx数据获取待查询字符的字体格式信息索引值;

根据所述索引值读取所述待查询字符对应的字体格式信息。

进一步的,所述采集文件信息块的格式偏移参数和格式长度参数,包括:

从文件信息块的开始位置偏移120字节处提取长度为4字节的格式偏移参数;

从文件信息块的开始位置偏移124字节处提取长度为4字节的格式长度参数。

进一步的,所述采集文档PlcBteChpx数据,根据所述PlcBteChpx数据获取待查询字符的字体格式信息索引值,包括:

根据文件信息块的fWhichTblStm参数值获取待查询字符所在的数据流;

从所述数据流中提取待查询字符的段落位置信息;

根据所述段落位置信息从所述数据流中提取待查询字符所在段落对应的全部ChpxFkp结构数据;

从所述ChpxFkp结构数据提取索引值。

进一步的,所述根据索引值读取所述待查询字符对应的字体格式信息,包括:

根据所述索引值计算待查询字符的属性偏移长度;

根据待查询字符的段落位置信息和属性偏移长度定位待查询字符的字符属性在字体格式信息的位置;

根据所述位置从字体格式信息提取所述待查询字符的Prl结构的字符属性;

解析所述Prl结构的字符属性得到所述待查询字符的颜色和字体。

第二方面,本发明提供一种文档字符格式信息获取系统,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中孚安全技术有限公司;中孚信息股份有限公司;北京中孚泰和科技发展股份有限公司;南京中孚信息技术有限公司,未经中孚安全技术有限公司;中孚信息股份有限公司;北京中孚泰和科技发展股份有限公司;南京中孚信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010189557.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top