[发明专利]一种文档字符格式信息获取方法、系统、终端及存储介质在审
申请号: | 202010189557.X | 申请日: | 2020-03-18 |
公开(公告)号: | CN111414730A | 公开(公告)日: | 2020-07-14 |
发明(设计)人: | 苗功勋;李显程;王金国;崔新安;董盼山 | 申请(专利权)人: | 中孚安全技术有限公司;中孚信息股份有限公司;北京中孚泰和科技发展股份有限公司;南京中孚信息技术有限公司 |
主分类号: | G06F40/109 | 分类号: | G06F40/109;G06F16/33;G06F16/31 |
代理公司: | 济南舜昊专利代理事务所(特殊普通合伙) 37249 | 代理人: | 曹媛媛 |
地址: | 250101 山东省济南市高新*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文档 字符 格式 信息 获取 方法 系统 终端 存储 介质 | ||
本发明提供一种文档字符格式信息获取方法、系统、终端及存储介质,所述方法包括:采集文件信息块的格式偏移参数和格式长度参数;根据信息偏移参数和信息长度参数通过IStream接口提取文档全部字体格式信息;采集文档PlcBteChpx数据,根据所述PlcBteChpx数据获取待查询字符的字体格式信息索引值;根据所述索引值读取所述待查询字符对应的字体格式信息。本发明通过分析doc文件格式,可直接定位字符位置和获取字符的字体和颜色信息。不仅可获取全部字符颜色、字体,也可以根据需要获取单个字符颜色、字体。提高了获取的doc文件格式信息的准确性,省时省力,且不存在兼容性问题。
技术领域
本发明涉及文件处理技术领域,具体涉及一种文档字符格式信息获取方法、系统、终端及存储介质。
背景技术
在使用doc文档时,对doc文档中的字符格式信息的获取需要人工去校对,当doc文档较大时,人工校对费时费力,且准确性不高。
基于此,需要直接查看文档的全部格式信息。但是目前对于doc文件的解析程序,需要获取文件中字符的颜色和字体时,无法利用Win32 API直接获取数据,需要调用二次开发接口来实现。如此操作有如下几个缺点:
依赖Office Word开发组件,即必须预先安装对应的Office Word程序,才能正常使用开发接口。效率低。容易受本地化设置的影响,且容易出现错误弹框,兼容性低。
发明内容
针对现有技术的上述不足,本发明提供一种文档字符格式信息获取方法、系统、终端及存储介质,以解决上述技术问题。
第一方面,本发明提供一种文档字符格式信息获取方法,包括:
采集文件信息块的格式偏移参数和格式长度参数;
根据信息偏移参数和信息长度参数通过IStream接口提取文档全部字体格式信息;
采集文档PlcBteChpx数据,根据所述PlcBteChpx数据获取待查询字符的字体格式信息索引值;
根据所述索引值读取所述待查询字符对应的字体格式信息。
进一步的,所述采集文件信息块的格式偏移参数和格式长度参数,包括:
从文件信息块的开始位置偏移120字节处提取长度为4字节的格式偏移参数;
从文件信息块的开始位置偏移124字节处提取长度为4字节的格式长度参数。
进一步的,所述采集文档PlcBteChpx数据,根据所述PlcBteChpx数据获取待查询字符的字体格式信息索引值,包括:
根据文件信息块的fWhichTblStm参数值获取待查询字符所在的数据流;
从所述数据流中提取待查询字符的段落位置信息;
根据所述段落位置信息从所述数据流中提取待查询字符所在段落对应的全部ChpxFkp结构数据;
从所述ChpxFkp结构数据提取索引值。
进一步的,所述根据索引值读取所述待查询字符对应的字体格式信息,包括:
根据所述索引值计算待查询字符的属性偏移长度;
根据待查询字符的段落位置信息和属性偏移长度定位待查询字符的字符属性在字体格式信息的位置;
根据所述位置从字体格式信息提取所述待查询字符的Prl结构的字符属性;
解析所述Prl结构的字符属性得到所述待查询字符的颜色和字体。
第二方面,本发明提供一种文档字符格式信息获取系统,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中孚安全技术有限公司;中孚信息股份有限公司;北京中孚泰和科技发展股份有限公司;南京中孚信息技术有限公司,未经中孚安全技术有限公司;中孚信息股份有限公司;北京中孚泰和科技发展股份有限公司;南京中孚信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010189557.X/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置