[发明专利]一种筛选文本的方法及装置有效
申请号: | 201410658708.6 | 申请日: | 2014-11-18 |
公开(公告)号: | CN104331390B | 公开(公告)日: | 2018-09-11 |
发明(设计)人: | 陈俊光;罗尚虎 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
主分类号: | G06F17/21 | 分类号: | G06F17/21;G06F17/27 |
代理公司: | 北京信远达知识产权代理事务所(普通合伙) 11304 | 代理人: | 魏晓波 |
地址: | 310052 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明的实施方式提供了一种筛选文本的方法。例如,该方法可以包括:对电子文档中的文本元素进行解析,得到所述文本元素的属性;根据所述文本元素的属性,从所述文本元素中筛选出属性符合属性筛选规则的文本元素。通过从文本元素中筛选出属性符合属性筛选规则的文本元素,本发明的方法使得用户可以得到具有该特定属性的文本元素的集合,无需反复执行复制、切换文档、粘贴的操作,用户操作简单,而且终端无需与用户进行大量的交互操作,提高了终端运行效率。此外,本发明的实施方式提供了一种筛选文本的装置。 | ||
搜索关键词: | 一种 筛选 文本 方法 装置 | ||
【主权项】:
1.一种筛选文本的方法,包括:对电子文档中的文本元素进行解析,得到所述文本元素的属性;所述对电子文档中的文本元素进行解析,得到所述文本元素的属性包括:如果所述电子文档是遵守openxml标准协议的word文档,对所述电子文档进行解压缩,得到所述电子文档的子文件,根据openxml标准协议,从所述子文件中得到使用xml标签描述所述电子文档的文本元素及其属性的控制文件,从所述控制文件中使用Apache POI提供的接口或者根据文件直接属性的引用关系读取出文本元素及用于描述所述文本元素属性的xml标签;如果所述电子文档不是遵守openxml标准协议的word文档,将所述电子文档转换为遵守openxml标准协议的文档,进入所述对电子文档进行解压缩的步骤;根据所述文本元素的属性,从所述文本元素中筛选出属性符合属性筛选规则的文本元素,所述属性符合属性筛选规则的文本元素的属性是用户添加的;所述根据所述文本元素的属性,从所述文本元素中筛选出属性符合属性筛选规则的文本元素包括:从读取出的文本元素中筛选出所述属性筛选规则设置的筛选xml标签所描述的文本元素。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410658708.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种耐油高弹改性天然橡胶电缆料
- 下一篇:一种稳定的热固性塑料