[发明专利]在线文档文件的切分方法和在线文档文件的切分系统在审
申请号: | 201610119643.7 | 申请日: | 2016-03-02 |
公开(公告)号: | CN107153633A | 公开(公告)日: | 2017-09-12 |
发明(设计)人: | 崔晓兵 | 申请(专利权)人: | 北大方正集团有限公司;北京北大方正电子有限公司 |
主分类号: | G06F17/21 | 分类号: | G06F17/21;G06F17/22;G06F17/27 |
代理公司: | 北京友联知识产权代理事务所(普通合伙)11343 | 代理人: | 尚志峰,汪海屏 |
地址: | 100871 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 在线 文档 文件 切分 方法 系统 | ||
技术领域
本发明涉及文档处理技术领域,具体而言,涉及一种在线文档文件的切分方法和一种在线文档文件的切分系统。
背景技术
随着互联网技术的发展,越来越多的用户希望文本文档在Web端发挥越来越多的作用,例如越来越多学校或培训机构采用在线考试系统,虽然已有很多电子化题库,但其通常仅仅是单纯的纸质文本电子化,且均为单一性科目,比如语文试卷通常都包括:“选择”、“填空”,“阅读理解”“文言文翻译”、“作文”等多种题型,无法给老师提供进一步选择与编辑的空间,因此老师很难配合当前学生的程度出题或者给出综合化试卷,比如一张只有选择题的试卷,或融合了语文、英语、历史、政治等多学科的试卷。
另外,在传媒端搜索某明星新闻时,往往输入明星的名字搜到的新闻无出处,五花八门,真假难辨,在这种情况下,如果可以对其之前关于明星的专访报道从之前的权威媒体的报章杂志中单独切分出来并保存,则可通过搜寻该“明星名字”与“独家专访”等关键字找到相对客观的访谈内容,则之前单独切分出的文档都可以直接显示出来拼成一个完整版面供读者阅读。
因此,如何设计一种新的在线文档文件的切分方案以提升用户在线体验成为亟待解决的技术问题。
发明内容
本发明正是基于上述技术问题至少之一,提出了一种新的在线文档文件的切分方案,通过获取标签信息并将标签信息的位置确定为切分位置, 完成了文档文件的切分,从而实现了用户只对某个切分后的文档进行浏览或编辑,或根据要求选择切分后的文档进行重新组合生成新的文档文件的功能,满足了用户多元化的需求。
有鉴于此,本发明提出了一种在线文档文件的切分方法,包括:解析待切分的文档文件,以确定待切分的文档文件中的标签信息;将标签信息的位置确定为切分位置;根据拆分位置对待切分的文档文件进行切分。
在该技术方案中,通过获取标签信息并将标签信息的位置确定为切分位置,完成了文档文件的切分,从而实现了用户只对某个切分后的文档进行浏览或编辑、或根据要求选择切分后的文档进行重新组合生成新的文档文件的功能,满足了用户多元化的需求。
在上述技术方案中,优选地,在解析待切分的文档文件,以确定待切分的文档文件中的标签信息前,还包括:获取待切分的原始文档文件;将原始文档文件中与标签信息匹配的字符替换为预设字符;在替换为预设字符后,对原始文档文件进行类识别,以确定原始文档文件中的元素对象,其中元素对象包括表格对象、公式对象、图片对象和文本对象中的至少一个。
在该技术方案中,如果待切分的文档文件中存在与标签信息相匹配的字符,则该字符也会被识别为标签信息,从而会造成文档切分出错,因此在将原始文档文件中与标签信息匹配的字符替换为与标签信息无关的预设字符,提高了在线文档文件切分的准确性。
在上述技术方案中,优选地,在解析待切分的文档文件,以确定待切分的文档文件中的标签信息前,还包括:根据元素对象的属性参数将经过类识别的原始文档文件转换为图片文件;获取在元素对象中的任两个对象之间插入的标签信息,以生成待切分的文档文件。
在该技术方案中,将待切分的文档文件中的表格对象、公式对象、图片对象和文本对象转换为图片文件,并在任两个图片文件之间插入标签信息,插入的标签描述的是两个图片文件中的前一个的信息,达到了原始文档文件切分的效果。
在上述任一项技术方案中,优选地,包括:在根据拆分位置对待切分 的文档文件进行切分后,将待切分的文档文件转换为活动文档;将活动文档上传至文档服务器。
在该技术方案中,通过活动文档(即Active Document)多任务,将切分后的文档转换为可以在Web端显示的活动文档,并上传至服务网,从而实现了用户在Web端对切分后的文档的查找和组合。
在上述技术方案中,优选地,还包括:在本地存储器中保存活动文档。
在该技术方案中,通过将活动文档保存在本地存储器,便于用户对活动文档进行查看和管理。
根据本发明第二方面,还提出了一种在线文档文件的切分系统,包括:解析单元,用于解析待切分的文档文件,以确定待切分的文档文件中的标签信息;确定单元,用于将标签信息的位置确定为切分位置;切分单元,用于根据拆分位置对待切分的文档文件进行切分。
在该技术方案中,通过获取标签信息并将标签信息的位置确定为切分位置,完成了文档文件的切分,从而实现了用户只对某个切分后的文档进行浏览或编辑、或根据要求选择切分后的文档进行重新组合生成新的文档文件的功能,满足了用户多元化的需求。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京北大方正电子有限公司,未经北大方正集团有限公司;北京北大方正电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610119643.7/2.html,转载请声明来源钻瓜专利网。