[发明专利]一种实现数字内容跨终端出版的系统在审
申请号: | 201410270214.0 | 申请日: | 2014-06-17 |
公开(公告)号: | CN104090920A | 公开(公告)日: | 2014-10-08 |
发明(设计)人: | 吴雷;阮怀伟;昌磊;虞勇勇 | 申请(专利权)人: | 安徽教育网络出版有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/21 |
代理公司: | 安徽合肥华信知识产权代理有限公司 34112 | 代理人: | 余成俊 |
地址: | 230601 安徽省合*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实现 数字 内容 终端 出版 系统 | ||
技术领域
本发明涉及计算机和人工智能应用领域,具体是一种实现数字内容跨终端出版的系统。
背景技术
国内外学者对数字内容跨终端出版的研究做了大量有价值的工作。比如,亚马逊Kindle阅读器的专有格式,提供一种可以识别原生PDF,使用E-ink技术,使阅读如同纸张一般,且通过与出版集团的合作提供教科书。微软等IT公司于出版商、出版物经销商等联合主导研发的开放格式Epub,该格式的国际影响力不断加强,且渐渐成为国际电子书格式的通用标准。国内方面,方正主导的面向移动终端研发的XEB电子书格式体系成为国内该领域的事实标准,并推出了一种独立于软件、硬件、操作系统、打印设备的CEBX文档格式规范,其能够保留原文件的字符、字体、版式和色彩等重要信息。
跨终端出版,需要出版者同时将传输相同内容到不同媒体上以满足受众的不同需求的过程。即需要将传统的出版内容进行知识化、碎片化,根据终端的不同需求进行内容的自适应重组,以实现一次创建、多次出版的需要。但是国内外跨终端数字出版的研究,所建立的终端电子书格式都具有自身的知识产权,不愿意对外公开自己的格式标准。而开放格式Epub虽然具有版面结构信息和文档逻辑语义信息,对阅读呈现效果的规范性存在不足,而且由于传统的出版物版式制作主要为了印刷,较少考虑数字出版,因此有传统的排版技术转化成Epub存在着很多困难,特别是版面中数学公式、表格、图形等复杂对象,在移动终端上无法高质量地呈现。
发明内容 本发明的目的是提供一种实现数字内容跨终端出版的系统,以解决现有技术存在的问题。
为了达到上述目的,本发明所采用的技术方案为:
一种实现数字内容跨终端出版的系统,其特征在于:包括PDF处理子系统、PDF版面分析与信息抽取子系统、跨终端自适应重组子系统、日志管理子系统、以及具有版式信息的XML文档库,其中:
所述的PDF处理子系统从用户获得PDF文档,然后根据PDF固有的物理结构和逻辑结构,经过PDF处理子系统自带的PDF处理引擎将PDF内容流输出,形成结构良好的XML文档;
所述的PDF版面分析与信息抽取子系统,对结构良好的XML文档进行进一步的处理,分析PDF的版面信息,将抽取规则中的语义项与数据项特征的映射关系转换为语义项与数据项的映射关系,利用PDF源码中的版式数据中存在的版式信息,辅以语义分析,提取版式数据的逻辑结构,将无序、无结构的数据组织成有序、有机构的数据,从而提取必要的文字和版式信息,自动判定排版方向、合并正文块,自动还原正文阅读顺序,自动关联文章标题和正文,并进行附图与图说、文章与附图之间的自动关联,自动进行版心定位、页眉页脚和页码处理;
所述的跨终端自适应重组子系统,由服务器端根据客户端的请求生成合适阅读终端的页面,下载到移动阅读终端并在终端上进行显示,服务器端负责数字内容的绘制工作,对于PC或者具有较大屏幕的移动阅读终端,服务器端生成原始版面终端,供终端客户端或者通用浏览器实现下载阅读,对于小屏幕的移动阅读终端,服务器端会根据移动阅读终端的具体的设备信息,将存储的流式和结构化数据的XML文档快速重新绘制成客户端页面;
所述的日志管理子系统包括日志分析器和用户行为日志数据库,通过检索器建立用户接口,方便用户查询检索信息,将用户的行为记录在用户行为日志数据库中,作为日志分析器的依据,日志管理子系统记录用户在各个子系统中的行为情况,并且将日志情况汇集到日志管理子系统中,用于数据的查询和分析。
所述的一种实现数字内容跨终端出版的方法,其特征在于:跨终端自适应重组子系统的自适应过程如下:
将XML文档进行格式化处理:分析如何利用工具将XML文档转化为XML树;
终端设备信息的获取:分析如何获取终端设备的信息以及提取终端设备信息,并为终端建立数据库,记录终端设备信息参数;
图片资源的下载和适配:分析如何将从PDF中抽取得到的图片进行处理,并利用终端设备信息库对图片进行相应的格式转换和大小自适应改变;
文本资源的适配:分析如何利用建立的终端设备信息库对文本设置进行自适应重组,并添加新的版式风格。
所述的一种实现数字内容跨终端出版的方法,其特征在于:所述的具有版式信息的XML文档库包括数据库、文本库、图片库、版式信息库,其中版式信息库是经过标引形成的PDF版式信息库。
所述的一种实现数字内容跨终端出版的方法,其特征在于:所述的PDF引擎,可以解析不同版本的PDF文档,可以对PDF文档进行内容提取和结构分析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽教育网络出版有限公司,未经安徽教育网络出版有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410270214.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于超图排序的新闻推荐方法
- 下一篇:一种用于提供待发布信息的方法和装置
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法