[发明专利]一种对电子图书进行快速语义标注的方法和系统无效
申请号: | 201110289165.1 | 申请日: | 2011-09-27 |
公开(公告)号: | CN102332023A | 公开(公告)日: | 2012-01-25 |
发明(设计)人: | 张训军 | 申请(专利权)人: | 北京中科希望软件股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100190 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电子图书 进行 快速 语义 标注 方法 系统 | ||
1.一种对电子图书进行快速语义标注的方法,其特征在于包括如下步骤:
(1)以独立于电子图书的方式建立用于描述电子图书的结构的目录结构文件,把电子图书的章节目录提取出来,并建立树状结构层次关系,同时每个章节元素含有页码信息的属性;
(2)在目录结构文件的基础上对目录元素进行语义标注;
(3)对电子图书按页进行分割成多个页文件,每个页文件是电子图书的一页内容;
(4)将所述目录结构文件与图书CIP数据、版权声明以及所述多个页文件一起打包,形成一个完整的电子图书文件包。
2.根据权利要求1所述的对电子图书进行快速语义标注的方法,其特征在于所述目录结构文件以XML形式存在,其内容形式采用电子图书的传统目录形式,并可以被第三方工具识别出。
3.根据权利要求2所述的对电子图书进行快速语义标注的方法,其特征在于每一个XML目录元素具有结构属性,分别为标题内容与页码范围。
4.根据权利要求1所述的对电子图书进行快速语义标注的方法,其特征在于所述目录结构文件的生成包括如下步骤:
(11)制订电子书稿在排版过程中对段落样式的命名的规范;
(12)根据段落样式命名规范,把电子图书中标题部分提取出来,形成一个没有层次关系的XML文件,每一个XML元素是一个标题内容,该元素具有一个页码属性用来存放该标题所在页码的信息;
(13)把无层次关系的XML文件按前缀大小关系重组建立新的章节元素,该元素有一个子元素是标题元素,有两个属性存放该元素的页码范围。
5.根据权利要求1所述的对电子图书进行快速语义标注的方法,其特征在于对所述目录元素进行语义标注的方法采用多元数组法或者知识点法,并且均通过手工填加。
6.根据权利要求1所述的对电子图书进行快速语义标注的方法,其特征在于还包括如下步骤:
(5)建立一个数据库,把所述目录结构文件和所述多个页文件保存于数据库中;
(6)通过语义检索在目录结构文件中对目录元素进行检索,根据所检索到的目录元素所指向的页码在所述数据库中检索页文件。
7.根据权利要求1所述的对电子图书进行快速语义标注的方法,其特征在于通过语义检索在电子图书文件包中的目录结构文件中对目录元素进行检索,根据所检索到的目录元素所指向的页码在电子图书文件包中检索页文件。
8.一种对电子图书进行快速语义标注的系统,其特征在于包括如下装置:
用于以独立于电子图书的方式建立用于描述电子图书的结构的目录结构文件,把电子图书的章节目录提取出来,并建立树状结构层次关系,同时在每个章节元素中填加有页码信息的装置;
用于在目录结构文件的基础上对目录元素进行语义标注的装置;
用于对电子图书按页进行分割成多个页文件的装置,每个页文件是电子图书的一页内容;
用于将所述目录结构文件与图书CIP数据、版权声明以及所述多个页文件一起打包,形成一个完整的电子图书的装置。
9.根据权利要求8所述的对电子图书进行快速语义标注的系统,其特征在于所述目录结构文件以XML形式存在,其内容形式采用电子图书的传统目录形式,并可以被第三方工具识别出。
10.根据权利要求9所述的对电子图书进行快速语义标注的系统,其特征在于每一个XML目录元素具有结构属性,分别为标题内容与页码范围。
11.根据权利要求8所述的对电子图书进行快速语义标注的系统,其特征在于用于生成所述目录结构文件的装置包括如下装置:
用于制订电子书稿在排版过程中对段落样式的命名的规范的装置;
用于根据段落样式命名规范,把电子图书中标题部分提取出来,形成一个没有层次关系的XML文件的装置,每一个XML元素是一个标题内容,该元素具有一个页码属性用来存放该标题所在页码的信息;
用于把无层次关系的XML文件按前缀大小关系重组建立新的章节元素的装置,该元素有一个子元素是标题元素,有两个属性存放该元素的页码范围。
12.根据权利要求8所述的对电子图书进行快速语义标注的系统,其特征在于采用多元数组法或者知识点法对所述目录元素进行语义标注,并且均通过手工填加。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科希望软件股份有限公司,未经北京中科希望软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110289165.1/1.html,转载请声明来源钻瓜专利网。