[发明专利]一种用于拆分阅读内容的数据处理方法及装置在审

专利信息
申请号: 202210413367.0 申请日: 2022-04-19
公开(公告)号: CN114896944A 公开(公告)日: 2022-08-12
发明(设计)人: 李吉;黄双杰 申请(专利权)人: 武汉阅米信息科技有限公司
主分类号: G06F40/114 分类号: G06F40/114;G06F40/169;G06F40/216;G06F16/901
代理公司: 佛山知正知识产权代理事务所(特殊普通合伙) 44483 代理人: 杨情情
地址: 430000 湖北省武汉市东湖新技术开发区关南园一*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 用于 拆分 阅读 内容 数据处理 方法 装置
【说明书】:

发明公开了一种用于拆分阅读内容的数据处理方法及装置,包括以下步骤:对需要进行阅读的数据内容信息进行录入;将数据内容信息进行对应存储;对录入的数据内容信息进行数据处理;进行排序,得到数据处理结果,并对数据处理结果进行存储;将存储的数据处理结果按照顺序进行语音输出。本发明能够达到拆分阅读内容的效果,极大的降低了阅读量,从而达到提高用户对电子书的有声阅读效率的目的,同时保证用户能够在较短的时间内通过有声阅读方式了解到电子书的主线内容,从而避免了传统的全文式有声阅读方式,降低了有声阅读的时间,同时达到了相同的阅读效果,有利于实际的应用。

技术领域

本发明属于有声阅读技术领域,具体为一种用于拆分阅读内容的数据处理方法及装置。

背景技术

现有生活中,有声阅读又叫听书,严格来说,有声阅读已有上百年历史,当时,有声读物是针对盲人群体的。《辞海》中有声阅读的定义是:在磁带中录制的出版物,这也反映了早期有声阅读的特点,而随着时代的变迁与科技的进步,有声阅读的定义逐渐发生转变。21世纪初,有声阅读被定义为:包含不低于51%的文字内容,复制与包装成盒式磁带、高密度光盘或者单纯数字文件等形式进行销售的录音产品;另一种定义泛指:以听觉方式阅读的所有音频产品。如今,在数字技术的加持下,结合有声阅读的发展现状与新媒体的特点,有声阅读的定义为:以文字为主体内容,利用磁带、光盘、电子移动数字终端以及其他的音频设备为展示方式,通过下载或在线播放的收听录音制品的过程,随着新媒体技术的发展,为了满足读者个性化的有声阅读需求,有声阅读开始有多样化形式的发展,其中比较大的发展门类有综艺类、文学类、儿童读物类、艺术类等。近几年,网络有声读物发展迅速,原创有声类产品居多,成为了人们不可或缺的精神食粮。

而随着网络业务的迅速发展,电子书能够通过在线阅读的方式实时地展现在各个网络客户端上,带来便捷的阅读体验,但是在实际的阅读体验过程中,一本电子书的文字量较大,而人们的阅读时间有限,从而使得大部分用户难以坚持阅读完一本书,同时有声阅读也是如此,导致有声阅读的时间较长,因此,急需开发出一种能够拆分阅读内容、提取拆分阅读内容中主干阅读要点的数据处理方法及装置,从而达到提高用户对电子书的有声阅读效率的目的。

发明内容

本发明的目的就在于为了解决上述问题而提供一种用于拆分阅读内容的数据处理方法及装置,解决了背景技术中提到的问题。

为了解决上述问题,本发明提供了一种技术方案:

一种用于拆分阅读内容的数据处理方法,包括以下步骤:

S1、对需要进行阅读的数据内容信息进行录入,所述数据内容信息包括正文内容、目录内容以及页码内容,同时正文内容按照章节进行录入,并对录入的数据内容信息进行整理与划分;

S2、将经过整理与划分之后的数据内容信息进行对应存储;

S3、对录入的数据内容信息进行数据处理,对录入的正文内容进行特征向量提取、页码提取以及数据排序,其中,进行特征向量提取具体包括以下步骤:

S301、对录入的需要进行阅读的数据内容信息按照章节进行统计,统计每个章节样本集中信息数据总数N;

S302、根据页码提取的数据统计数据内容信息中每个词语的正页数文档出现频率A、负页数文档出现频率B、正页数文档不出现频率A1以及负页数文档不出现频率B1;

S303、根据统计的数据频率,并按照阿拉伯数字顺序对数据内容信息中每个词语的数据频率从小到大进行排序,提取末尾出现频率最高的词语作为该章节的特征向量;

S4、将特征向量提取结果按照页码提取结果以及数据顺序进行排序,得到数据处理结果,并对所述数据处理结果进行存储;

S5、将存储的数据处理结果按照顺序进行语音输出操作。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉阅米信息科技有限公司,未经武汉阅米信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210413367.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top