[发明专利]一种用于拆分阅读内容的数据处理方法及装置在审
申请号: | 202210413367.0 | 申请日: | 2022-04-19 |
公开(公告)号: | CN114896944A | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 李吉;黄双杰 | 申请(专利权)人: | 武汉阅米信息科技有限公司 |
主分类号: | G06F40/114 | 分类号: | G06F40/114;G06F40/169;G06F40/216;G06F16/901 |
代理公司: | 佛山知正知识产权代理事务所(特殊普通合伙) 44483 | 代理人: | 杨情情 |
地址: | 430000 湖北省武汉市东湖新技术开发区关南园一*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 拆分 阅读 内容 数据处理 方法 装置 | ||
1.一种用于拆分阅读内容的数据处理方法,其特征在于,包括以下步骤:
S1、对需要进行阅读的数据内容信息进行录入,所述数据内容信息包括正文内容、目录内容以及页码内容,同时正文内容按照章节进行录入,并对录入的数据内容信息进行整理与划分;
S2、将经过整理与划分之后的数据内容信息进行对应存储;
S3、对录入的数据内容信息进行数据处理,对录入的正文内容进行特征向量提取、页码提取以及数据排序,其中,进行特征向量提取具体包括以下步骤:
S301、对录入的需要进行阅读的数据内容信息按照章节进行统计,统计每个章节样本集中信息数据总数N;
S302、根据页码提取的数据统计数据内容信息中每个词语的正页数文档出现频率A、负页数文档出现频率B、正页数文档不出现频率A1以及负页数文档不出现频率B1;
S303、根据统计的数据频率,并按照阿拉伯数字顺序对数据内容信息中每个词语的数据频率从小到大进行排序,提取末尾出现频率最高的词语作为该章节的特征向量;
S4、将特征向量提取结果按照页码提取结果以及数据顺序进行排序,得到数据处理结果,并对所述数据处理结果进行存储;
S5、将存储的数据处理结果按照顺序进行语音输出操作。
2.根据权利要求1所述的一种用于拆分阅读内容的数据处理方法,其特征在于,所述步骤S1中对录入的数据内容信息进行整理与划分与具体操作步骤为:根据录入的数据内容信息,按照正文内容、目录内容以及页码内容,划分对应的类别,将属于同一类别的数据归为一类,同时对同一类别下的数据内容信息进行相应的顺序排列操作。
3.根据权利要求1所述的一种用于拆分阅读内容的数据处理方法,其特征在于,所述步骤S3中对录入的正文内容进行页码提取,具体包括以下步骤:
S311、根据特征向量提取结果,分别对每个章节中出现特征向量的段落进行提取;
S312、对具有特征向量的段落所在的页码进行提取,并对每个段落进行页码标注。
4.根据权利要求1所述的一种用于拆分阅读内容的数据处理方法,其特征在于,所述步骤S3中对录入的正文内容进行数据排序,具体包括以下步骤:
S321、在每个章节中,按照提取的具有特征向量段落的页码大小,对相应的段落进行排序操作;
S322、处于相同页码内的具有特征向量的段落,按照录入的正文内容顺序对其进行依次排序。
5.一种如权利要求1所述的用于拆分阅读内容的数据处理装置,其特征在于,包括数据录入单元、数据处理单元、数据存储单元、数据输出单元以及中央控制单元,所述数据录入单元的输出端与中央控制单元的输入端电性连接,所述数据处理单元的输入端与中央控制单元的输出端电性连接,所述数据处理单元的输出端与数据存储单元的输入端电性连接,所述数据存储单元与中央控制单元双向电性连接,所述数据输出单元的输入端与中央控制单元的输出端电性连接;
所述数据录入单元,用于对需要进行阅读的数据内容信息进行录入,并对录入的数据内容信息进行整理与划分,同时用于将录入的数据内容信息传递至所述数据存储单元以及所述数据处理单元;
所述数据处理单元,用于接收所述数据录入单元传递的数据内容信息,并对数据内容信息进行相应的数据处理操作,还用于将经过数据处理之后的数据内容信息传递至所述数据存储单元;
所述数据存储单元,用于接收所述数据录入单元传递的数据内容信息以及所述数据处理单元传递的经过数据处理之后的数据内容信息,并对其进行数据存储操作,还用于将经过数据处理之后的数据内容信息传递至所述数据输出单元;
所述数据输出单元,用于接收所述数据存储单元传递的经过数据处理之后的数据内容信息,并利用文字或者语音的方式对其进行输出;
所述中央控制单元,用于在所述数据录入单元、数据处理单元、数据存储单元以及数据输出单元之间进行控制操作。
6.根据权利要求5所述的一种用于拆分阅读内容的数据处理装置,其特征在于,所述数据录入单元、数据处理单元、数据存储单元、数据输出单元以及中央控制单元均集成于有声阅读终端设备内部。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉阅米信息科技有限公司,未经武汉阅米信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210413367.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种便携式超声波美容仪
- 下一篇:一种基于网络等值变换的配电网综合优化方法
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法