[发明专利]一种点读数据的制作方法、系统、存储介质及电子设备在审

申请号：	201910765794.3	申请日：	2019-08-19
公开（公告）号：	CN110490182A	公开（公告）日：	2019-11-22
发明（设计）人：	李俊	申请（专利权）人：	广东小天才科技有限公司
主分类号：	G06K9/20	分类号：	G06K9/20;G06K9/32;G06K9/22;G06F17/28;G06F17/27;G09B5/04;G10L13/08
代理公司：	31251 上海硕力知识产权代理事务所(普通合伙)	代理人：	郭桂峰<国际申请>=<国际公布>=<进入
地址：	523851 广东省东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音文件读数据文本文字信息文本区图片制作自动化存储介质电子设备返工现象开发效率人工操作人工成本重复操作图片区误操作系统化匹配书本开发
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种点读数据的制作方法，其特征在于，包括：

获取待制作的书本资源；

识别并勾勒出所述书本资源中的文本区、图片区，确定所述书本资源的文本点读区、及图片点读区；

识别所述文本点读区的文字信息；

根据所述文字信息，生成对应的文本点读语音文件；

获得所述图片点读区的语音文件，并与所述图片点读区进行匹配；

基于所述书本资源的所有文本区及对应的文本点读语音文件、以及所有图片点读区及对应的图片点读语音文件，生成所述书本资源的点读数据。

2.根据权利要求1所述的一种点读数据的制作方法，其特征在于，所述识别并勾勒出所述书本资源中的文本区、图片区，确定所述书本资源的文本点读区、及图片点读区具体包括：

利用训练好的神经网络识别模型将所述书本资源上的每一页进行识别勾勒；所述勾勒的区域包括图像区，文本区；

基于所述分割后的图像区及文本区进行优化勾勒处理；

对优化勾勒后的图像区、文本区进行筛选处理，去除无需点读的文本区和图片区，获得所述书本资源的文本点读区、及图片点读区。

3.根据权利要求1所述的一种点读数据的制作方法，其特征在于，在识别所述文本点读区的文字信息之后还包括：

翻译所述文字信息，获得所述文字信息的双语版本；

所述根据所述文字信息，生成对应的文本点读语音文件具体包括：

根据所述文字信息的双语版本，生成对应的文本双语点读语音文件。

4.根据权利要求1-3任一项所述的一种点读数据的制作方法，其特征在于，在根据所述文字信息，生成对应的文本点读语音文件之前还包括：

对识别出的文字信息进行语义分析，获取所述文字信息的语义；

基于所述文字信息的语义，对所述文字信息进行纠错处理。

5.一种点读数据的制作系统，其特征在于，包括：

资源导入模块，用于获取待制作的书本资源；

识别勾勒模块，用于识别并勾勒出所述书本资源中的文本区、图片区，确定所述书本资源的文本点读区、及图片点读区；

文字识别模块，用于识别所述文本点读区的文字信息；

文字语音生成模块，用于根据所述文字信息，生成对应的文本点读语音文件；

图片语音处理模块，用于获得所述图片点读区的语音文件，并与所述图片点读区进行匹配；

点读数据制作模块，用于基于所述书本资源的所有文本区及对应的文本点读语音文件、以及所有图片点读区及对应的图片点读语音文件，生成所述书本资源的点读数据。

6.根据权利要求5所述的一种点读数据的制作系统，其特征在于，所述识别勾勒模块包括：

识别勾勒子模块，用于利用训练好的神经网络识别模型将所述书本资源上的每一页进行识别勾勒；所述勾勒的区域包括图像区，文本区；

优化勾勒子模块，用于基于所述分割后的图像区及文本区进行优化勾勒处理；

筛选处理子模块，用于对优化勾勒后的图像区、文本区进行筛选处理，去除无需点读的文本区和图片区，获得所述书本资源的文本点读区、及图片点读区。

7.根据权利要求5所述的一种点读数据的制作系统，其特征在于，还包括：

翻译模块，用于翻译所述文字信息，获得所述文字信息的双语版本，以便所述文字语音生成模块根据所述文字信息的双语版本，生成对应的文本双语点读语音文件。

8.根据权利要求5-7任一项所述的一种点读数据的制作系统，其特征在于，还包括：

语义理解模块，用于对所述文字识别模块识别出的文字信息进行语义分析，获取所述文字信息的语义；

纠错处理模块，用于基于所述文字信息的语义，对所述文字信息进行纠错处理。

9.一种存储介质，其特征在于，所述存储介质存储有多条指令，所述多条指令被一个或者多个处理器执行，以实现权利要求1-4中任一项所述的点读数据的制作方法的步骤。

10.一种电子设备，其特征在于，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

获取待制作的书本资源；

识别并勾勒出所述书本资源中的文本区、图片区，确定所述书本资源的文本点读区、及图片点读区；

识别所述文本点读区的文字信息；

根据所述文字信息，生成对应的文本点读语音文件；

获得所述图片点读区的语音文件，并与所述图片点读区进行匹配；

基于所述书本资源的所有文本区及对应的文本点读语音文件、以及所有图片点读区及对应的图片点读语音文件，生成所述书本资源的点读数据。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司，未经广东小天才科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910765794.3/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种点读数据的制作方法、系统、存储介质及电子设备在审

专利文献下载