[发明专利]一种点读数据的制作方法、系统、存储介质及电子设备在审

申请号：	201910765794.3	申请日：	2019-08-19
公开（公告）号：	CN110490182A	公开（公告）日：	2019-11-22
发明（设计）人：	李俊	申请（专利权）人：	广东小天才科技有限公司
主分类号：	G06K9/20	分类号：	G06K9/20;G06K9/32;G06K9/22;G06F17/28;G06F17/27;G09B5/04;G10L13/08
代理公司：	31251 上海硕力知识产权代理事务所(普通合伙)	代理人：	郭桂峰<国际申请>=<国际公布>=<进入
地址：	523851 广东省东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音文件读数据文本文字信息文本区图片制作自动化存储介质电子设备返工现象开发效率人工操作人工成本重复操作图片区误操作系统化匹配书本开发
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种点读数据的制作方法、系统、存储介质及电子设备；其中，方法包括：获取待制作的书本资源；识别并勾勒出该书本资源中的文本区、图片区，确定该书本资源的文本点读区、及图片点读区；识别文本点读区的文字信息；根据上述文字信息，生成对应的文本点读语音文件；获得图片点读区的图片点读语音文件，并与图片点读区进行匹配；基于该书本资源的所有文本区及对应的文本点读语音文件、以及所有图片点读区及对应的图片点读语音文件，生成该书本资源的点读数据。通过本发明，将人工操作与重复操作自动化、系统化，减少了人工成本，并且减少了因人工误操作引发的二次返工现象，实现了点读数据制作自动化，减少开发成本，加快开发效率。

技术领域

本发明涉及数据处理领域，尤其涉及一种点读数据的制作方法、系统、存储介质及电子设备。

背景技术

当前家教机点读资源制作流程采用人工勾勒区域信息，手动取出书本中的文字，再将文字进行翻译，编辑脚本，整合脚本和书本资源，最后再打包生成一个点读资源数据，上传服务器，然后品检人员进行校验是否正常。

这样的方式会存在人工操作耗时较长，手动取词会存在人为差异，翻译可能存在不准确，导致最后生成的资源文件品检不通过，二次返工现象，如此，人力成本耗费较大，且效率和准确率也难以保证。

发明内容

为解决上述技术问题，本发明提供一种点读数据的制作方法、系统、存储介质及电子设备。

第一方面，本发明公开了一种点读数据的制作方法，包括：

获取待制作的书本资源；

识别并勾勒出所述书本资源中的文本区、图片区，确定所述书本资源的文本点读区、及图片点读区；

识别所述文本点读区的文字信息；

根据所述文字信息，生成对应的文本点读语音文件；

获得所述图片点读区的语音文件，并与所述图片点读区进行匹配；

基于所述书本资源的所有文本区及对应的文本点读语音文件、以及所有图片点读区及对应的图片点读语音文件，生成所述书本资源的点读数据。

进一步地，所述识别并勾勒出所述书本资源中的文本区、图片区，确定所述书本资源的文本点读区、及图片点读区具体包括：

利用训练好的神经网络识别模型将所述书本资源上的每一页进行识别勾勒；所述勾勒的区域包括图像区，文本区；

基于所述分割后的图像区及文本区进行优化勾勒处理；

对优化勾勒后的图像区、文本区进行筛选处理，去除无需点读的文本区和图片区，获得所述书本资源的文本点读区、及图片点读区；

进一步地，在识别所述文本点读区的文字信息之后还包括：

翻译所述文字信息，获得所述文字信息的双语版本；

所述根据所述文字信息，生成对应的文本点读语音文件具体包括：

根据所述文字信息的双语版本，生成对应的文本双语点读语音文件。

进一步地，在根据所述文字信息，生成对应的文本点读语音文件之前还包括：

对识别出的文字信息进行语义分析，获取所述文字信息的语义；

基于所述文字信息的语义，对所述文字信息进行纠错处理。

第二方面，本发明公开了一种点读数据的制作系统，包括：

资源导入模块，用于获取待制作的书本资源；

识别勾勒模块，用于识别并勾勒出所述书本资源中的文本区、图片区，确定所述书本资源的文本点读区、及图片点读区；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司，未经广东小天才科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910765794.3/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种点读数据的制作方法、系统、存储介质及电子设备在审

专利文献下载