[发明专利]一种语音点读方法、装置、设备和可读介质在审

申请号：	201910054309.1	申请日：	2019-01-21
公开（公告）号：	CN111461095A	公开（公告）日：	2020-07-28
发明（设计）人：	不公告发明人	申请（专利权）人：	北京字节跳动网络技术有限公司
主分类号：	G06K9/20	分类号：	G06K9/20;G06K9/34;G10L15/22;G10L15/26
代理公司：	北京品源专利代理有限公司 11332	代理人：	孟金喆
地址：	100080 北京市石景山区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音方法装置设备可读介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开实施例公开了一种语音点读方法、装置、设备和可读介质。其中，该方法包括：如果检测到用户指向当前待点读资料的操作，且，获取到用户的点读语音指令，则获取当前待点读资料的图像；根据所述操作和所述点读语音指令，识别当前待点读资料的图像中被指向区域的内容；根据所述点读语音指令，语音播报识别内容的点读结果。本公开实施例提供的技术方案，提高了点读的便利性和实时性，通过用户手指的直接操作实现点读，而无需通过专门配置的点读笔辅助实现对应的点读功能，提高了点读内容识别的准确性，增强了用户的使用体验。

技术领域

本公开实施例涉及计算机处理技术，尤其涉及一种语音点读方法、装置、设备和可读介质。

背景技术

在现有的点读设备中，为了满足点读的多样化需求，一般会为点读设备配置一个专用的点读笔，通过该点读笔点击书本上的相应位置，从而获取该位置的文字信息进行识别，如将点读笔按压于书本中的某一位置，根据该按压操作获取该位置点的坐标，从而将该位置点上的文字信息进行输出。

此时要求用户随身携带配置的点读笔，才能实现书本上的文字信息交互，在点读笔丢失时，无法使用该点读设备来识别书本中的资料信息，存在一定的点读局限性。

发明内容

有鉴于此，本公开实施例提供了一种语音点读方法、装置、设备和可读介质，解决了现有技术中必须通过点读笔点读资料的问题，降低了信息点读的局限性，提高了点读的便利性。

第一方面，本公开实施例提供了一种语音点读方法，该方法包括：

如果检测到用户指向当前待点读资料的操作，且，获取到用户的点读语音指令，则获取当前待点读资料的图像；

根据所述操作和所述点读语音指令，识别当前待点读资料的图像中被指向区域的内容；

根据所述点读语音指令，语音播报识别内容的点读结果。

进一步的，根据所述操作和所述点读语音指令，识别当前待点读资料的图像中被指向区域的内容，包括：