[发明专利]文件处理方法及装置、电子设备在审

申请号：	202111155010.9	申请日：	2021-09-29
公开（公告）号：	CN113849606A	公开（公告）日：	2021-12-28
发明（设计）人：	林庆健;洪密;郭莉莉	申请（专利权）人：	联想（北京）有限公司
主分类号：	G06F16/33	分类号：	G06F16/33;G06F16/34;G06F16/36;G06F40/30;G06K9/20;G06K9/32;G06K9/62
代理公司：	北京派特恩知识产权代理有限公司 11270	代理人：	王花丽;张颖玲
地址：	100085 北京市海淀***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文件处理方法装置电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例公开了一种文件处理方法及装置、电子设备，所述文件处理方法包括：采集第一音频，对所述第一音频进行语音识别，得到第一识别结果；其中，所述第一音频与第一文本相关联；采集第一图像，对所述第一图像进行文本识别，得到第二识别结果；其中，所述第一图像中包含所述第一文本基于第一应用启动的呈现界面；将所述第一识别结果与所述第二识别结果进行匹配，得到匹配结果；基于所述匹配结果对所述第一文本中的匹配内容进行标识。本申请实施例方便用户确定当前发言与相应文本的对应之处，提升了用户体验。

技术领域

本申请实施例涉及文件处理技术，尤其涉及一种文件处理方法及装置、电子设备。

背景技术

在演讲者进行PPT展示的过程中，如果通过语音识别系统进行实时地语音识别，能更好地帮助用户进行内容整理。然而，语音识别系统一般是针对泛化场景设计的，对于常用词的转写准确率较高；但是对于仅在特定场景下出现的专业词汇或术语，语音识别的准确率有所下降。如果定制特定场景优化的语音识别系统，则成本较高，并且，对于不同主题的PPT展示，需要手动切换不同的语音识别系统。

发明内容

为解决现有存在的技术问题，本申请实施例提供一种文件处理方法及装置、电子设备。

本申请实施例的技术方案是这样实现的：

一种文件处理方法，包括：

采集第一音频，对所述第一音频进行语音识别，得到第一识别结果；其中，所述第一音频与第一文本相关联；以及

采集第一图像，对所述第一图像进行文本识别，得到第二识别结果；其中，所述第一图像中包含所述第一文本基于第一应用启动的呈现界面；

将所述第一识别结果与所述第二识别结果进行匹配，得到匹配结果；

基于所述匹配结果对所述第一文本中的匹配内容进行标识。

作为一种实现方式，所述对所述第一图像进行文本识别，得到第二识别结果，包括：

获取所述第一图像中的所述第一文本的呈现界面，识别出所述呈现界面中的文本块；

识别所述文本块中的文字，作为所述第二识别结果。

作为一种实现方式，所述将所述第一识别结果与所述第二识别结果进行匹配，得到匹配结果，包括：