[发明专利]文件处理方法及装置、电子设备在审
| 申请号: | 202111155010.9 | 申请日: | 2021-09-29 |
| 公开(公告)号: | CN113849606A | 公开(公告)日: | 2021-12-28 |
| 发明(设计)人: | 林庆健;洪密;郭莉莉 | 申请(专利权)人: | 联想(北京)有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/34;G06F16/36;G06F40/30;G06K9/20;G06K9/32;G06K9/62 |
| 代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 王花丽;张颖玲 |
| 地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文件 处理 方法 装置 电子设备 | ||
本申请实施例公开了一种文件处理方法及装置、电子设备,所述文件处理方法包括:采集第一音频,对所述第一音频进行语音识别,得到第一识别结果;其中,所述第一音频与第一文本相关联;采集第一图像,对所述第一图像进行文本识别,得到第二识别结果;其中,所述第一图像中包含所述第一文本基于第一应用启动的呈现界面;将所述第一识别结果与所述第二识别结果进行匹配,得到匹配结果;基于所述匹配结果对所述第一文本中的匹配内容进行标识。本申请实施例方便用户确定当前发言与相应文本的对应之处,提升了用户体验。
技术领域
本申请实施例涉及文件处理技术,尤其涉及一种文件处理方法及装置、电子设备。
背景技术
在演讲者进行PPT展示的过程中,如果通过语音识别系统进行实时地语音识别,能更好地帮助用户进行内容整理。然而,语音识别系统一般是针对泛化场景设计的,对于常用词的转写准确率较高;但是对于仅在特定场景下出现的专业词汇或术语,语音识别的准确率有所下降。如果定制特定场景优化的语音识别系统,则成本较高,并且,对于不同主题的PPT展示,需要手动切换不同的语音识别系统。
发明内容
为解决现有存在的技术问题,本申请实施例提供一种文件处理方法及装置、电子设备。
本申请实施例的技术方案是这样实现的:
一种文件处理方法,包括:
采集第一音频,对所述第一音频进行语音识别,得到第一识别结果;其中,所述第一音频与第一文本相关联;以及
采集第一图像,对所述第一图像进行文本识别,得到第二识别结果;其中,所述第一图像中包含所述第一文本基于第一应用启动的呈现界面;
将所述第一识别结果与所述第二识别结果进行匹配,得到匹配结果;
基于所述匹配结果对所述第一文本中的匹配内容进行标识。
作为一种实现方式,所述对所述第一图像进行文本识别,得到第二识别结果,包括:
获取所述第一图像中的所述第一文本的呈现界面,识别出所述呈现界面中的文本块;
识别所述文本块中的文字,作为所述第二识别结果。
作为一种实现方式,所述将所述第一识别结果与所述第二识别结果进行匹配,得到匹配结果,包括:
获取所述第一识别结果中的第一文字内容,将所述第一文字内容分别与所述文本块的识别文字进行文本和/或语义文本匹配;
查找出与所述第一文字内容的文本和/或语义匹配度最高的文本块识别文字,作为匹配结果。
作为一种实现方式,所述基于所述匹配结果对所述第二识别结果中的识别内容进行标识,包括:
调整与所述第一文字内容的文本和/或语义匹配度最高的文本块识别文字所在区域的显示属性,以区别于其他文本块识别文字。
作为一种实现方式,所述方法还包括:
识别所述第一文字内容中的关键词,基于本地的知识图谱库获取所述关键词的领域相关词,将所述领域相关词作为热词表;
基于所述热词表在热词模型网络进行训练,基于所述热词模型网络对所述第一文字内容进行修正。
作为一种实现方式,所述方法还包括:
识别所述第一文字内容中的关键词,基于所述关键词进行知识图谱扩充,获取所述关键词的领域相关词,得到扩充数据;
基于所述扩充数据在设定的优化模型进行词汇训练,对所述第一文字内容进行修正。
作为一种实现方式,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111155010.9/2.html,转载请声明来源钻瓜专利网。





