[发明专利]基于文字识别的组件集展示方法、装置和计算机设备有效
| 申请号: | 201911304399.1 | 申请日: | 2019-12-17 |
| 公开(公告)号: | CN111190576B | 公开(公告)日: | 2022-09-23 |
| 发明(设计)人: | 石兴;肖赵栋 | 申请(专利权)人: | 深圳平安医疗健康科技服务有限公司 |
| 主分类号: | G06F8/20 | 分类号: | G06F8/20 |
| 代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉 |
| 地址: | 518000 广东省深圳市福田区华*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 文字 识别 组件 展示 方法 装置 计算机 设备 | ||
1.一种基于文字识别的组件集展示方法,其特征在于,包括:
利用预设摄像头采集预设的业务逻辑图,其中,所述业务逻辑图由多个实体按指定逻辑顺序组合而成;所述多个实体包括第一实体和第二实体,所述第一实体由印刷体文字书写,所述第二实体由手写体文字书写;
根据预设的文字识别方法,对所述业务逻辑图进行文字识别,从而得到初始单词序列,其中所述初始单词序列由第一单词和第二单词构成,所述第一单词指识别所述第一实体而得的单词,所述第二单词指识别所述第二实体而得的单词;
从预存的标注单词序列库中调取第一标注单词序列,并计算所述初始单词序列和所述第一标注单词序列的第一相似度值;其中所述第一标注单词序列由第三单词和第四单词构成,所述第三单词与所述第一单词对应,所述第四单词与所述第二单词对应,并且所述第一标注单词序列与预存的第一组件集对应,所述第一标注单词序列中的单词与所述第一组件集中的组件对应;
判断所述第一相似度值是否大于预设的相似阈值;
若所述第一相似度值不大于预设的相似阈值,则执行组件替换操作,以将所述第一组件集中的部分组件替换为备用组件,从而得到第二组件集和所述第二组件集对应的第二标注单词序列,其中所述组件替换操作遵循优先替换所述第三单词对应的组件的原则;
计算所述初始单词序列和所述第二标注单词序列的第二相似度值,并判断所述第二相似度值是否大于预设的相似阈值;
若所述第二相似度值大于预设的相似阈值,则按照所述指定逻辑顺序,展示所述第二组件集;
所述从预存的标注单词序列库中调取第一标注单词序列,并计算所述初始单词序列和所述第一标注单词序列的第一相似度值的步骤,包括:
通过查询预设的词向量库,获取所述初始单词序列中每个单词对应的词向量,并以顺序连接的方式组合成初始句向量(C1,C2,...,Ci,...Cm);以及获取所述第一标注单词序列中每个单词对应的词向量,并以顺序连接的方式组合成第一标注句向量(D1,D2,...,Di,...Dm);
根据公式:
计算所述初始句向量(C1,C2,...,Ci,...Cm)和所述第一标注句向量(D1,D2,...,Di,...Dm)的相似度值Sim,并将所述相似度值Sim记为所述初始单词序列和所述第一标注单词序列的第一相似度值。
2.根据权利要求1所述的基于文字识别的组件集展示方法,其特征在于,所述根据预设的文字识别方法,对所述业务逻辑图进行文字识别,从而得到初始单词序列,其中所述初始单词序列由第一单词和第二单词构成,所述第一单词指识别所述第一实体而得的单词,所述第二单词指识别所述第二实体而得的单词的步骤,包括:
将所述业务逻辑图输入文字识别模型中的第一识别架构中,得到所述第一识别架构输出的所述第一单词;其中所述文字识别模型由所述第一识别架构和预设的第二识别架构组成,所述第一识别架构利用第一样本数据训练而成,所述第一样本数据由预先收集的文字图片和所述文字图片中的印刷体文字标识所构成,所述文字图片中包括印刷体文字和手写体文字;
将所述业务逻辑图输入所述第二识别架构中,得到所述第二识别架构输出的总文字;其中所述第二识别架构利用第二样本数据训练而成,所述第二样本数据由所述文字图片和所述文字图片中的所有文字标识所构成,其中所述所有文字标识不区分印刷体与手写体;
从所述总文字中去除所述第一单词,从而得到所述第二单词,并将所述第一单词和所述第二单词组建成所述初始单词序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳平安医疗健康科技服务有限公司,未经深圳平安医疗健康科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911304399.1/1.html,转载请声明来源钻瓜专利网。





