[发明专利]日期识别方法、装置、可读介质及电子设备在审
申请号: | 202210113138.7 | 申请日: | 2022-01-29 |
公开(公告)号: | CN114444508A | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 邓冠玉;陈露露;黄灿;王长虎 | 申请(专利权)人: | 北京有竹居网络技术有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06V30/416 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 贺晓蕾 |
地址: | 101299 北京市平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 日期 识别 方法 装置 可读 介质 电子设备 | ||
本公开涉及一种日期识别方法、装置、可读介质及电子设备,该方法通过该预设日期识别模型识别该日期文本对应的待定日期,获取该日期文本中每个字符对应的目标实体类别,根据该日期文本中每个字符对应的目标实体类别和该待定日期确定该日期文本对应的目标日期,该目标实体类别用于表征该字符是否为与日期数字相关的指定字符,以及在该字符为与日期数字相关的指定字符时,该字符对应数字在日期中的位置信息,能够针对多种日期识别场景中的日期进行有效识别,也能够有效保证日期识别结果的准确性,从而不仅能够有效保证日期识别率,也能够有效提升日期识别结果的可靠性。
技术领域
本公开涉及计算机技术领域,具体地,涉及一种日期识别方法、装置、可读介质及电子设备。
背景技术
随着科技的发展,人类对计算机视觉技术的应用逐渐广泛,OCR(OpticalCharacter Recognition,光学字符识别)字符识别是计算机视觉技术中的一个重要分支,在完成OCR字符识别后,经常伴随着对识别文本中关键信息的提取,例如,对识别文本中日期信息的提取。
目前的日期识别方法通常仅能针对简单的日期文本识别场景(例如,发票,火车票,证件等日期识别场景),做到有效识别,而针对相对复杂的日期文本识别场景(例如针对OCR字符识别结果中日期文本的识别),则存在识别率低,识别结果准确性较差的问题。
发明内容
提供该发明内容部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
本公开提供一种日期识别方法、装置、可读介质及电子设备。
第一方面,本公开提供一种日期识别方法,所述方法包括:
获取待识别文本,所述待识别文本包括日期文本;
将所述待识别文本输入预设日期识别模型,以获取所述预设日期识别模型输出的目标日期;
其中,所述预设日期识别模型用于,识别所述日期文本对应的待定日期,获取所述日期文本中每个字符对应的目标实体类别,根据所述日期文本中每个字符对应的目标实体类别和所述待定日期确定所述日期文本对应的目标日期,所述目标实体类别用于表征所述字符是否为与日期数字相关的指定字符,以及在所述字符为与日期数字相关的指定字符时,所述字符对应数字在日期中的位置信息。
第二方面本公开提供一种日期识别装置,所述装置包括:
第一获取模块,被配置为获取待识别文本,所述待识别文本包括日期文本;
第二获取模块,被配置为将所述待识别文本输入预设日期识别模型,以获取所述预设日期识别模型输出的目标日期;
其中,所述预设日期识别模型用于,识别所述日期文本对应的待定日期,获取所述日期文本中每个字符对应的目标实体类别,根据所述日期文本中每个字符对应的目标实体类别和所述待定日期确定所述日期文本对应的目标日期,所述目标实体类别用于表征所述字符是否为与日期数字相关的指定字符,以及在所述字符为与日期数字相关的指定字符时,所述字符对应数字在日期中的位置信息。
第三方面,本公开一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现以上第一方面所述方法的步骤。
第四方面,本公开提供一种电子设备,包括:
存储装置,其上存储有计算机程序;
处理装置,用于执行所述存储装置中的所述计算机程序,以实现以上第一方面所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210113138.7/2.html,转载请声明来源钻瓜专利网。