[发明专利]提取POI名称的方法、装置、设备和计算机存储介质有效
申请号: | 202011551328.4 | 申请日: | 2020-12-24 |
公开(公告)号: | CN112541496B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 王洪志;范淼;黄际洲 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V30/146;G06V30/19;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 田宏宾 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 提取 poi 名称 方法 装置 设备 计算机 存储 介质 | ||
1.一种提取POI名称的方法,包括:
从POI的图像数据中检测属于同一招牌的各单字区域;
对各单字区域进行文字识别,得到各单字区域对应的至少一个候选文字;
利用已有的POI名称库,从文字序列集合中确定作为POI名称的概率最大的文字序列,其中各文字序列由各单字区域对应的候选文字按照各单字区域在所述招牌中的顺序组合得到;
由确定出的文字序列得到所述招牌对应的POI名称;其中,
所述对各单字区域进行文字识别,得到各单字区域对应的至少一个候选文字包括:
将单字区域在预先设置的单字图片库中进行匹配,确定与该单字区域的匹配度满足预设要求的单字图片对应的文字作为候选文字;或者,
将单字区域输入文字识别模型,依据所述文字识别模型的识别结果确定该单字区域对应的候选文字,所述文字识别模型基于分类模型预先训练得到;
所述利用已有的POI名称库,从文字序列集合中确定作为POI名称的概率最大的文字序列包括:
依据各单字区域在所述招牌中的顺序形成观测序列;
利用隐马尔可夫模型,确定与所述观测序列最匹配的状态序列;
其中,所述隐马尔可夫模型采用的状态转移概率矩阵依据已有POI名称库进行统计得到,采用的状态矩阵依据各单字区域对应的至少一个候选文字得到。
2.根据权利要求1所述的方法,其中,所述从POI的图像数据中检测属于同一招牌的各单字区域包括:
对所述POI的图像数据进行招牌检测,确定至少一个招牌区域;
分别对各招牌区域进行单字区域检测,确定各招牌区域中的各单字区域。
3.根据权利要求1所述的方法,其中,所述从POI的图像数据中检测属于同一招牌的各单字区域包括:
对所述POI的图像数据进行单字检测,确定所述POI的图像数据中的各单字区域;
对所述POI的图像数据进行招牌检测,确定所述POI的图像数据中的各招牌区域;
确定属于同一招牌区域的各单字区域。
4.根据权利要求1所述的方法,其中,所述从POI的图像数据中检测属于同一招牌的各单字区域包括:
将所述POI的图像数据输入预先训练得到的区域检测模型,利用所述区域检测模型的输出确定所述POI的图像数据中的各招牌区域和各单字区域;
确定属于同一招牌区域的各单字区域。
5.根据权利要求4所述的方法,其中,所述区域检测模型采用如下方式预先训练得到:
获取训练数据,所述训练数据包括样本POI图像数据以及对所述样本POI图像数据标注的招牌区域信息和各单字区域信息;
将所述样本POI图像数据作为区域检测模型的输入,将标注的招牌区域信息和各单字区域信息作为所述区域检测模型的目标输出,训练所述区域检测模型。
6.根据权利要求4所述的方法,其中,所述区域检测模型包括:特征提取网络、招牌分类网络、招牌回归网络和文字分类网络;其中,
所述特征提取网络,用于从输入的图像数据中提取各像素的特征表示;
所述招牌回归网络,用于利用所述各像素的特征表示,输出招牌框的位置信息;
所述招牌分类网络,用于利用所述各像素的特征表示进行分类,输出所述招牌框是否为招牌区域的分类结果;
所述文字分类网络,用于利用所述各像素的特征表示,输出各像素是否属于文字区域的分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011551328.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种样本清晰焦面位置获取方法及装置
- 下一篇:一种柔性贮备电池