[发明专利]地址标准化模型群、构建方法及其应用在审
| 申请号: | 202210409785.2 | 申请日: | 2022-04-19 |
| 公开(公告)号: | CN114756639A | 公开(公告)日: | 2022-07-15 |
| 发明(设计)人: | 毛云青;卓家雨;王国梁 | 申请(专利权)人: | 城云科技(中国)有限公司 |
| 主分类号: | G06F16/29 | 分类号: | G06F16/29;G06F16/22;G06F16/36;G06N3/04;G06N3/08 |
| 代理公司: | 杭州汇和信专利代理有限公司 33475 | 代理人: | 薛文玲 |
| 地址: | 310052 浙江省杭州市滨江区长*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 地址 标准化 模型 构建 方法 及其 应用 | ||
本申请提出了一种地址标准化模型群、构建方法及其应用,包括以下步骤:搭建地址标准化模型群,所述地址标准化模型群由对应不同行政区划级别的区划标准化模型组成,利用详细标准地址及对应的行政区划地名为训练样本对地址标准化模型群进行训练,该地址标准化模型群区别于现有技术很大的不同在于便于后期对区划标准化模型的维护,灵活应对行政区划变更的情况。
技术领域
本申请涉及数据处理领域,特别涉及一种地址标准化模型群、构建方法及其应用。
背景技术
地址信息指的是个体或者固定场所的居住、通信地点,其在城市规划管理中起着举足轻重的作用,通过识别特定场所或个体的地址信息就可以定位其在城市中所处的地理位置。然而由于个人表达习惯的不同,导致即使是以行政区划表达的地址信息在表达上也存在偏差。比如同样是表达“北京博物馆”的地址信息,有些人会详尽地记录地址信息为“北京市东城区景山前街4号”,而有些人则可能会记录地址信息为“北京市景山前街4号”,或者东城区景山前街4号。
目前大部分地址标准化模型采用的手段是:通过字典表或数据库识别地址信息的关键词来标准化处理地址信息,然而这种手段的识别准确度完全依赖于字典表和数据库的内容,一旦出现字典表或数据库内未曾记录的关键词则只会返回空的结果。另外,单一的地址标准化模型也存在训练压力大以及不灵活的问题,具体体现在:为了让单一地址标准化模型准确识别地址信息,则需要输入大量完整行政区划的地址信息进行训练,且地址标准化模型需要同时识别多个行政区划;一旦行政区划发生变动就需要对单一地址标准化模型进行重新训练,导致后期维护与迭代开发的时间成本和硬件成本都很大,无法对业务侧的变动进行及时的响应。
发明内容
本申请实施例提供了一种地址标准化模型群、构建方法及其应用,所述地址标准化模型群由多个对应不同区划级别的区划标准化模型组成,逐级对地址信息进行标准化识别,减轻单一模型的训练成本的同时提高了应用灵活性,可更为灵活地应对行政区划变动的情况,降低重新训练整个模型的硬件成本与时间成本,能够实现对老模型的快速迭代。
第一方面,本申请实施例提供了一种地址标准化模型群的构建方法,所述方法包括:搭建地址标准化模型群,其中所述地址标准化模型群由多个区划标准化模型组成,其中不同区划标准化模型对应不同行政区划级别;获取至少一标准详细地址,其中所述标准详细地址由不同行政区划级别对应的行政区划地名组成;依据所述行政区划级别的级别顺序遍历训练所有区划标准化模型,选择被上级行政区划级别分类的所述标准详细地址和当前行政区划级别对应的行政区划地名作为训练样本,所述训练样本输入到对应所述当前行政区划级别的区划标准化模型中进行训练。
第二方面,本申请实施例提供了一种地址标准化模型群,根据上述构建方法构建得到。
第三方面,本申请实施例提供了一种地址标准化方法,包括:获取待转换地址信息;将所述待转换地址信息输入到如上所述的地址标准化模型群中,每一区划标准化模型输出对应行政区划级别的行政区划地名,依据所述行政区划级别的层级关系组合形成标准地址。
第四方面,本申请实施例提供了一种地址标准化装置,包括:获取单元,用于获取待转换地址信息;标准化处理单元,用于将所述待转换地址信息输入到如上所述的训练得到的地址标准化模型群中,每一区划标准化模型输出对应行政区划级别的行政区划地名,依据所述行政区划级别的层级关系组合形成标准地址。
第五方面,本申请实施例提供一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行如上所述的地址标准化模型群的构建方法。
第六方面,本申请实施例提供一种可读存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序包括用于控制过程以执行过程的程序代码,所述过程包括根据所述的地址标准化模型群的构建方法。
本发明的主要贡献和创新点如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于城云科技(中国)有限公司,未经城云科技(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210409785.2/2.html,转载请声明来源钻瓜专利网。





