[发明专利]地图兴趣点的训练模型确定方法、装置及电子设备在审
| 申请号: | 202011561079.7 | 申请日: | 2020-12-25 |
| 公开(公告)号: | CN112559885A | 公开(公告)日: | 2021-03-26 |
| 发明(设计)人: | 王昆 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9537;G06F16/29;G06F40/295;G06K9/62;G06N20/20 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 王萌 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 地图 兴趣 训练 模型 确定 方法 装置 电子设备 | ||
1.一种地图兴趣点的训练模型确定方法,所述方法包括:
获取与兴趣点POI相关的至少一类预训练任务;
根据所述预训练任务,确定第一阶段的训练模型;
根据所述第一阶段的训练模型的参数以及至少一类与所述POI相关的专有任务,确定第二阶段的训练模型。
2.根据权利要求1所述的训练模型确定方法,其中,获取与兴趣点POI相关的至少一类预训练任务,包括:
获取和POI相关的掩码语言模型、下个语句预测模型和整字掩盖模型中的至少一个。
3.根据权利要求2所述的训练模型确定方法,其中,根据所述预训练任务,确定第一阶段的训练模型,包括:
采用所述掩码语言模型,对输入的POI名称进行编码,获得第一误差值;
采用所述下个语句预测模型,对输入的POI名称进行编码,获得第二误差值;
采用所述整字掩盖模型,对输入的POI名称进行编码,获得第三误差值;
确定所述第一误差值、所述第二误差值以及所述第三误差值的总和,将所述总和作为第一阶段的训练模型的输出。
4.根据权利要求3所述的训练模型确定方法,其中,采用所述掩码语言模型,对输入的POI名称进行编码,获得第一误差值,包括:
将POI名称中的字符使用掩盖函数随机掩盖,预测被掩盖的位置上的字符,将预测的所述字符与被掩盖的位置上实际的字符进行比较,获得第一误差值。
5.根据权利要求3所述的训练模型确定方法,其中,采用所述下个语句预测模型,对输入的POI名称进行编码,获得第二误差值,包括:
将POI名称分为至少两个文本段,根据第一文本段预测第二文本段,将预测的所述第二文本段与真实的第二文本段进行比较,获得第二误差值。
6.根据权利要求3所述的训练模型确定方法,其中,采用所述整字掩盖模型,对输入的POI名称进行编码,获得第三误差值,包括:
将POI名称中的词级别的多个字符使用掩盖函数随机掩盖,预测被掩盖的位置上的词,将预测的所述词与被掩盖的位置上实际的词进行比较,获得第三误差值。
7.根据权利要求1所述的训练模型确定方法,其中,根据所述第一阶段的训练模型的参数以及至少一类与所述POI相关的专有任务,确定第二阶段的训练模型,包括:
在所述第一阶段的训练模型的参数最小的情况下,对第一类与所述POI相关的专有任务进行训练,得到第一结果;
基于所述第一结果,对输入的第N+1类与所述POI相关的专有任务进行训练,得到第N+1个结果,N为正整数。
8.根据权利要求7所述的训练模型确定方法,其中,对输入的第N+1类与所述POI相关的专有任务进行训练,包括:
对输入的第N+1类与所述POI相关的专有任务进行POI场景下的命名实体识别,并进行POI分类、POI匹配、标签分类、首字母匹配处理中的至少一项;
所述POI分类包括:分辨一个POI是否是真实的POI名称;
所述POI匹配包括:匹配两段文本是否为同一个POI;
所述标签分类包括:为每一个POI对应一个标签;
所述首字母匹配包括:将POI名称的拼音字母首部进行拼接,并与POI名称进行匹配。
9.根据权利要求1所述的训练模型确定方法,其中,还包括:
将POI的位置信息嵌入所述第一阶段的训练模型。
10.根据权利要求9所述的训练模型确定方法,其中,所述POI的位置信息通过以下方式确定:
对POI所处的一预设范围内的区域进行网格化,将POI所处的网格作为所述POI的位置信息;所述网格的大小根据所述区域内POI的密度确定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011561079.7/1.html,转载请声明来源钻瓜专利网。





