[发明专利]地理位置定位方法、系统、计算机设备和存储介质有效
申请号: | 201911190970.1 | 申请日: | 2019-11-28 |
公开(公告)号: | CN110929517B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 王湛宇;叶春杨;周辉 | 申请(专利权)人: | 海南大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F16/29;G06F18/2415;G06N3/048;G06N3/047;G06N3/08 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 赵蕊红;陈景帅 |
地址: | 570228 海*** | 国省代码: | 海南;46 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 地理位置 定位 方法 系统 计算机 设备 存储 介质 | ||
本发明涉及一种地理位置定位方法、系统、计算机设备和存储介质。方法包括:获取用户文本信息;对用户文本信息进行标注化处理,得到文本序列;提取文本序列中的提及标识符,根据提及标识符分析各用户之间的联系,构建用户的网络视图;对文本序列进行特征提取,得到用户的文本视图;将网络视图和文本视图输入至预先训练后的注意力神经网络模型,得到用户的位置预测数据信息;对位置预测数据信息进行解码,得到地理位置坐标数据。上述方法通过输入的用户文本信息,拟合用户文本中影响地理位置预测的不可见因素,使其能够对社交网络文本数据进行地理位置预测;并采用注意力神经网络模型对复杂的用户关系进行分析得到用户的位置信息,准确度高。
技术领域
本发明涉及位置分析技术领域,特别是涉及一种地理位置定位方法、系统、计算机设备和存储介质。
背景技术
随着社交网络媒体发展迅猛,网络用户数量不断增加,产生了规模庞大的数据,而面向这些数据产生了很多应用服务。然而,这些服务往往依托于较为精确的地理位置信息,相较于难以获取的第三方位置服务信息,通过分析易于获取的用户公开文本信息来进行有效的地理位置预测就显得十分重要。
传统的地理位置预测方法大多基于单一的文本视图(Content view)或单一的网络视图(Network view),其利用的文本特征较为有限,且难以根据新用户的数据进行及时的分析和处理。
发明内容
基于此,有必要针对上述技术问题,提供一种能够解决问题的地理位置定位方法、系统、计算机设备和存储介质。
一种地理位置定位方法,所述方法包括:
获取用户文本信息;
对所述用户文本信息进行标注化处理,得到文本序列;
提取所述文本序列中的提及标识符,根据所述提及标识符分析各用户之间的联系,构建用户的网络视图;
对所述文本序列进行特征提取,得到用户的文本视图;
将所述网络视图和所述文本视图输入至预先训练后的注意力神经网络模型,得到用户的位置预测数据信息;
对所述位置预测数据信息进行解码,得到所述地理位置坐标数据。
在其中一个实施例中,所述文本序列为单词序列;对所述用户文本信息进行标注化处理,得到文本序列的步骤中,包括:
当文本为英文文本时,将所有英文单词转化为小写单词,得到小写字母文本;
去除所述小写字母文本中的停用词、统一资源定位符、表情符号和标点符号,并将单词中连续重复出现多次的字母降至两次,得到处理后的字母文本;
将所述处理后的字母文本采用朴素贝叶斯法进行拼写检查;
在拼写检查通过后的字母文本输入至波特词根提取模型,得到单词序列。
在其中一个实施例中,所述文本序列为词组序列;对所述用户文本信息进行标注化处理,得到文本序列的步骤中,包括:
当文本为中文文本时,对所述中文文本进行分词处理,得到分词文本;
去除所述分词文本中的停用词、统一资源定位符、表情符号和标点符号,得到所述词组序列。
在其中一个实施例中,提取所述文本序列中的提及标识符,根据所述提及标识符分析各用户之间的联系,构建用户的网络视图的步骤中,包括:
去除重复的提及标识符;
对当前用户以及所述当前用户使用的提及标识符所提及的用户进行关系融合,并根据融合后的关系构建图结构数据;
根据所述图结构数据得到所述网络视图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海南大学,未经海南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911190970.1/2.html,转载请声明来源钻瓜专利网。