[发明专利]地理位置定位方法、系统、计算机设备和存储介质有效
申请号: | 201911190970.1 | 申请日: | 2019-11-28 |
公开(公告)号: | CN110929517B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 王湛宇;叶春杨;周辉 | 申请(专利权)人: | 海南大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F16/29;G06F18/2415;G06N3/048;G06N3/047;G06N3/08 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 赵蕊红;陈景帅 |
地址: | 570228 海*** | 国省代码: | 海南;46 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 地理位置 定位 方法 系统 计算机 设备 存储 介质 | ||
1.一种地理位置定位方法,其特征在于,所述方法包括:
获取用户文本信息;
对所述用户文本信息进行标注化处理,得到文本序列;
提取所述文本序列中的提及标识符,根据所述提及标识符分析各用户之间的联系,构建用户的网络视图;
对所述文本序列进行特征提取,得到用户的文本视图;
将所述网络视图和所述文本视图输入至预先训练后的注意力神经网络模型,得到用户的位置预测数据信息,包括:
对所述文本视图进行降维;
根据降维后的文本视图和网络视图计算每个用户的注意力系数,得到自注意力系数和邻居注意力系数;
根据所述自注意力系数和邻居注意力系数计算得到每个用户之间的注意力系数;
将用户之间的注意力系数作为权重和每个用户的邻居特征进行加权求和,得到用户的特征;
将所述用户的特征采用非线性函数进行输出,得到用户的位置预测数据信息;
运算定义如下:
F=Wh
val=matmul(attn,coef)
vals=elu(concat([val1,val2,…,valk]))
vals=softmax(mean([val1,val2,…,valk]))
其中F表示降维后的文本视图;W表示一个公共的权重矩阵,用于给特征向量降维,h表示输入的用户文本视图特征,表示训练注意力的权重矩阵,A即为网络视图中的邻接矩阵,其中包含了自连接,attn1和attn2分别表示注意力矩阵attn的两个列向量;val1,val2,…,valk分别表示k组注意力机制下的val取值,在隐藏层,使用concat对k组val取值进行拼接,之后使用elu激活函数进行计算,在输出层对k组val取值进行求取均值,之后使用softmax进行分类;
对所述位置预测数据信息进行解码,得到所述地理位置坐标数据。
2.根据权利要求1所述的地理位置定位方法,其特征在于,所述文本序列为单词序列;对所述用户文本信息进行标注化处理,得到文本序列的步骤中,包括:
当文本为英文文本时,将所有英文单词转化为小写单词,得到小写字母文本;
去除所述小写字母文本中的停用词、统一资源定位符、表情符号和标点符号,并将单词中连续重复出现多次的字母降至两次,得到处理后的字母文本;
将所述处理后的字母文本采用朴素贝叶斯法进行拼写检查;
在拼写检查通过后的字母文本输入至波特词根提取模型,得到单词序列。
3.根据权利要求1所述的地理位置定位方法,其特征在于,所述文本序列为词组序列;对所述用户文本信息进行标注化处理,得到文本序列的步骤中,包括:
当文本为中文文本时,对所述中文文本进行分词处理,得到分词文本;
去除所述分词文本中的停用词、统一资源定位符、表情符号和标点符号,得到所述词组序列。
4.根据权利要求3所述的地理位置定位方法,其特征在于,提取所述文本序列中的提及标识符,根据所述提及标识符分析各用户之间的联系,构建用户的网络视图的步骤中,包括:
去除重复的提及标识符;
对当前用户以及所述当前用户使用的提及标识符所提及的用户进行关系融合,并根据融合后的关系构建图结构数据;
根据所述图结构数据得到所述网络视图。
5.根据权利要求4所述的地理位置定位方法,其特征在于,对所述文本序列进行特征提取的步骤中,包括:
对所述文本序列分别从词视角、句子视角和主题视角进行了特征提取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海南大学,未经海南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911190970.1/1.html,转载请声明来源钻瓜专利网。