[发明专利]基于语义聚类的签到热点功能特征识别方法有效
申请号: | 202110343078.3 | 申请日: | 2021-03-30 |
公开(公告)号: | CN113392652B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 杨剑;王鹏启;贾奋励;王光霞 | 申请(专利权)人: | 中国人民解放军战略支援部队信息工程大学;中国人民解放军32023部队 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F18/23213;G06F16/901;G06F16/906;G06F16/9537 |
代理公司: | 郑州睿信知识产权代理有限公司 41119 | 代理人: | 黄晶 |
地址: | 450001 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语义 签到 热点 功能 特征 识别 方法 | ||
本发明涉及基于语义聚类的签到热点功能特征识别方法,属于数据处理技术领域,该方法包括获取某社交网站上某一段时间内用户的签到数据,根据签到数据确定若干个热点区域;对每个热点区域中的签到数据,利用基于语义相似度的POI聚类算法,进行POI分类;如利用Word2Vec相似度计算函数,计算样本点的语义相似度,输出相似矩阵W;然后计算拉普拉斯矩阵,接下来计算拉普拉斯矩阵前k个特征值所对应的特征向量,最后将计算得到的特征向量组成的矩阵U,U的每一行成为一个新生成的样本点,对这些新生成的样本点进行聚类,分类算法的计算消耗时间更少,且POI类别标签的分类结果更加准确和精简,识别率更高。
技术领域
本发明属于数据处理技术领域,具体涉及基于语义聚类的签到热点功能特征识别方法。
背景技术
近年来,随着互联网的发展,社交媒体发展迅速。社交媒体是通过发布技术者所创造的信息内容,该技术高度开发,并且具有拓展性强的特点,它改变了人类在阅读、分享和评论新闻信息内容的方式。
在国内,新浪微博是最近几年发展迅猛且影响力极大的全民网络社交媒体形式。微博签到数据反映了用户在特定的时间、地点条件下记录的所见、所闻、所感、言论以及状态。这些发生在用户身边的事件能够通过发布包含文字、图片、视频等内容的签到功能记录下来,具有丰富的位置、时间等属性信息。这些位置信息可能是咖啡店、商场、电影院、火车站等各种各样的兴趣点(point of interest,POI)。通过分析和挖掘微博签到数据,就能够了解到用户群体的特征,例如年龄性别、空间分布、兴趣爱好等,进而根据这些结论和知识为用户提供个性化的服务。
随着互联网技术和定位技术的高速发展,智能移动设备如手机、平板电脑、智能手表等产品的普及,这些为获得海量签到数据提供了有利条件。人们习惯于使用各种APP中的位置服务进行签到、评论、分享等操作,所以大量的签到数据可以反映人们的日常生活范围和轨迹。可以运用各种地理信息系统中空间分析方法对签到数据进行分析,得到城市人群活动热点区域,从而为城市公共资源的合理分配提供建议和支持。例如共享单车迅猛发展,可以通过城市人群活动热点探测来确定共享单车投放量和投放点;对景区签到数据进行分析,可以为游客合理安排旅游时间,避免旅游景点的高峰期。
近年来,出现不少学者以社交媒体的位置签到数据作为数据源,进行城市热点和人群活动研究。国外常用于提取POI数据的社交媒体有Foursquare、Twitter、Facebook等。例如,Comito等人从带有地理标记的Twitter中挖掘用户旅行路线,从而分析旅游热点地区和人们行为活动;Li等人以加利福尼亚州Twitter和Flickr的推文和照片为例,研究了美国邻近地区地理数据的时空模式,探讨了城市热门地区和当地居民特征。
而新浪微博作为国内主流社交网络平台,同样得到了国内学者的广泛关注。例如,王波等人基于签到数据,分别从时间、空间两个角度分析南京市的居民签到行为特征,并进行城市功能区划分;张子昂等人基于微博签到数据,分别从时间、空间两个维度,对南京钟山风景区内部游客行为活动的演变特征进行探索;陈宏飞等人研究西安市夜间用户签到行为在时间和空间上的演变规律;滕巧爽等人以微博签到数据为例,从空间模式上进行分析,探测城市热点区域大致方向。
因此,现有技术中,基于社交媒体签到数据的研究均主要从空间或时间的维度来分析城市热点区域和用户签到行为特征,这些研究方法往往局限于常规的经典统计和地理统计,这就导致对数据的语义特征挖掘不够深入和全面,分析得到不准确的行为活动。
另外,目前对于POI数据的分类上,主要通过人工的方法,人们手动建立各分类体系中不同类别之间的映射关系,进而实现不同分类体系之间的转换与对比。这种人工构建分类体系映射POI关系的方法,需要投入大量的人力、物力和时间,无法进行大规模的推广和应用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军战略支援部队信息工程大学;中国人民解放军32023部队,未经中国人民解放军战略支援部队信息工程大学;中国人民解放军32023部队许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110343078.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种保险佣金管理系统
- 下一篇:不饱和多黏菌素及其双键位置的判定方法