[发明专利]用于生成信息的方法和装置有效
申请号: | 201710202303.5 | 申请日: | 2017-03-30 |
公开(公告)号: | CN106991159B | 公开(公告)日: | 2018-07-24 |
发明(设计)人: | 周景博;许梦雯;夏源;吴海山 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N99/00 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 生成 信息 方法 装置 | ||
本申请公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:获取地理信息点序列集合和该地理信息点序列集合中的每一个地理信息点序列的标识所组成的标识集合;对于该地理信息点序列集合中的每一个地理信息点序列,对该地理信息点序列中的地理信息点进行聚类,生成与该地理信息点序列对应的元素序列;利用机器学习方法,基于该标识集合和所生成的各个元素序列,学习得到针对该标识集合中的各个标识的矩阵;对于该标识集合中的每一个标识,基于该标识和该矩阵,生成该标识所指示的地理信息点序列所属的用户的信息。该实施方式实现了富于针对性的信息生成。
技术领域
本申请涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及用于生成信息的方法和装置。
背景技术
随着移动定位设备的出现,用户越来越多的轨迹数据可以被采集到。轨迹数据被广泛认为可以多角度的刻画用户的行为,对理解用户的特点和倾向等具有重要作用。并且从轨迹数据中提取出的用于表征用户的特点、倾向等的信息可以应用于征信建模、信息推送等。
然而,轨迹数据具有非结构化、数据量巨大、语义不明确等缺点。比如,对于一个用户,该用户的轨迹数据仅仅是一串二维平面的坐标点,很难直接提取出该轨迹数据所表达的用户信息。因此,如何有效地基于轨迹数据生成该轨迹数据所属的用户的信息,是一个值得研究的问题。
发明内容
本申请的目的在于提出一种改进的用于生成信息的方法和装置,来解决以上背景技术部分提到的技术问题。
第一方面,本申请实施例提供了一种用于生成信息的方法,该方法包括:获取地理信息点序列集合和所述地理信息点序列集合中的每一个地理信息点序列的标识所组成的标识集合;对于上述地理信息点序列集合中的每一个地理信息点序列,对该地理信息点序列中的地理信息点进行聚类,生成与该地理信息点序列对应的元素序列,其中,上述元素序列中的每一个元素对应该地理信息点序列中的至少一个地理信息点;利用机器学习方法,基于上述标识集合和所生成的各个元素序列,学习得到针对上述标识集合中的各个标识的矩阵;对于上述标识集合中的每一个标识,基于该标识和上述矩阵,生成该标识所指示的地理信息点序列所属的用户的信息。
在一些实施例中,上述对于上述地理信息点序列集合中的每一个地理信息点序列,对该地理信息点序列中的地理信息点进行聚类,生成与该地理信息点序列对应的元素序列,包括:对于上述地理信息点序列集合中的每一个地理信息点序列,对于该地理信息点序列中的每一个地理信息点,从预先存储的、所包含的兴趣点设置有标识的兴趣点集合中提取出与该地理信息点的直线距离最短的兴趣点,将上述兴趣点的标识作为与该地理信息点对应的元素,将与该地理信息点序列中的各个地理信息点分别对应的元素所组成的元素序列作为与该地理信息点序列对应的元素序列。
在一些实施例中,上述对于上述地理信息点序列集合中的每一个地理信息点序列,对该地理信息点序列中的地理信息点进行聚类,生成与该地理信息点序列对应的元素序列,包括:对于上述地理信息点序列集合中的每一个地理信息点序列,从预置区域标识集合中提取出该地理信息点序列中的各个地理信息点所在的区域的区域标识,将所提取出的各个区域标识所组成的序列作为与该地理信息点序列对应的元素序列,其中,上述预置区域标识集合包括该地理信息点序列中的每个地理信息点所在的区域的区域标识。
在一些实施例中,上述对于上述地理信息点序列集合中的每一个地理信息点序列,对该地理信息点序列中的地理信息点进行聚类,生成与该地理信息点序列对应的元素序列,包括:对于上述地理信息点序列集合中的每一个地理信息点序列,从预置网格标识集合中提取出该地理信息点序列中的各个地理信息点所在的网格的网格标识,将所提取出的各个网格标识所组成的序列作为与该地理信息点序列对应的元素序列,其中,上述预置网格标识集合是预先对二维空间进行网格划分所划分出的各个网格的网格标识的集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710202303.5/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置