[发明专利]关注点的层次化构建方法、装置和计算机设备有效
| 申请号: | 201810128902.1 | 申请日: | 2018-02-08 |
| 公开(公告)号: | CN108280221B | 公开(公告)日: | 2022-04-15 |
| 发明(设计)人: | 陈一乐;刘呈祥;何伯磊;肖欣延;吕雅娟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/2458;G06F16/35 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 关注点 层次 构建 方法 装置 计算机 设备 | ||
本申请提出一种关注点的层次化构建方法、装置和计算机设备,上述关注点的层次化构建方法包括:爬取至少两个数据源的概念层次体系;对爬取的概念层次体系中相同垂类的相同概念层次进行融合,获得特定垂类的分类体系;对特定垂类的分类体系中的概念进行层次化处理,获得特定垂类的关注点概念层次体系;获取已挖掘的关注点的上位词,根据所述关注点的上位词将所述关注点关联到所述特定垂类的关注点概念层次体系。本申请可以实现增强关注点的描述和关注点逻辑推理上的组织,有效描述用户的更上层关注点,并且概念层次的粒度准确而不细碎,可以精确地表述用户的一类兴趣。
技术领域
本申请涉及搜索技术领域,尤其涉及一种关注点的层次化构建方法、装置和计算机设备。
背景技术
互联网中普遍存在新闻、信息等内容推荐的问题,到底给用户什么主题的新闻与信息,用户对什么样的内容感兴趣是亟待解决的一个问题。现在普遍的做法是将新闻与信息进行类别标记,打上如“社会”、“体育”等标签,这样做在对文章分类的同时一定程度上限定了文章的主题范围,也不能精确的表示用户真正感兴趣的具体内容。例如,某个用户只对社会新闻中的某一系列事件感兴趣,而非整个大的社会新闻的类别,那么大的类别作为用户的兴趣点就无法满足用户的真实需求了。
这类问题的解决方案是,主动发掘用户感兴趣的内容标签,称之为用户的关注点。通过对用户的搜索等互联网行为进行分析,挖掘出用户感兴趣的具体内容标签,从而解决新闻、信息等内容精准推荐的问题。让用户能够更加便捷的获取到自己真正感兴趣的内容,而不是粗略的某些固定类别的文章。例如:“汽车”作为用户的兴趣点太宽范,不能准确的描述用户的关注点,而通过挖掘得出的“汽车”类别、品牌和产地,例如“奔驰E200”、“宝马320li”等就能准确的表述用户希望获取的内容。
但是关注点的问题在于,粒度过于精细,无法有效的表征用户的真实的普遍意义上的兴趣,例如“奔驰E200”,作为一个关注点太细小了,而“德系汽车”、“梅赛德斯-奔驰”、“轿跑”等粒度较大的概念则可以更好地表征用户感兴趣的一类文章内容。这些概念层的关注点可以既保证描述用户兴趣的准确性,又不至于使得将用户的关注点定义为某一特定内容的文章。
现有相关技术中,一般是通过自动挖掘上下位关系结合半自动构建概念层次的方法,得到一个大而全的实体类别的知识体系。
但是,上述方法侧重于知识体系构建,词典知识体系的组织,无法描述为一个用户的兴趣;另外概念层次的粒度太粗,仅指出了词语所属的类别,而无法精确表示用户的具体兴趣,并且垂直类别的挖掘脱离了用户实际需求与应用需求,不能满足内容推荐的具体任务。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的第一个目的在于提出一种关注点的层次化构建方法,以实现增强关注点的描述和关注点逻辑推理上的组织,有效描述用户的更上层关注点,并且概念层次的粒度准确而不细碎,可以精确地表述用户的一类兴趣。
本申请的第二个目的在于提出一种关注点的层次化构建装置。
本申请的第三个目的在于提出一种计算机设备。
本申请的第四个目的在于提出一种非临时性计算机可读存储介质。
为达上述目的,本申请第一方面实施例提出了一种关注点的层次化构建方法,包括:爬取至少两个数据源的概念层次体系;对爬取的概念层次体系中相同垂类的相同概念层次进行融合,获得特定垂类的分类体系;对特定垂类的分类体系中的概念进行层次化处理,获得特定垂类的关注点概念层次体系;获取已挖掘的关注点的上位词,根据所述关注点的上位词将所述关注点关联到所述特定垂类的关注点概念层次体系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810128902.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种区域地理空间数据集成方法
- 下一篇:一种生产管理中二次精确检索的定位方法





