[发明专利]一种面向多源网络百科的知识库构建方法有效

专利信息
申请号: 201710236165.2 申请日: 2017-04-12
公开(公告)号: CN107239481B 公开(公告)日: 2021-03-12
发明(设计)人: 韩喆;冯岩松;贾爱霞;赵东岩 申请(专利权)人: 北京大学
主分类号: G06F16/951 分类号: G06F16/951;G06F16/958;G06F16/35;G06F16/36
代理公司: 北京君尚知识产权代理有限公司 11200 代理人: 司立彬
地址: 100871 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种面向多源网络百科的知识库构建方法。本方法为:1)从设定的若干网络百科抓取页面,并从抓取的每一页面中抽取页面的类别信息;2)基于类别信息构建类别树,并将类别信息和类别树对应,形成知识库的类别体系;提取每个网络百科对应页面的的别名信息构建该网络百科的概念词典;3)对抓取的页面进行去重,得到知识库的概念集合;4)从页面集合中每一页面的页面信息框和正文中抽取三元组信息;5)将三元组中的客体转换成标准格式,然后根据得到的标准化三元组和类别体系建立知识库。本发明不仅可以输出实体的类别体系,还可以对三元组中的实体进行链接,得到高质量的三元组知识,适用于多个网络百科混合生成知识库的需求。
搜索关键词: 一种 面向 网络 百科 知识库 构建 方法
【主权项】:
一种面向多源网络百科的知识库构建方法,其步骤为:1)从设定的若干网络百科抓取页面,并从抓取的每一页面中抽取页面的类别信息;2)基于所述类别信息构建类别树,并将类别信息和类别树对应,形成知识库的类别体系;提取每个网络百科对应页面的的别名信息构建该网络百科的概念词典;3)对抓取的页面进行去重,将得到的无重复的页面集合作为知识库的概念集合;4)从所述页面集合中每一页面的页面信息框和正文中抽取三元组信息;5)将所述三元组中的客体转换成标准格式,然后根据得到的标准化三元组和类别体系建立面向多源网络百科的知识库。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710236165.2/,转载请声明来源钻瓜专利网。

同类专利
  • 一种网页数据抓取方法和电子设备-202310890384.8
  • 路意 - 深圳市欧若马可科技有限公司
  • 2023-07-19 - 2023-10-27 - G06F16/951
  • 本发明实施例提供一种网页数据抓取方法和电子设备,该方法包括获取网页地址和待抓取内容;根据网页地址和待抓取内容,得到待抓取内容对应的HTML标签;根据HTML标签,抓取网页数据。用户仅需要指定网页地址和待抓取内容,电子设备在获取网页地址和待抓取内容后,会对其进行处理得到对应的HTML标签,然后再根据HTML标签得到网页数据,完成抓取,无需用户精通网页数据抓取技术知识,降低了网页数据抓取的难度,并提高了网页数据抓取的效率。
  • 爬虫识别方法、装置、计算机设备和存储介质-202310834254.2
  • 楼文霞;姜志双 - 杭州安恒信息技术股份有限公司
  • 2023-07-07 - 2023-10-27 - G06F16/951
  • 本申请涉及一种爬虫识别方法、装置、计算机设备和存储介质。所述方法包括:获取终端的请求数据以及与所述请求数据对应的服务器端的响应数据;基于所述请求数据获取所有访问接口信息;基于所述响应数据获取所有访问返回顺序信息;将所述访问接口信息和所述访问返回顺序信息输入至预先训练的自然语言处理模型,得到爬虫识别结果。采用本方法能够实现基于爬虫访问行为和服务器响应行为的爬虫识别,达到提高爬虫识别率的效果。
  • 数据存储系统、方法、装置、电子设备及存储介质-202310918596.2
  • 王浩 - 北京奇艺世纪科技有限公司
  • 2023-07-25 - 2023-10-27 - G06F16/951
  • 本发明实施例提供了一种数据存储系统、方法、装置、电子设备及存储介质,具体实现方案为:数据存储系统包括:多个第一索引库和第二索引库;不同第一索引库存储每轮统计周期内、不同子时间段写入的数据,所述第二索引库存储除最新统计周期以外的全部历史数据;第一索引库,用于响应于数据查询请求,从第一索引库中查找目标数据;第二索引库,用于在从第一索引库中未查找到目标数据的情况下,响应于数据查询请求从第二索引库中查找目标数据。可以提高数据查询的速度。
  • 基于云边协同混合架构的目标检测方法及系统-202211578672.1
  • 范志海;罗天;王刚 - 浪潮云信息技术股份公司
  • 2022-12-07 - 2023-10-27 - G06F16/951
  • 本发明公开了基于云边协同混合架构的目标检测方法及系统,属于云边协同技术领域,要解决的技术问题为在算力受限或者硬件受限的边缘场景下,如何在保证边缘侧安全的情况下实现目标检测。包括部署于云节点的全局管理器和云侧worker组件以及部署于边缘节点的边缘控制器和边缘侧worker组件;云侧worker组件用于对目标检测模型进行云侧模型训练;边缘侧worker组件用于基于AI任务从边缘设备获取样本,用于通过AI任务指定的目标检测模型进行边缘侧推理计算,并展示边缘侧推理结果;云侧worker组件用于对困难样本进行云侧推理,边缘侧worker组件用于展示云侧推理结果。
  • 一种基于工业大数据构建数据目录方法-202310940895.6
  • 巩书凯;姜仁杰;邓俊;王立东;范瑞鹏;胡腾 - 重庆忽米网络科技有限公司
  • 2023-07-28 - 2023-10-27 - G06F16/951
  • 本发明属于云服务技术领域,尤其涉及一种基于工业大数据构建数据目录方法,包括以下步骤:S1、采集工业企业的企业数据;S2、对企业数据进行预处理;S3、创建数据目录分类,挂载预处理后的企业数据及数据API;S4、用户根据需求确认需要申请的数据资源后,提交资源使用申请;资源使用申请的内容包括使用权限和使用原因;S5、管理人员收到资源使用申请后,进行申请审批;S6、用户的资源使用申请通过后,通过可视化分析技术,按照业务需求,通过数据集成、数据分析功能,对使用权限内的数据资源进行分析利用,实现工业企业运行状态监测。本方法可以解决工业领域数据交互和应用的问题,满足工业领域复杂多样的数据采集及数据传输需求。
  • 网页更新的方法、装置、电子设备和计算机可读存储介质-202010152322.3
  • 刘俊启 - 百度在线网络技术(北京)有限公司
  • 2020-03-06 - 2023-10-27 - G06F16/951
  • 本申请公开了一种网页更新的方法、装置、电子设备和计算机可读存储介质,涉及搜索引擎技术领域。本申请在服务器端中进行网页更新时所采用的实现方案为:抓取网页之后,生成所述网页的云端特征标识,并将所述云端特征标识与所述网页进行关联;在接收到客户端发送的反馈信息之后,重新抓取与反馈信息对应的网页来替换原网页,并对与该网页相关联的云端特征标识进行更新。本申请在客户端中进行网页更新时所采用的实现方案为:打开网页之后,生成网页的本地特征标识;获取网页的云端特征标识;在确定本地特征标识与云端特征标识不匹配时,生成反馈信息并发送至服务器端。本申请能够提升网页更新的时效性,并有效地节省服务器端的计算资源。
  • 一种网页信息反爬虫方法、装置、系统、设备及存储介质-202311183446.8
  • 徐鸿举 - 百鸟数据科技(北京)有限责任公司
  • 2023-09-14 - 2023-10-24 - G06F16/951
  • 本发明适用于计算机领域,提供了一种网页信息反爬虫方法、装置、系统、设备及存储介质。其中,方法包括:接收终端发送的信息获取请求;将待返回信息中预设的关键信息转换为图片数据;对所述图片数据进加密,得到加密图片数据;将所述待返回信息以及加密图片数据返回至所述终端,使得终端能够正常地将加密图像数据中的信息渲染出来,从而不影响用户的正常浏览,而在爬虫爬取网页数据时,得到的只是无意义的乱码,从而使得爬虫无法获取关键信息,进而提高反爬虫效果。
  • 一种基于APP评论数据的用户需求获取方法-202310914763.6
  • 王进;周继聪;周青 - 重庆邮电大学
  • 2023-07-25 - 2023-10-24 - G06F16/951
  • 本发明属于自然语言处理领域领域,具体涉及一种基于APP评论数据的用户需求获取方法,包括通过Python爬虫爬取APP评论数据并进行预处理,得到预处理文本数据;采用预处理文本数据对Bert模型进行SRP任务和LAP任务的联合预训练;构造用户需求预测模型,采用预训练完成的Bert模型对预处理文本数据构造训练数据编码,采用编码后的训练数据训练用户需求预测模型;预训练完成的Bert模型与训练完成的用户需求预测模型组成用户需求生成模型,获取待处理数据输入用户需求生成模型得到对应的用户需求生成结果;本发明将文本分类问题转换为匹配问题,缓解了评论类别分布不平衡的问题,提升了预测性能。
  • 数据爬取方法、装置、存储介质及服务器-202210373689.7
  • 张似衡 - 广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司
  • 2022-04-11 - 2023-10-24 - G06F16/951
  • 本申请公开了一种数据爬取方法、装置、存储介质以及服务器,其中方法包括:接收爬虫发送的多个数据爬取请求,按照各所述数据爬取请求的优先级从高到低的顺序对所述多个数据爬取请求进行排序,将排序后的所述多个数据爬取请求依次发送至下载器,以使所述下载器下载各所述数据爬取请求分别对应的网页,以使所述爬虫分别对各所述网页进行解析得到对应的第一数据并发送至元素管道。采用本申请实施例,通过对多个数据爬取请求按照优先级进行排序后,按照排列顺序进行数据的爬取,从而实现根据数据爬取请求的优先级完成数据爬取,节省了优先级高的请求的等待时长,提高数据爬取的效率。
  • 请求处理方法、装置、计算机设备及存储介质-202210349356.0
  • 陈聪捷;卓晓光 - 腾讯科技(深圳)有限公司
  • 2022-04-01 - 2023-10-24 - G06F16/951
  • 本申请公开了一种请求处理方法、装置、计算机设备及存储介质,属于网络技术领域。该方法包括:响应于内容项关联的资源拉取请求,从磁盘中读取至少一条判别规则各自对应的规则描述序列;基于该至少一条判别规则各自对应的规则描述序列,对该资源拉取请求的至少一个字段值进行检测,得到请求检测结果;仅在该请求检测结果指示该资源拉取请求不是该目标拉取请求的情况下,返回该内容项关联的多媒体资源。本申请通过仅对检测出来不是目标拉取请求的资源拉取请求返回对应的多媒体资源,能够避免对任何资源拉取请求均返回对应的多媒体资源,从而有效抑制目标拉取请求,避免内容项的投放效果受到目标拉取请求的不良影响。
  • 数据索引方法、装置、电子设备及存储介质-202210372194.2
  • 彭志成;欧阳金华;冯世恺 - 腾讯科技(深圳)有限公司
  • 2022-04-08 - 2023-10-24 - G06F16/951
  • 本申请提供一种数据索引方法、装置、电子设备及存储介质,本发明实施例可应用于视频、语音等多媒体数据索引场景,该方法包括:根据各索引分片的倒排链长度,将倒排链长度不大于预设阈值的倒排链数据拼接为第一索引块,并将倒排链长度大于预设阈值的倒排链数据拼接为第二索引块;将第一索引块和第二索引块存储在存储块中;建立哈希表,哈希表包括多个关键值和各关键值对应的编码值,多个关键值分别对应不同的索引分片,编码值包括对应索引分片的索引方式;根据待索引分片的关键值和对应的索引方式在存储块中进行待索引分片的数据索引。本申请实施例的技术方案快速获取待索引分片的倒排链数据。
  • 一种爬虫自动化脚本的检测方法及装置-202011534783.3
  • 许建兵;李军;李强;陶飞;戴磊;王磊 - 安徽商信政通信息技术股份有限公司
  • 2020-12-22 - 2023-10-24 - G06F16/951
  • 本发明公开了一种爬虫自动化脚本的检测方法及装置,该方法包括:通过建立数据规则库构造通用化采集脚本,并对通用化采集脚本测试验证;收集目标分配的主网址,将主网址存入储存字段工具中;运用计算机程序设计语言读取所述储存字段工具中的数据,将数据嵌入到采集脚本,生成自动化脚本;测试生成的所述自动化脚本,查看自动化脚本的所需数据字段是否满足要求,将满足要求的所需数据字段进行整理和入库。通过自动化爬虫生成脚本能够大幅度降低主流爬虫的采集数据压力和资源耗费,减少了采集时间,提升了准确率;生成脚本过程中不需要生成多种数据采集脚本类型,可复用性强以及和后期修改方式统一;节省了人力、财力以及克服了时效性差的弊端。
  • 一种网络安全数据获取方法、装置、设备及存储介质-202211408340.9
  • 杨文武;筱晓娟 - 广东三鼎智慧信息科技有限公司
  • 2022-11-10 - 2023-10-24 - G06F16/951
  • 本发明涉及智能决策技术,揭露了一种网络安全数据获取方法,包括:获取网页端的网页信息,对网页信息进行代码解析,得到网页代码,查询网页代码对应的触发代码,配置网页代码对应的调用函数;查询网页端中的网络数据,对网络数据进行特征提取,得到数据特征,计算数据特征的特征评分,根据特征评分,对数据特征进行筛选,得到目标特征;计算目标特征和调用函数的支持度,根据支持度,对调用函数进行筛选,得到目标调用函数;识别网络数据的数据类型,根据数据类型,配置网络数据对应的加密函数;接收数据获取指令,利用目标调用函数和加密函数,从网络数据中获取数据获取指令对应的目标数据。本发明通过提高获取网络数据的安全性。
  • 页面监听方法、装置、电子设备及存储介质-202010332046.9
  • 陈存腾 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2020-04-24 - 2023-10-24 - G06F16/951
  • 本发明实施例公开了一种页面监听方法、装置、电子设备及存储介质,该方法可包括:在页面的加载时段内统计页面已加载的有效元素的数量,作为渲染得分,将首次统计到渲染得分大于得分阈值的时刻作为页面的首次内容绘制FCP时刻。其中,有效元素为位于页面的首屏,面积大于面积阈值且包括文本的元素;有效元素或为位于页面的首屏,面积大于面积阈值且包括图片的元素;有效元素或为位于页面的首屏,面积大于面积阈值且包括文本和图片的元素。通过统计页面已加载的有效元素的数量,作为渲染得分,并将首次统计到渲染得分大于得分阈值的时刻作为页面的FCP时刻,无须对不同页面配置不同的FCP时刻的采集代码,降低开发成本。
  • 一种新闻数据采集方法、装置、计算机设备及存储介质-201911366839.6
  • 谢滨泽;李如先;王合庆 - 深圳前海环融联易信息科技服务有限公司
  • 2019-12-26 - 2023-10-24 - G06F16/951
  • 本发明公开了一种新闻数据采集方法、装置、计算机设备及存储介质,涉及信息采集领域,该方法包括:从网站信息表中查找网站的网站信息;获取网站的总页面数和各页面的新闻数据的编号;传入当前条新闻数据所在的页面数和编号,通过requests打开网站链接,获取当前条新闻数据的原始页面信息;根据网站的编码方式对原始页面信息进行解码获取正常页面信息;根据网站的解析方式对正常页面信息进行解析,将解析后的新闻数据保存到数据库中;传入下一条新闻数据所在的页面数和编号,继续采集下一条新闻数据,并将采集到的下一条新闻数据保存至数据库中。本发明实现了在节省人力物力、降低维护成本的前提下,对不同网站进行新闻数据的采集。
  • 基于网络爬虫技术的对象关联方法、装置和计算机设备-202310828833.6
  • 冯福锋;姜克建;林璐;潘少斌 - 广东省电信规划设计院有限公司
  • 2023-07-06 - 2023-10-20 - G06F16/951
  • 本申请涉及一种基于网络爬虫技术的对象关联方法、装置、计算机设备、存储介质和计算机程序产品。方法包括:采用网络爬虫技术,基于预设区域内的各目标业务场景点对应的业务场景点名称,确定各目标业务场景点对应的场景边界区域;在预设区域中的待关联对象中,确定各场景边界区域对应的区域待关联对象;针对任一场景边界区域,根据任一场景边界区域对应的区域待关联对象的位置信息和方位角,以及任一场景边界区域的边界点,在任一场景边界区域对应的区域待关联对象中,确定任一场景边界区域对应的目标业务场景点的归属对象;将归属对象与任一场景边界区域建立关联关系。采用本方法能够有效提高预设区域中的5G网络建设规划效果。
  • 一种应用于web网页页面元素爬取方法及相关设备-202310877770.3
  • 伍健;杜习营;冯斌 - 深圳复临科技有限公司
  • 2023-07-17 - 2023-10-20 - G06F16/951
  • 本申请属于前端页面领域,涉及应用于web网页页面元素爬取方法、装置、计算机设备及存储介质,该方法包括:调用创建好的Python数据库,并根据Python数据库获取与目标页面地址相对应的页面格式文件;调用解析器,并基于解析器对页面格式文件进行解析操作,得到初始页面元素;根据预设的异常检测规则对初始页面元素进行检测操作,得到检测结果;若检测结果为初始页面元素存在异常页面元素,则根据预设的异常处理机制对异常页面元素进行异常处理操作,得到待存储页面元素;将待存储页面元素存储至MySQL数据库。本申请可以解决传统的页面元素获取方法存在无法适应于缺陷网站的问题。
  • 一种基于爬虫技术的招标信息推荐方法-202310901456.4
  • 陈鑫鑫;刘洪霞;孟林;韩怀瑶;李金洲;宋羽杰 - 中邮建技术有限公司
  • 2023-07-21 - 2023-10-20 - G06F16/951
  • 本发明涉及一种基于爬虫技术的招标信息推荐方法,包括如下步骤:1)访问目标网站,抓取目标网站上所有的招标数据信息;2)将数据进行处理分析,而后将其以可视化图表方式保存;3)根据用户的行为记录,从数据库中挑选与之匹配的数据予以推荐展示。本发明利用爬虫技术对投标网站的资料进行获取,其获取速度快,获取的内容十分全面,本发明可根据用户的浏览偏好将用户需要的招标信息进行整合推荐,同时从招标属性相似度切入分析用户潜在的喜好招标信息,可以帮助用户在查看招标信息时,节省很多时间和精力。
  • 一种非法诱导拦截处理方法、系统及存储介质-202211547277.7
  • 高磊;李有为 - 深圳安巽科技有限公司
  • 2022-12-05 - 2023-10-20 - G06F16/951
  • 本发明公开了一种非法诱导拦截处理方法、系统及存储介质,其中方法利用从众效应和易受骗人群易受他人影响的特点,使得对应的受保护居民在受到非法诱导时可以得到有效拦截保护;通过预先存储格式拦截消息的方式能够及时有效的生成紧急联系信息,配合一键转发及自动转发,极大程度的提高了拦截时效性;在紧急联系人未能及时一键转发的情况下不仅可以自动转发还将通知对应的拦截专员,以确保紧急联系人可以迅速提醒受保护居民,极大程度的提高了拦截有效性;与此同时,本发明还通过服务器端对于多个紧急联系人之间的格式拦截消息进行语气识别,以防止受保护居民受到刺激过多或过强,引起心理极不耐烦或逆反的心理现象,进一步提高了拦截有效性。
  • 一种基于中间人的互联网数据采集方法及系统-201910909270.7
  • 程学旗;史存会;胡耀康;朱运昌;俞晓明;刘悦 - 中国科学院计算技术研究所
  • 2019-09-25 - 2023-10-20 - G06F16/951
  • 本发明提出一种基于中间人的互联网数据采集方法及系统,包括:通过安装中间人代理证书至网页信息采集设备,建立网页信息采集设备的中间人,网页信息采集设备访问互联网中网页信息时,中间人代理网页信息采集设备的全部网络流量;中间人获取包含待采集网页URL正则表达式的采集任务,捕获全部网络流量中符合URL正则表达式的流量,作为中间流量,并将采集任务注入中间流量的HTML页面中,得到待解析页面并将其存入第一数据库;解析模块根据第一数据库中待解析页面的URL信息,将待解析页面分发给解析器实例进行解析,从中获取包含结构化数据的网页采集结果并将其存入第二数据库。本发明能够支持所有依靠集成浏览器内核功能来提供信息的应用的数据采集。
  • 一种数据引用记录方法-201910214736.1
  • 王俊丰;闫记香;周姚;吴延占;杜莹萍 - 上海古鳌电子科技股份有限公司
  • 2019-03-20 - 2023-10-20 - G06F16/951
  • 本发明公开了一种数据引用记录方法,包括以下步骤:步骤S1、提供一第一服务器,第一服务器包括一公开的金融页面,金融页面具有复数个数据分组,每个数据分组后嵌入一记录脚本;步骤S2、当数据分组中的金融数据被引用后,记录脚本获取引用金融数据的第二服务器的信息;步骤S3、记录脚本将信息存储于第一服务器中。本发明通过在第一服务器中金融页面的复数个数据分组后均嵌入一记录脚本,在任一数据分组中的金融数据被引用后启动记录脚本,获知引用数据的第二服务器的信息,并将信息存储于第一服务器中,有效地对非法获取数据的服务器对定位。
  • 基于区块链的高考分数查询方法、装置和计算机设备-201910002948.3
  • 李毅 - 平安科技(深圳)有限公司
  • 2019-01-02 - 2023-10-20 - G06F16/951
  • 本申请揭示了一种基于区块链的高考分数查询方法、装置、计算机设备和存储介质,其中方法包括:高考分数查询联盟链的各管理节点分别接收到第一高校申请加入所述高考分数查询联盟链的加入请求,各所述管理节点分别判断所述加入请求的真实性;若所述加入请求的真实性通过全部所述管理节点的验证,则允许所述第一高校接入所述高考分数查询联盟链,并分发给所述第一高校对应的第一私钥;获取所述第一高校输入的分数查询指令和第二私钥;判断所述第二私钥是否解密成功;若所述第二私钥解密成功,则根据所述分数查询指令到各高考分数的所述管理服务器查找对应的分数信息。本申请可以防止没有在国家教育部门注册的高校查询到考生的高考成绩。
  • 用户数据处理方法、装置、终端及存储介质-201911269581.8
  • 王芳 - 北京小米移动软件有限公司
  • 2019-12-11 - 2023-10-20 - G06F16/951
  • 本公开提供了一种用户数据处理方法、装置、终端及存储介质,属于计算机技术领域。该方法包括:获取预设数据库中存储的应用标识信息,所述预设数据库用于存储禁止根据历史用户数据向用户推荐信息的应用对应的应用标识信息,根据所述应用标识信息,确定对应的所述应用的数据存储空间,从所述数据存储空间中删除所述应用已生成的历史用户数据,则终端将无法根据该历史用户数据向用户推荐信息,从而防止推荐的信息类型单一,避免引起用户的厌烦。
  • 一种基于主题模型的舆情新闻事件跟踪方法-202010141439.1
  • 马子娟;岳昆;段亮;吴鑫然;李维华;赵天资 - 云南大学
  • 2020-03-04 - 2023-10-20 - G06F16/951
  • 本发明公开了一种基于主题模型的舆情新闻事件跟踪方法。针对舆情新闻的稀疏性、时序性、易演化性等特点,给出了一种舆情主题模型MBTM(Minority Biterm Topic Model)的构建方法,然后利用MBTM对舆情新闻数据进行建模、推断隐含主题,进一步设置时间节点,在每个时间节点上对主题‑词分布进行采样,获取对应主题中的词项,再利用JS散度和主题强度两个指标挖掘主题演化轨迹,完成对特定舆情新闻事件的在线跟踪。本发明在构建MBTM的过程中,使用了一种基于随机更新思想的近似推断方法来更新参数,从而能够精确、高效的实现舆情新闻事件追踪,也为特定领域新闻事件跟踪技术提供参考。
  • 一种基于微博用户的社交网络分析方法及装置-201811530577.8
  • 吴壮伟 - 平安科技(深圳)有限公司
  • 2018-12-14 - 2023-10-17 - G06F16/951
  • 本发明适用于数据挖掘技术领域,提供了一种基于微博用户的社交网络分析方法及装置,所述方法包括:确定进行社交网络分析的地域和第一微博用户,通过网络爬虫技术抓取所述第一微博用户的数据,根据所述数据,构建所述第一微博用户在所述地域的静态影响力和动态影响力,根据所述静态影响力和所述动态影响力,计算所述第一微博用户在所述地域的社交网络影响力,实现了结合地域因素的微博用户社交网络影响力的计算分析,得到更加精确的微博用户的社交网络影响力,从而为基于微博的拓展应用提供更加准确的理论基础。
  • 一种及时预警的舆情综合监管系统-202310846759.0
  • 何婷 - 广州城建职业学院
  • 2023-07-11 - 2023-10-13 - G06F16/951
  • 本发明公开了一种及时预警的舆情综合监管系统,具体涉及舆情管控技术领域,包括平台数据采集模块、构建数据库模块、舆情事件判断模块、舆情影响值计算分析模块、数据处理模块、风险预警模块,本发明通过采集m个时间段的舆情数据和用户操作数据,将舆情数据和用户操作进行预处理获取与此事件相关的情感词加入到数据库中,经过比对,判断事件的正负性,再根据舆情数据中的数据计算得出舆情影响值,用户操作数据中的数据进行计算得出活跃度,最后将舆情影响值和活跃度进行整理计算得出舆情热度值,根据舆情热度值和预设的舆情热度值进行对比输出不同指令,并予以解决。
  • 一种用于收集工业链数据的互联网系统-202111031655.1
  • 张瑞磊 - 海粟智链(青岛)科技有限公司
  • 2021-09-03 - 2023-10-13 - G06F16/951
  • 本发明公开了一种用于收集工业链数据的互联网系统,该互联网系统旨在解决现有技术下不能从网页上收集需要的数据,且不能对数据收集到的数据进行归纳,无法形成工业链大数据库,不能为工业互联网和工业智能化提供有价值的数据支持的技术问题。该互联网系统包括数据收集系统和数据归纳分析系统,所述数据收集系统用于收集产品的工业链数据,所述新建任务模块根据用户的指令创建新的任务进程,从而去收集商品、服务及关联知识的详细信息。该互联网系统利用数据收集系统从网页上选择性的收集商品、服务及关联知识的详细信息,将收集到的详细信息归纳分析,从而形成工业链大数据库,为工业互联网、工业智能化提供有价值的数据支持。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top