专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果920854个,建议您升级VIP下载更多相关专利
  • [发明专利]基于HBase和MapReduce的分布式数据方法-CN202211508097.8在审
  • 刘雅璇 - 天翼云科技有限公司
  • 2022-11-28 - 2023-03-07 - G06F16/951
  • 本发明涉及计算机应用技术领域,具体公开了基于HBase和MapReduce的分布式数据方法,所述方法包括:S100在HBase中创建一个表,该表包含三个列族,分别用于保存目标url、与解析的标志和从目标url的内容源码;S200收集目标网站中模块首页出度较大的url作为种子url,作为新行插入步骤S100所述表中;本发明一种基于HBase和MapReduce的分布式数据方法利用MapReduce组件从网络上分布式数据,将取到的数据存储在HBase数据库中,可缩小获取非结构化数据的时间成本,提高存储数据的可靠性。
  • 基于hbasemapreduce分布式数据方法
  • [发明专利]动态图表类页面数据方法、装置、终端及存储介质-CN201810349975.3有效
  • 阮晓雯;徐亮;肖京 - 平安科技(深圳)有限公司
  • 2018-04-18 - 2022-12-02 - G06F16/951
  • 一种动态图表类页面数据方法,包括:采用自动化测试工具启动浏览器,输入待数据的网站的链接;从待数据的网站中与用户输入的关键词相关的页面信息;对取到的页面进行渲染并解析;通过自动化测试工具对解析后的页面进行截图得到截图图片并保存截图图片;根据预先训练的图片识别模型对截图图片进行识别,得到截图图片中的内容;判断待数据的网站及对应关键词的页面是否已遍历完;当确定都已被遍历过,则结束流程;否则,继续执行上述过程。本发明还提供一种动态图表类页面数据装置、终端及存储介质。本发明能够自动动态加载的图表类数据且能识别出图片中的内容。
  • 动态图表页面数据方法装置终端存储介质
  • [发明专利]处理网页的方法和装置-CN201611089740.2有效
  • 赵一飞 - 北京国双科技有限公司
  • 2016-11-30 - 2021-02-26 - G06F16/951
  • 本发明公开了一种处理网页的方法和装置。其中,该方法包括:确定是否存在待验证的网页的标识信息;根据待验证的网页的标识信息取得到网页页面之后,校验取得到的网页页面;在取得到的网页页面校验通过的情况下,确定待验证的网页成功;将成功的待验证的网页的标识信息保存至过滤器服务本发明解决了现有技术中在防止爬虫系统重复网页时,内容校验不通过但网页无法被再次的技术问题。
  • 处理网页方法装置
  • [发明专利]网页内容的方法和装置-CN201610350395.7有效
  • 孔祥旭;张泽斌;周勇 - 考拉征信服务有限公司
  • 2016-05-24 - 2017-09-05 - G06F17/30
  • 本公开提供一种网页内容的方法和装置,包括调度任务;当查询到所述任务有代理设置时,获取代理IP队列;进行资源管理处理;由数据抓取引擎采用多线程并行处理的方式进行数据抓取;各个线程对各自所抓取的数据交由解析引擎进行数据解析本公开所述解决了一般网页和需要登录的网站的各个功能的工作,的任务由组件完成,且实现了快速准确,同时还能够分析出目标网站的层级关系,形成清晰的目标结构图,为的数据建立起清晰的关系,通过反监控管理实现了反技术
  • 网页内容方法装置
  • [发明专利]获取代理服务器地址的方法和装置-CN201510609711.3在审
  • 兰光明 - 北京国双科技有限公司
  • 2015-09-22 - 2017-03-29 - G06F17/30
  • 其中,该方法包括收集代理服务器地址,得到代理服务器地址集;分别利用代理服务器地址集中每一个代理服务器地址分多次来网页数据,记录结果;分别统计每一个代理服务器地址的结果中成功数据的次数,根据成功数据的次数计算每一个代理服务器地址的网页数据的成功率;依据网页数据的成功率从代理服务器地址集中选择用于网页数据的代理服务器地址。本申请解决了由于使用质量差的代理服务器地址造成数据效率低的技术问题。
  • 获取代理服务器地址方法装置
  • [发明专利]网站资源的方法、装置、系统和计算机设备-CN201910578458.8有效
  • 孙加亮 - 北京金山安全软件有限公司
  • 2019-06-28 - 2021-08-24 - G06F16/951
  • 本发明公开了一种网站资源的方法、装置、系统、计算机设备和存储介质。其中该方法包括:确定用户设计的流程图;其中,流程图中包括多个节点和节点间的连接关系,每个节点对应一个控件;基于流程图中的节点所对应的控件,生成针对目标网站的配置规则;将配置规则发送给服务端,其中,配置规则用于指示服务端向目标网站发送网络请求,并对目标网站返回的网站内容进行数据;接收服务端返回的结果信息并进行展示。该方法由服务端对该配置规则进行解析,并发起网络请求,能够有效的避免IP被封,并将结果信息进行展示,可以方便用户预览结果,提升用户体验。
  • 网站资源方法装置系统计算机设备
  • [发明专利]页面方法、装置、介质及电子设备-CN202210082792.6在审
  • 郭红山 - 深圳壹账通智能科技有限公司
  • 2022-01-24 - 2022-04-29 - G06F16/951
  • 本公开涉及人工智能和爬虫领域,揭示了一种页面方法、装置、介质及电子设备。该方法包括:进行初始化操作,得到当前深度优先遍历次数和当前广度优先遍历次数;迭代执行步骤和次数更新步骤,对多个页面中的资源进行步骤包括:从起始网站开始,按照当前深度优先遍历次数从深度方向起始网站在链接路径上的多层级网站的页面,并在每次属于其中一层级的目标网站的页面时,按照当前广度优先遍历次数分别链接了目标网站的页面所链接的同一层级的多个网站的页面;次数更新步骤包括:根据最近一次步骤中取到的页面中的资源,调整当前深度优先遍历次数和当前广度优先遍历次数此方法能够高效准确地所需信息。
  • 页面方法装置介质电子设备
  • [发明专利]一种金融证券舆情信息方法及装置-CN202011579762.3有效
  • 陶飞飞;章猛;叶小舟;朱晓瑞;刘生伟;庄展鹏;顾将赢 - 河海大学
  • 2020-12-28 - 2022-09-23 - G06F16/951
  • 本发明公开了一种金融证券舆情信息方法及装置,该方法包括以下步骤:下载金融社交网站的页面数据,利用爬虫页面中针对证券市场不同股票板块的权重股股票舆情;根据股票代码构造种子URL,将不同流通市值的股票对其所属板块影响不同这一特性与该只股票所对应的URL序列结合,得到面向金融证券的主题型结构化舆情信息,并提供一种金融证券舆情信息的爬虫装置。本发明适用于金融证券领域的主题型舆情任务,可以快速地从金融社交平台中抓取、采集多个与主题相关的页面。本发明的方法在时间和准确率两个方面表现较为优秀,能更加有效地完成金融证券舆情信息的任务,提高了金融证券舆情信息的利用率。
  • 一种金融证券舆情信息方法装置

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top