专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果15个,建议您升级VIP下载更多相关专利
  • [发明专利]数据采集方法、装置及存储介质-CN201811240829.3有效
  • 曹六一;张丹 - 北大方正集团有限公司;北京北大方正电子有限公司
  • 2018-10-24 - 2022-05-10 - H04L67/1008
  • 本发明提供一种数据采集方法、装置及存储介质,通过调度节点将调度任务发送给总控节点,总控节点接收各数据采集节点发送的运行状态信息,并根据预设策略、预先获取的各所述数据采集节点的处理能力信息及各数据采集节点的运行状态信息,将调度任务分配给数据采集节点,以使数据采集节点执行调度任务。通过总控节点统一管理各数据采集节点,为每一数据采集节点均衡负载,提高数据采集的响应能力与机器资源使用率,且数据采集节点可分布在不同的机房中,充分利用多机房的带宽与多IP地址优势,且支持节点的动态扩容与收缩。
  • 数据采集方法装置存储介质
  • [发明专利]数据搜索方法、装置、介质及产品-CN202111053818.6在审
  • 杨飞;曹六一;张丹 - 北京北大方正电子有限公司
  • 2021-09-09 - 2021-12-07 - G06F16/9536
  • 本发明提供一种数据搜索方法、装置、介质及产品。该方法包括:数据搜索方法、装置、介质及产品。该方法包括:确定满足搜索要求的种子账户;确定所述种子账户的至少一个关联账户并计算各关联账户的关联总分;将所述关联账户按照关联总分由高到低进行排序,并按照所述排序顺序依次确定每个关联账户的子关联账户,以按照排序顺序优先获取到与所述种子账户最具关联性的目标账户。基于此,通过计算关联账户的得分,对关联账户进行排序,依照排序优先级获取与关联账户最具关联性的目标账户。从而使采集账户时具有先后顺序,与种子账户最具关联性的先采集,提高采集到有效账户的速度,减少了对无效数据的采集,减少计算资源的浪费。
  • 数据搜索方法装置介质产品
  • [发明专利]数据采集系统和方法-CN202010914439.0在审
  • 张学颖;曹六一;杨飞 - 北大方正集团有限公司;北京北大方正电子有限公司
  • 2020-09-03 - 2020-12-04 - G06F16/951
  • 本发明实施例提供一种数据采集系统和方法,该系统包括:爬虫管理模块,采集集群模块和数据落地模块;所述爬虫管理模块中部署有多个爬虫线程,不同爬虫线程对应的数据采集方式不同;所述爬虫管理模块用于:基于调度机制,控制相应爬虫线程通过所述采集集群模块在网页中采集数据,并基于滤重机制对采集到的数据进行处理,得到有效数据;所述数据落地模块用于获取所述有效数据,并将所述有效数据按照预先确定的落地路径写入相应的内存中。该数据采集系统通过统一管理爬虫线程以及数据滤重,大大减少了开发人员的工作量,提高了数据采集效率和精度。
  • 数据采集系统方法
  • [发明专利]新闻网页的正文抽取方法和系统-CN201610150748.9有效
  • 曹六一;张丹;杨建武 - 北大方正集团有限公司;北京大学;北京北大方正电子有限公司
  • 2016-03-16 - 2019-06-28 - G06F16/953
  • 本发明涉及一种新闻网页的正文抽取方法和系统,该方法包括:根据新闻网页中的各个标签,将新闻网页生成一节点树;对节点树进行遍历,并生成由所有文本和所有链接按照遍历顺序组成的第一列表及由所有链接按照遍历顺序组成的第二列表;将第二列表中的各个链接在第一列表中进行一一映射,并生成表征映射结果的第三列表;根据第三列表,确定新闻网页中的最长连续文本序列;将最长连续文本序列作为新闻网页的正文进行抽取。本发明在抽取过程中无需人工配置的模板,因此适用于海量新闻网页的采集。而且,由于本发明提供的正文抽取方法是一种基于文本分布的正文抽取方法,相对于现有技术中单纯基于网页结构的抽取方法,准确率是更高的。
  • 新闻网页正文抽取方法系统
  • [发明专利]一种模板配置方法及系统-CN201610162744.2在审
  • 曹六一;张丹;杨建武 - 北大方正集团有限公司;北京大学;北京北大方正电子有限公司
  • 2016-03-21 - 2017-09-29 - G06F17/30
  • 本发明提供了一种模板配置方法及系统,该方法包括获取网页的URL地址,根据所述URL地址加载对应的网页;当接收到用户对所述网页触发的选取操作时,提取所述选取操作对应的网页内容;查找所述网页内容对应的网页节点在所述网页对应的树状结构中的位置,根据查找到的位置生成所述网页内容对应的抽取表达式;将所述抽取表达式传递给预设模板树中当前配置节点的Xpath属性,实现网页的模板配置。本发明解决了现有技术中手工配置模板过程费时费力,而且需要进行重复修正的问题,实现了模板的自动配置,为数据抽取、采集提供了有力的技术支持。
  • 一种模板配置方法系统

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top