专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果9056705个,建议您升级VIP下载更多相关专利
  • [发明专利]一种网站相似度检测方法-CN201810705000.X有效
  • 余明阳;查志勇;詹伟;向湘杰 - 国网湖北省电力有限公司信息通信公司
  • 2018-07-01 - 2021-09-10 - G06F16/958
  • 本发明提供了一种网站相似度检测方法,通过服务提取待检测网站中各个页面的文本信息,并将各个页面的文本信息整合为第一文本;所述服务根据任务配置文件开启网络URL信息,获取各个网站所含文本信息,并将的文本信息整合为第二文本;所述服务计算第一文本与各个网站所对应的第二文本所含文本信息之间的相似度;若相似度超出预设阈值,则判定待检测网站与取到的文字信息相对应网站内容重复。本发明公开的网站相似度检测方法,在现有技术的基础上,增加了网站信息智能取信息的相似度匹配的步骤,提高了钓鱼网站的快速识别。
  • 一种网站相似检测方法
  • [发明专利]处理网页的方法和装置-CN201611089740.2有效
  • 赵一飞 - 北京国双科技有限公司
  • 2016-11-30 - 2021-02-26 - G06F16/951
  • 本发明公开了一种处理网页的方法和装置。其中,该方法包括:确定是否存在待验证的网页的标识信息;根据待验证的网页的标识信息取得到网页页面之后,校验取得到的网页页面;在取得到的网页页面校验通过的情况下,确定待验证的网页成功;将成功的待验证的网页的标识信息保存至过滤器服务本发明解决了现有技术中在防止爬虫系统重复网页时,内容校验不通过但网页无法被再次的技术问题。
  • 处理网页方法装置
  • [发明专利]网页内容的方法和装置-CN201610350395.7有效
  • 孔祥旭;张泽斌;周勇 - 考拉征信服务有限公司
  • 2016-05-24 - 2017-09-05 - G06F17/30
  • 本公开提供一种网页内容的方法和装置,包括调度任务;当查询到所述任务有代理设置时,获取代理IP队列;进行资源管理处理;由数据抓取引擎采用多线程并行处理的方式进行数据抓取;各个线程对各自所抓取的数据交由解析引擎进行数据解析本公开所述解决了一般网页和需要登录的网站的各个功能的工作,的任务由组件完成,且实现了快速准确,同时还能够分析出目标网站的层级关系,形成清晰的目标结构图,为的数据建立起清晰的关系,通过反监控管理实现了反技术
  • 网页内容方法装置
  • [发明专利]网站资源的方法、装置、系统和计算机设备-CN201910578458.8有效
  • 孙加亮 - 北京金山安全软件有限公司
  • 2019-06-28 - 2021-08-24 - G06F16/951
  • 本发明公开了一种网站资源的方法、装置、系统、计算机设备和存储介质。其中该方法包括:确定用户设计的流程图;其中,流程图中包括多个节点和节点间的连接关系,每个节点对应一个控件;基于流程图中的节点所对应的控件,生成针对目标网站的配置规则;将配置规则发送给服务端,其中,配置规则用于指示服务端向目标网站发送网络请求,并对目标网站返回的网站内容进行数据;接收服务端返回的结果信息并进行展示。该方法由服务端对该配置规则进行解析,并发起网络请求,能够有效的避免IP被封,并将结果信息进行展示,可以方便用户预览结果,提升用户体验。
  • 网站资源方法装置系统计算机设备
  • [发明专利]页面方法、装置、介质及电子设备-CN202210082792.6在审
  • 郭红山 - 深圳壹账通智能科技有限公司
  • 2022-01-24 - 2022-04-29 - G06F16/951
  • 本公开涉及人工智能和爬虫领域,揭示了一种页面方法、装置、介质及电子设备。该方法包括:进行初始化操作,得到当前深度优先遍历次数和当前广度优先遍历次数;迭代执行步骤和次数更新步骤,对多个页面中的资源进行步骤包括:从起始网站开始,按照当前深度优先遍历次数从深度方向起始网站在链接路径上的多层级网站的页面,并在每次属于其中一层级的目标网站的页面时,按照当前广度优先遍历次数分别链接了目标网站的页面所链接的同一层级的多个网站的页面;次数更新步骤包括:根据最近一次步骤中取到的页面中的资源,调整当前深度优先遍历次数和当前广度优先遍历次数此方法能够高效准确地所需信息。
  • 页面方法装置介质电子设备
  • [发明专利]一种金融证券舆情信息方法及装置-CN202011579762.3有效
  • 陶飞飞;章猛;叶小舟;朱晓瑞;刘生伟;庄展鹏;顾将赢 - 河海大学
  • 2020-12-28 - 2022-09-23 - G06F16/951
  • 本发明公开了一种金融证券舆情信息方法及装置,该方法包括以下步骤:下载金融社交网站的页面数据,利用爬虫页面中针对证券市场不同股票板块的权重股股票舆情;根据股票代码构造种子URL,将不同流通市值的股票对其所属板块影响不同这一特性与该只股票所对应的URL序列结合,得到面向金融证券的主题型结构化舆情信息,并提供一种金融证券舆情信息的爬虫装置。本发明适用于金融证券领域的主题型舆情任务,可以快速地从金融社交平台中抓取、采集多个与主题相关的页面。本发明的方法在时间和准确率两个方面表现较为优秀,能更加有效地完成金融证券舆情信息的任务,提高了金融证券舆情信息的利用率。
  • 一种金融证券舆情信息方法装置
  • [发明专利]基于静态网站的数据及事件分析方法及系统-CN202110121681.7在审
  • 蔡婷 - 平安普惠企业管理有限公司
  • 2021-01-28 - 2021-05-18 - G06F16/951
  • 本申请提供了一种基于静态网站的数据及事件分析方法及系统,设定的静态网站的类型,并选定所述类型的静态网站;根据所述静态网站,通过静态网页爬虫技术,静态数据;对数据进行预处理,按照标签进行整理,得到数据库;根据所述数据库进行特定事件检测,并对事件进行追踪,形成事件集。本申请可基于静态网站自动分析页面,通过若干点击和少量的输入即可完成对一个网页的解析,生成爬虫规则,极大地提升了用户获取数据的效率,通过数据处理,大大减少了数据的庞杂性,使数据可用性以及调取性大大增加
  • 基于静态网站数据事件分析方法系统

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top