专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果108980个,建议您升级VIP下载更多相关专利
  • [发明专利]网页正文抽取方法及装置-CN201510845613.X有效
  • 胡又欢 - 北京搜狗科技发展有限公司
  • 2015-11-26 - 2020-11-24 - G06F16/9535
  • 本发明公开了一种网页正文抽取方法及装置,该方法包括生成包括正文节点信息和杂质节点信息的正文抽取模板,其中,不同域名的网页对应不同的正文抽取模板;获取与目标网页匹配的正文抽取模板;根据所述获取的正文抽取模板中的正文节点信息获取所述目标网页的正文节点,在所述获取的正文节点中剔除所述杂质节点信息对应的杂质节点。由于正文抽取模板中包括有正文节点信息和杂质节点信息,在抽取正文信息时可根据杂质节点信息剔除杂质节点,因此,可得到正确率较高的网页正文信息。
  • 网页正文抽取方法装置
  • [发明专利]一种基于多模态机器学习的新闻网页正文抽取系统及方法-CN202110753762.9在审
  • 王磊;李欣杰 - 中译语通科技股份有限公司
  • 2021-07-02 - 2021-10-29 - G06F16/951
  • 本发明属于新闻网页处理技术领域,公开了一种基于多模态机器学习的新闻网页正文抽取系统及方法,基于多模态机器学习的新闻网页正文抽取方法包括:进行不同类型特征的提取;多模态融合,进行特征的联合表示;进行网页正文分类模型训练本发明使用多模态机器学习技术,融合网页的视觉特征、内容特征、标签分布特征等,通过特征之间的互补,消除歧义和不确定性,进行新闻类正文抽取,得到更加准确的网页正文判断结果,除了提高文本抽取准确率外,还可以准确抽取图片、视频、pdf文档,并能够大幅降低人工编辑模板的成本,通过对国际主流的1000个新闻网站进行正文抽取测试,对比目前方法,正文抽取准确率提高5%‑10%。
  • 一种基于多模态机器学习新闻网页正文抽取系统方法
  • [发明专利]网页处理方法和终端-CN201310204185.3有效
  • 宋飞 - 腾讯科技(深圳)有限公司
  • 2013-05-28 - 2017-08-25 - G06F17/30
  • 本发明提供了一种网页处理方法,所述方法包括获取与加载的网页的URL地址匹配的抽取语句,所述匹配的抽取语句中包含所述加载的网页的标题内容块和正文内容块的路径描述;根据所述标题内容块和正文内容块的路径描述对所述加载的网页进行标题和正文内容的抽取;显示所述抽取的标题和正文内容。采用该方法,使得页面只显示标题和正文内容,节省了屏幕空间。此外,还提供了一种用于执行网页处理方法的终端。
  • 网页处理方法终端
  • [发明专利]网页正文抽取方法及系统-CN202211252935.X在审
  • 况鹏;顾惠波;岳晓兰 - 浙江甲骨文超级码科技股份有限公司
  • 2022-10-13 - 2023-03-14 - G06F16/951
  • 本申请涉及一种网页正文抽取方法及系统,其中,所述网页正文抽取方法通过遍历待抽取网页中的所有节点,滤除噪声节点,可以快速去除与文本无关的噪声内容,通过依据每一个非噪声节点中的文本内容计算得出多个特征指标,并将其用于训练正文节点验证模型,使得正文节点验证模型具有筛选出正文节点匹配分数最高的非噪声节点的功能,这样不需要人为制定网页正文抽取规则,从而可以轻松适应海量网页的大规模正文抽提取的应用场景。而且,正文节点验证模型可以解决通用性和范用性的问题,因此也可以适用于绝大多数的非规范化网页中。
  • 网页正文抽取方法系统
  • [发明专利]一种网页正文提取方法及装置-CN201510897907.7有效
  • 胡又欢;卞维杰 - 北京搜狗科技发展有限公司
  • 2015-12-08 - 2020-11-10 - G06F16/332
  • 本发明公开了一种网页正文提取方法及装置,其通过对至少两个目标网页的正文抽取信息进行比较,并将所述至少两个目标网页的正文抽取信息中比较结果为相同的节点信息确认为网页杂质,所述至少两个目标网页属于同一类型网页;对所述同一类型网页按照所述网页杂质进行杂质信息过滤得到所述网页的正文信息。由于可确定同一类型目标网页的正文抽取信息中的杂质信息,进而根据所述杂质信息,对该同一类型的目标网页的正文抽取信息进行过滤最终可得到更精确的正文信息。
  • 一种网页正文提取方法装置

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top