专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果1992174个,建议您升级VIP下载更多相关专利
  • [发明专利]用于生成结构化信息的方法和装置-CN201710602034.1有效
  • 钟辉强;尹存祥;沈剑平;徐国强 - 百度在线网络技术(北京)有限公司
  • 2017-07-21 - 2021-03-09 - G06F16/951
  • 本申请实施例公开了用于生成结构化信息的方法和装置。方法的一具体实施方式包括:抓取预定领域的企业网站的所有页面内容;根据页面内容的特征,将页面内容分类至预先构建的企业信息的类别以及其它类别,得到分类页面;将分类页面分为内容页面和表单页面,并将内容页面和表单页面作为标签,标记分类页面;对标记后的分类页面进行以下至少一项抽取,得到抽取的信息正文块抽取、正文内容结构化抽取、图文块抽取、列表块抽取和预定位置内容结构化;根据抽取的信息,构建结构化信息。该实施方式保证了信息来源的多样性,使得生成的结构化信息所呈现的内容特征丰富且减少了冗余信息
  • 用于生成结构信息方法装置
  • [发明专利]利用综合语义语境的信息处理-CN200980133722.1无效
  • 斯蒂芬·巴克索;尼克·福西;布鲁斯·斯坎兰;哈施·汉德尔瓦尔 - 多斯维公司
  • 2009-06-30 - 2011-07-27 - G06F17/27
  • 用于生成用于多个信息的参照系的系统和方法,多个信息含有由用户通过与一个或者多个信息源交互所获得的文本数据,包括接收所选择的用于分析的信息,该信息包括文本数据并且识别文本数据的多个逻辑单元。识别在逻辑单元的每个中的多个独立正文部,并且计算与每个独立正文部关联的逻辑单元的数量以便在识别模式中使用。基于模式,计算重要性测度并且基于满足预先定义的重要性阈值的重要性测度选择模式。基于选择的模式生成多个信息语境定义并且分配所生成的信息语境定义作为与参照系关联的语义语境的语境界定。多个信息彼此相关并且通过语义语境的生成的语境定义来表示这种关系。
  • 利用综合语义语境信息处理
  • [发明专利]一种网页文章标题和正文的自动识别方法及装置-CN202310211865.1在审
  • 张凯 - 北京粉笔蓝天科技有限公司
  • 2023-03-07 - 2023-06-30 - G06F40/205
  • 本发明提出一种网页文章标题和正文的自动识别方法及装置,属于特征识别与数据处理技术领域。方法包括将网页中的所有元素解析成DOM树、逐个对DOM树中的所有元素进行广度优先遍历、将查找到的父元素添加到哈希记录表中,并将其对应的网页文章正文根元素的权重值加1、对网页内容进行反向广度优先遍历,查找文章的当前标题元素、结合网页文章正文根元素与文章标题元素,获得当前网页的完整文章内容等步骤。本发明提出了一种在不对网页内容进行预处理的情况下,可以方便提取网页文章信息的技术方案,可以精确获取到文章的标题和正文,对下一步的数据分析和训练提供了良好的半结构化数据。
  • 一种网页文章标题正文自动识别方法装置
  • [发明专利]基于静态资源分离的文章详情页加载方法及其相关设备-CN202211568714.3在审
  • 张龙 - 中国平安财产保险股份有限公司
  • 2022-12-08 - 2023-05-05 - G06F9/445
  • 本申请实施例属于金融科技技术领域,应用于金融APP中信息资讯发布领域中,涉及一种基于静态资源分离的文章详情页加载方法及其相关设备,包括获取文章文本内容;识别文本内容中的头部部分、正文部分和尾部部分;采用预设的原生加载方式将所述头部部分和尾部部分加载至目标页面,完成所述头部部分和尾部部分的页面渲染;根据预设判断条件选择预设的加载方式将所述正文部分加载至目标页面,完成整个文章详情页加载。本申请通过在初始化时对正文内需进行用户交互的部分、头部和尾部部分采用原生加载的方式,对正文内无需进行用户交互的部分采用H5加载的方式,进行不同类型加载,在一定程度上提升文章详情页的加载速度,保证用户体验
  • 基于静态资源分离文章详情加载方法及其相关设备
  • [发明专利]一种提取网页正文的方法-CN201510047773.X有效
  • 赵亮 - 湖南蚁坊软件有限公司
  • 2015-01-30 - 2018-07-24 - G06F17/30
  • 本发明涉及网页文字信息处理领域,特别是一种提取网页正文的方法,包括以下步骤:步骤S101:网页源代码获取,获取html的页面源代码;步骤S102:解析并遍历标签,通过html解析器解析页面源代码获得标签并遍历每个标签;步骤S103:标签内容长度判断,对每个标签的内容长度进行判断,遍历标签内容长度后,确定标签内容长度最长的标签;步骤S104:提取标签内容,取出标签最长的标签内容,取出的内容就是需要提取的正文内容。采用上述方法后,由于网页的正文是由多个标签包含的,通过遍历每个标签,将相同标签的内容长度相加,再跟其他单个标签的长度相比较,最长的标签便是需要提取的正文内容,本发明既能保证处理速度,提取的准确率也高。
  • 一种提取网页正文方法
  • [发明专利]一种图书自动排版方法及系统-CN201110084529.2有效
  • 王续文;胡建武;任朔 - 数字时代出版设计有限公司
  • 2011-04-02 - 2011-08-10 - G06F17/25
  • 包括预先创建一个Word文档作为排版模版;定义所述模版中的样式与书稿内容样式映射表;创建一个空白Word文档,同时打开所述排版模版,将所述排版模版中的所有样式复制到所述空白Word文档中;以段落为单位,按顺序将书稿正文复制至所述空白Word文档的正文中,直至所有正文文档内容被复制到所述空白Word文档的正文中;查找封面、扉页和版权页处的内容控制组件,并将当前书稿的真实信息设置给封面、扉页和版权页处的内容控制组件,得到排版结果文档;
  • 一种图书自动排版方法系统

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top